有关于torch multinomial采样
创始人
2024-03-28 05:32:19
0

解释

多项式采样,核心思想就是从一个概率分布中,采样n个样本的index,概率高的优先会被采样到。

以官方例子作为解释:

>>> weights = torch.tensor([0, 10, 3, 0], dtype=torch.float) # create a tensor of weights
>>> torch.multinomial(weights, 2)
tensor([1, 2])

如上述,对于一个概率分布[0, 10, 3, 0],从中采样两个样本。由于10最大,3其次,所以采样出来的结果是1,2。这个很好理解。

>>> torch.multinomial(weights, 4) # ERROR!
RuntimeError: invalid argument 2: invalid multinomial distribution (with replacement=False,
not enough non-negative category to sample) at ../aten/src/TH/generic/THTensorRandom.cpp:320
>>> torch.multinomial(weights, 4, replacement=True)
tensor([ 2,  1,  1,  1])

但是由于剩下两个样本的概率为0,因此不可能被采样到。即,对于[0, 10, 3, 0]这个概率分布,只有10和3两个样本能够被采样到。所以当采样数量设置为4的时候,就会报错。

这个时候需要设置参数replacement=True,也就是放回采样,可以重复采样到同一个样本。因此输出结果为[ 2, 1, 1, 1],可以看到第一个采样到的是3,随后采样到的一直都是10,因为10最大。


一些补充

  1. multinomial是一种非常常见的采样策略,在NLP生成任务中进行decoding的时候会经常用到。相似的采样方法还有greedy search、beam search。具体可以参见huggingface:text generation
  2. multinomial的输入不仅可以是一个一维的tensor,笔者尝试二维的输入也照样可以。采样的维度为1。比方说:
>>> softmax(i) ## [2,20]
tensor([[0.0478, 0.0138, 0.0332, 0.0305, 0.0653, 0.0146, 0.1430, 0.1126, 0.0552,0.0183, 0.0737, 0.0337, 0.0433, 0.0323, 0.0106, 0.0604, 0.0992, 0.0377,0.0722, 0.0027],[0.0183, 0.0085, 0.0519, 0.0160, 0.0411, 0.0356, 0.0217, 0.1620, 0.0172,0.0469, 0.0071, 0.0161, 0.3427, 0.0042, 0.0125, 0.0379, 0.0437, 0.0064,0.0298, 0.0804]])  
>>> torch.multinomial(softmax(i),1)  ## [2,1] 
tensor([[ 6],[19]])
>>> torch.multinomial(softmax(i),2)  ## [2,2]
tensor([[ 4,  7],[15,  0]])

参考:

torch multinomial官方文档

相关内容

热门资讯

2025年河北中考总分多少?2... 河北省教育厅发布关于做好2025年初中学业水平考试工作的通知↓↓↓河北省教育厅关于做好2025年初中...
花旗预计2026年阿里巴巴电商... 观点网讯:5月16日,花旗分析师在阿里巴巴公布3月份当季业绩后发布研究报告称,预计2026年阿里巴巴...
荒谬!网友相亲相到了“宋仲基”... 来源:新闻晨报 “相亲相到了宋仲基!”近日,有网友在社交网站上发帖称,有媒婆为其介绍相亲对象,不料发...
从“借船出海”到“造船远航”:... 转自:央视网央视网消息:今年以来,中国多家自主品牌车企纷纷加力布局海外市场,加大投入组建远洋运输船队...
外国记者走进乌兰哈达火山 看“... 转自:上观新闻“中国扩大免签政策之后,来旅行的外国游客是否有增加?”“每年淡季旺季的收入如何?”“在...
中美互降关税提振全球市场信心 “立即发货!”5月12日凌晨,美国玩具商福尔曼得知关税将调整的消息后,连夜催促中国供应商将因关税滞留...
兰州市城关区:实践硬举措涵养文... 城关区:实践硬举措涵养文明软实力  在城关区,文明实践活动蓬勃开展,一场场别出心裁的实践活动、一堂堂...
SOTA!上海AI独角兽发布新... 转自:上观新闻近日,来自上海的AI独角兽MiniMax稀宇极智发布新一代语音大模型Speech-02...
151只股中线走稳 站上半年线 证券时报·数据宝统计,截至今日上午收盘,上证综指3363.32点,收于半年线之上,涨跌幅-0.52%...
前4个月江苏对拉美进出口115... 2025年是中拉论坛正式运行10周年。跨越山海、万里为邻,证券时报记者了解到,当前,江苏企业正以开放...
中行贵州省分行原副行长徐鸿周离... 运营商财经网 赵鑫雨/文日前,官方网站发布了中国银行贵州省分行原副行长徐鸿周被开除党籍的相关消息。...
遏制克扣押金、随意涨租违约,房... 来源:央广网 央广网北京5月16日消息(记者安垚)据国家市场监督管理总局消息,近日,市场监管总局发布...
封顶!昆明这所三甲医院预计10... 5月14日,记者从云南省妇幼保健院获悉,位于官渡区、总投资超13亿元的云南省妇幼保健院新院主体结构正...
突然拉升20%涨停!批量封板,... 汽车产业链早间全线走强,其中豪恩汽电大幅拉升20%涨停。今日早盘,A股小幅震荡整理,科创50指数失守...
瑞银:阿里巴巴第四季度业绩整体... 观点网讯:5月16日,瑞银研究报告指出,阿里巴巴(BABA.US)2025财年第四季度业绩整体收入及...
从吉利博越L看自主紧凑型SUV... 来源:@经济观察报微博记者 周信5月13日,吉利第四代博越L在杭州富春江畔上市,限时售价9.29万元...
深圳龙华区福城街道冼屋老村片区... 观点网讯:5月16日,深圳市龙华区福城街道冼屋老村片区东侧地块城市更新项目(一期)、(二期)实施主体...
重磅!国务院国资委最新部署,深... 5月15日,国务院国资委全面深化改革领导小组召开2025年第一次全体会议。2025年是国企改革深化提...
母亲殴打女儿致死?当地通报:刑... 近日,网传浙江温州市瓯海区“一母亲因殴打女儿致其死亡”。5月15日,瓯海区郭溪街道办事处发布情况通报...
弘扬好家教 传承好家风!这个主... 转自:草原云5月14日,鄂尔多斯市准格尔旗精神文明建设办公室、准格尔旗新时代文明实践服务中心联合准格...