如何通俗的理解【对称二元变量】和【非对称二元变量】

创始人

2024-03-20 15:37:14

文章目录

通俗解释
举个例子
结语
参考资料

通俗解释

一个二元变量是对称的还是非对称的，很大程度上是从常识出发来判断的。

当数据集的一个特征是二元变量时，

两种取值的可能性差别较小的，是对称二元变量。（说人话就是，我们在研究不同数据间的相似度时，取值是0还是1，没有什么影响）
两种取值的可能性差别较大的，是非对称二元变量。（说人话就是，我们在研究不同数据间的相似度时，取值是0还是1，影响较大，比较关键）

举个例子

二元性别变量的取值有男和女两种，一般情况下这两种取值的可能性差别不大。而对于是否是色盲这个变量来说，显然一般情况下，是色盲要比不是色盲的几率小很多。

那么在利用性别和是否是色盲这两个特征，来判断两组数据的相似度时，显然是否是色盲更有意义一些，对我们所研究的问题更重要一些。

结语

推动科学发展的途径之一就是，在已有研究基础上进一步细分，从而提高效率。有些二元变量对不同数据间的相似度影响较大，有些影响较小。对这两类二元变量加以区分，让我们在简单匹配系数的基础上，得到了Jaccard相似系数，从而帮助我们提高了一些场景下相似度的计算效率。

参考资料

https://documentation.sas.com/doc/en/pgmsascdc/9.4_3.4/statug/statug_distance_overview02.htm

上一篇：赚钱方法每天收入2000,身无分文如何在上海赚钱赚钱的方法每天赚6元钱怎么赚钱在家就能赚200金币

下一篇：万亿美元市值公司有哪些微软市值突破万亿万亿美元的公司有多少个万亿美元资产公司

相关内容

热门资讯

史无前例！美国出现人工智能失控... 7月25日，路透社援引知情人士消息刊发独家报道称，OpenAI一款AI Agent在入侵人工智能平台...

“六张网”如何赋能现代化产业体... 来源：人民网－人民日报最近，很多人在讨论“六张网”。“六张网”跟传统的基础设施建设有什么不同？为什么...

中国多地“伏羊节”集中开席千... 中新社合肥7月26日电 (江婉琪)“我们喝了羊汤，计划再去皇藏峪转转，把‘伏羊节’的活动都体验一下。...

广东将防风Ⅰ级应急响应调整为防... 今年第12号台风“红霞”于7月26日3时50分前后以强台风级（45米/秒，14级）在惠州市惠东县平海...

海外之声 | 金融风险“非银化... 导读2008年全球金融危机后，对银行资本与流动性的监管强化的显著提升了银行体系韧性，但金融风险并未因...