如何通俗的理解【对称二元变量】和【非对称二元变量】
创始人
2024-03-20 15:37:14
0

文章目录

  • 通俗解释
  • 举个例子
  • 结语
  • 参考资料

通俗解释


一个二元变量是对称的还是非对称的,很大程度上是从常识出发来判断的

当数据集的一个特征是二元变量时,

  • 两种取值的可能性差别较小的,是对称二元变量。(说人话就是,我们在研究不同数据间的相似度时,取值是0还是1,没有什么影响)
  • 两种取值的可能性差别较大的,是非对称二元变量。(说人话就是,我们在研究不同数据间的相似度时,取值是0还是1,影响较大,比较关键)

举个例子

二元性别变量的取值有两种,一般情况下这两种取值的可能性差别不大。而对于是否是色盲这个变量来说,显然一般情况下,是色盲要比不是色盲的几率小很多。

那么在利用性别是否是色盲这两个特征,来判断两组数据的相似度时,显然是否是色盲更有意义一些,对我们所研究的问题更重要一些。


结语

推动科学发展的途径之一就是,在已有研究基础上进一步细分,从而提高效率。有些二元变量对不同数据间的相似度影响较大,有些影响较小。对这两类二元变量加以区分,让我们在简单匹配系数的基础上,得到了Jaccard相似系数,从而帮助我们提高了一些场景下相似度的计算效率。


参考资料

https://documentation.sas.com/doc/en/pgmsascdc/9.4_3.4/statug/statug_distance_overview02.htm

相关内容

热门资讯

中证A500ETF摩根(560... 8月22日,截止午间收盘,中证A500ETF摩根(560530)涨1.19%,报1.106元,成交额...
A500ETF易方达(1593... 8月22日,截止午间收盘,A500ETF易方达(159361)涨1.28%,报1.104元,成交额1...
何小鹏斥资约2.5亿港元增持小... 每经记者|孙磊    每经编辑|裴健如 8月21日晚间,小鹏汽车发布公告称,公司联...
中证500ETF基金(1593... 8月22日,截止午间收盘,中证500ETF基金(159337)涨0.94%,报1.509元,成交额2...
中证A500ETF华安(159... 8月22日,截止午间收盘,中证A500ETF华安(159359)涨1.15%,报1.139元,成交额...
科创AIETF(588790)... 8月22日,截止午间收盘,科创AIETF(588790)涨4.83%,报0.760元,成交额6.98...
创业板50ETF嘉实(1593... 8月22日,截止午间收盘,创业板50ETF嘉实(159373)涨2.61%,报1.296元,成交额1...
港股异动丨航空股大幅走低 中国... 港股航空股大幅下跌,其中,中国国航跌近7%表现最弱,中国东方航空跌近5%,中国南方航空跌超3%,美兰...
电网设备ETF(159326)... 8月22日,截止午间收盘,电网设备ETF(159326)跌0.25%,报1.198元,成交额409....
红利ETF国企(530880)... 8月22日,截止午间收盘,红利ETF国企(530880)跌0.67%,报1.034元,成交额29.0...