作者:李平,阿尔德·克里斯蒂安König
ACM通信,2011年8月,第54卷第8期,第101-109页
10.1145/1978542.1978566
评论(2)
高效(近似)计算大型数据集中的集合相似度是信息检索和数据管理中的一项常见任务。完成此任务的一种常见方法是minwise哈希.
本文的全文是优质内容
评论
Joan Puigcerver i Perez
2011年7月26日03:58
当文章描述“相似度或Jaccard相似度,用R表示”时,第一个公式是否有错误?
除法的分子和分母是相同的数(S1和S2并集的基数),结果应为1。
的问候。
匿名
2011年7月26日11:23
谢谢,琼
你对第一个公式的理解是正确的;请参考式(1),其中雅卡尔德重叠的定义是正确的。
我们刚刚检查了一下,最后提交的第一个公式确实没有那个错误。这个错误一定是后来发生的,我们在审核校样时没有发现。
希望网上的版本会被更正。
问候,
萍和基督教
显示所有2评论
登录阅读全文
需要访问吗?
请选择下面的一个选项以访问高级内容和功能。
创建一个网上帐户
如果你已经是ACM会员,通信订阅者或数码图书馆订阅者,请设置网页帐户,以浏览本网站的优质内容。
参加ACM
成为ACM的会员,可以充分利用ACM卓越的计算信息资源、网络机会等优势。
订阅ACM杂志通讯
获得50多年的中华中医药学会内容的完整访问权限,并每月获得杂志印刷版。
购买这篇文章
非会员可以购买这篇文章或刊登这篇文章的杂志。