上一页

ⓘ 最小哈希




最小哈希
                                     

ⓘ 最小哈希

在计算机科学领域, 最小哈希 (或 最小哈希式独立排列 局部性敏感哈希 )方法是一种快速判断两个集合是否相似的技术。这种方法是由 Andrei Broder (1997),发明的,最初在AltaVista搜索引擎中用于在搜索结果中检测并消除重复Web页面。

它也适用于大规模集群的问题,例如通过跨文件,其中载有对话的相似性对聚类。