simhash simhash算法库

授权协议:MIT操作系统:Linux 开发语言:C/C++
专门针对中文文档的simhash算法库 简介 此项目用来对中文文档计算出对应的 simhash 值。 simhash 是谷歌用来进行文本去重的算法,现在广泛应用在文本处理中。 详见Simhash...