刚试用了IK_CAnalyzer 1.4 版本,有一个不足是在搜索一些非汉语词汇的信息,例如搜索人名。比如一篇包含周杰伦三个字的文章中,如果搜索关键字周杰伦就可以搜索到此文,但如果仅仅是搜索杰伦两个字就无法搜索到结果。
而使用Lucene的标准分析器StandardAnalyzer,因为它是单词切割,所以能搜索到正确的结果。
是个问题,头疼。
IK_CAnalyzer的一个问题
2007年2月26日(Monday) 16点03分
作者: 刘冬 天气:
心情: 一般
IKAnalyzer基于lucene2.0版本API开发,实现了以词典分词为基础的 正反向全切分 以及 正反向最大匹配切分 两种算法,是Lucene Analyzer接口的实现。
刚试用了IK_CAnalyzer 1.4 版本,有一个不足是在搜索一些非汉语词汇的信息,例如搜索人名。比如一篇包含周杰伦三个字的文章中,如果搜索关键字周杰伦就可以搜索到此文,但如果仅仅是搜索杰伦两个字就无法搜索到结果。 而使用Lucene的标准分析器StandardAnalyzer,因为它是单词切割,所以能搜索到正确的结果。 是个问题,头疼。 |