当前位置: 首页 > ikanalyzer
  • ik词典结构:词典是以树状结构存储的;每个节点是一个字;每个节点还包含所有子节点的集合;最根节点是(char)0;每个节点中存贮子结点的方式有两种;每个节点用 nodeChar标示;当前节点存储的Segment数目storeSize 递增;当前DictSegment状态 ,默认 0 , 1表示从根节点到当前节点的路径表示一个词。本文分析了ik分词 装载词库,进行分词,然后存储的整个过程。

    阅读全文
  • 1. Lucene的分词基类是Analyzer,所以IK提供了Analyzer的一个实现类IKAnalyzer。首先,我们要实例化一个IKAnalyzer,它有一个构造方法接收一个参数isMaxWordLength,这个参数是标识IK是否采用最大词长分词,还是采用最细粒度切分两种分词算法。实际两种算法的实现,最大词长切分是对最细粒度切分的一种后续处理,是对最 ...

    阅读全文
    lucene, 搜索 712 人阅读 1条评论 , , ,