专业网站建设品牌,十四年专业建站经验,服务6000+客户--广州京杭网络
免费热线:400-683-0016      微信咨询  |  联系我们

solr配置IK分词器并设置粗细粒度

当前位置:网站建设 > 技术支持
资料来源:网络整理       时间:2023/2/14 1:11:29       共计:3655 浏览


solr配置IK分词器并设置粗细粒度


solr加入索引时使用分词器,搜索时也使用该分词器,导致搜索时返回数据不准确


如:

搜索清华大学

经ik分词显示结果为

清华/大学/清华大学


此时结果中含有大学的都会被返回

北京大学

清华大学

。。。


这不是我们想要返回结果


我们希望只有清华大学被显示出来


也就是说在搜索的词中不分词


在配置ik分词器时加入属性

isMaxWordLength = “true”

表示使用粗粒度搜索


完整配置如下


<fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100">    

    <analyzer type="index">    

        <tokenizer class="org.wltea.analyzer.lucene.IKAnalyzerSolrFactory" isMaxWordLength="false"/>    

        <filter class="solr.LowerCaseFilterFactory"/>    

    </analyzer>    

    <analyzer type="query">    

        <tokenizer class="org.wltea.analyzer.lucene.IKAnalyzerSolrFactory" isMaxWordLength="true"/>        

        <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>    

        <filter class="solr.LowerCaseFilterFactory"/>    

    </analyzer>    

 </fieldType>


如果配置后启动solr报错 找不到ik分词器使用这里提供的jar包替换先前的即可

ik分词器支持粗细粒度分词.jar


版权说明:
本网站凡注明“广州京杭 原创”的皆为本站原创文章,如需转载请注明出处!
本网转载皆注明出处,遵循行业规范,如发现作品内容版权或其它问题的,请与我们联系处理!
欢迎扫描右侧微信二维码与我们联系。
·上一条:自动强制释放内存的SQL脚本 | ·下一条:nginx 单域名多站点配置

Copyright © 广州京杭网络科技有限公司 2005-2025 版权所有    粤ICP备16019765号 

广州京杭网络科技有限公司 版权所有