solr6.2如何整合ik中文solr5 ik 分词器 配置,往solr6.2添加ik的core。

& & & 用过Lucene.net的都知道,我们自己搭建索引服务器时和解决搜索匹配度的问题都用到过盘古分词。其中包含一个词典。 那么既然用到了这种国际化的框架,那么就避免不了中文分词。尤其是国内特殊行业比较多。比如油田系统从勘探、打井、投产等若干环节都涉及一些专业词汇。 再像电商,手机、手机配件、笔记本、笔记本配件之类。汽车,品牌、车系、车型等等,这一系列数据背后都涉及各自领域的专业名次,所以中文分词就最终的目的还是为了解决搜索结果的精确度和匹配度的问题。
IK搜索预览
& & &我的univeral Core里包含两条数据,第二条数据的title和author都是中文的。 然后我用关键字q=title:平凡来搜索,搜索出来第二条数据。 如果你在你的索引库里没搜索出来也不要奇怪,配置下IK中文分词就可以了。
中文语义分析
& & 在索引库Core左侧菜单Analysis中,你可以输入复杂的查询【关键字】,选择对应字段,点击【Analysis Values】会帮你分析出当前这个复杂的词组都会分解出那几个搜索关键字或关键词来。如果这里满足不了你的专业词汇,那就该从词典下手了。我这里输入了:平凡的世界。分析后得出两个词:平凡、世界。 也就是我在上一张图中用平凡搜索的结果。
中文分词的配置和使用
& & &1、下载对应IK版本。我本地部署的Solr5.5.1。 所以就下载最新版本。
& & &2、把ik目录下的文件复制到tomcat/webapps/solr/WEB-INF/lib目录下。 ik目录里有一个ext.dic、stopword.dic。 可以打开看一看里面内容。
& & &3、修改schema.xml。我本地是univeral/conf/managed-schema。 增加中文分词配置节点,内容如下
&fieldType name="text_ik" class="solr.TextField"&
&analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/&
&analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/&
&/fieldType&
& & & 4、修改对应field的类型。我修改了两个字段
&field name="title" type="text_ik" indexed="true" stored="true" required="true" multiValued="false" /&
&field name="author" type="text_ik" indexed="true" stored="true" required="true" multiValued="false" /&
& & &参考教程:
& & 如果之前你已经创建了索引,那么配置IK中文分词后先修改schema.xml中的field对应类型。 清空索引后重新创建索引。 OK。大功搞成。
阅读(...) 评论()Linux(CentOS 6.4)Solr4.8.1中文分词配置(IK分词)_服务器应用_Linux公社-Linux系统门户网站
你好,游客
Linux(CentOS 6.4)Solr4.8.1中文分词配置(IK分词)
来源:Linux社区&
1、环境准备
6.4、Tomcat6.0、Jdk1.7、Solr4.8.1、IK Analyzer 2012FF_hf1
2、配置步骤
(1)下载IK Analyzer分词包,解压缩
(2)将IKAnalyzer2012FF_u1.jar拷贝到solr服务的目录solr/WEB-INF/lib下
cp /usr/download/IK Analyzer 2012FF_hf1/IKAnalyzer2012FF_u1.jar
/usr/local/tomcat6/webapps/solr/WEB-INF/lib/
(3)将IKAnalyzer.cfg.xml、stopword.dic拷贝到的conf下面solr/example/solr/collection1/conf目录下(和schemal.xml同一目录)
(4)修改schema.xml,加入如下配置:
&fieldType
name="text_ik" class="solr.TextField"&
&analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/&
&/fieldType&
如上表示加入"text_ik"类型的分词器(即:IKAnalyzer)
最后配置field通过name使用text_ik分词
&field name="text_ik"& & & type="text_ik"&
indexed="true"& stored="true"& multiValued="false" /&
3、中文分词测试
4、OK搞定!
Solr3.6.1 在Tomcat6下的环境搭建
基于Tomcat的Solr3.5集群部署
在Linux上使用Nginx为Solr集群做负载均衡
Linux下安装使用Solr
12.04 LTS 上通过 Tomcat 部署 Solr 4
Solr实现Low Level查询解析(QParser)
基于Solr 3.5搭建搜索服务器
Solr 3.5开发应用教程 PDF高清版
Solr 4.0 部署实例教程
Solr 的详细介绍:Solr 的下载地址:
更多CentOS相关信息见 专题页面
本文永久更新链接地址:
相关资讯 & & &
& (05月31日)
& (05月22日)
& (02月25日)
& (05月28日)
& (03月04日)
& (02月24日)
   同意评论声明
   发表
尊重网上道德,遵守中华人民共和国的各项有关法律法规
承担一切因您的行为而直接或间接导致的民事或刑事法律责任
本站管理人员有权保留或删除其管辖留言中的任意内容
本站有权在网站内转载或引用您的评论
参与本评论即表明您已经阅读并接受上述条款温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!&&|&&
LOFTER精选
网易考拉推荐
用微信&&“扫一扫”
将文章分享到朋友圈。
用易信&&“扫一扫”
将文章分享到朋友圈。
下载地址:,可以选择一个mirror站点下载2.解压下载后的solr压缩包3.运行start.jar,该jar包在solr目录的example文件夹中,命令如下: java -jar start.jar4.启动后出现如下图信息,说明启动成功,即可访问&来访问solr。至此完成solr自带例子的访问。官方参考文档:二、在tomcat下配置与使用solr的方法1、配置好tomcat的运行环境。2、建立solr的运行目录(也可以直接放在tomcat的webapps目录下),如:G:\solr\,随后的solr应用就放在这个目录中。3、拷贝下载解压solr后的目录dist下的solr-4.2.1.war文件到G:\solr\&目录下,可以解压到solr目录,形成G:\solr\solr的目录形式(也可以不解压)。4、拷贝解压后的solr的example目录下的solr文件夹到G:\solr\目录,把原来的solr-4.2.1.war解压后的solr目录合并。 即最终结果是:G:\solr\solr目录下有solr-4.2.1.war里面的WEB-INF等目录和文件信息,还包括example/solr目录下面的bin、collection1等文件和文件夹,如下图:5、更改G:\solr\solr\collection1\conf\solrconfig.xml文件的内容,将“&dataDir&${solr.data.dir:}&/dataDir&”更改为:&dataDir&${solr.data.dir:G:\solr\solr\data}&/dataDir&&6、创建tomcat的Context文件用来部署solr。 创建$CATALINA_HOME/conf/Catalina/localhost/solr.xml文件,文件内容为:&?xml version="1.0" encoding="utf-8"?&&Context docBase="G:\solr\solr" debug="0" crossContext="true"&
&Environment name="solr/home" type="java.lang.String" value="G:\solr\solr" override="true"/&&/Context&7、启动tomcat访问即可看到solr的管理界面。至此,tomcat中配置solr成功。官方参考文档:三、配置中文分词参考网址:1、下载IK中文分词下载地址:2、解压下载后的中文分词,并将IKAnalyzer.cfg.xml、IKAnalyzer2012FF_u1.jar、stopword.dic三个文件拷贝到solr项目的WEB-INF/lib目录下。3、配置IK分词首先编辑solr的web工程下面的\collection1\conf文件夹中的schema.xml文件,在&types&&/types&标签项中中增加如下内容:&!-- 我添加的IK分词 --& &fieldType name="text_ik" class="solr.TextField"&
&analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/&
&analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/&
&/fieldType&既可以使用ik分词器进行中文的分词。具体可以参考上面的网址。四、索引数据库
阅读(3102)|
用微信&&“扫一扫”
将文章分享到朋友圈。
用易信&&“扫一扫”
将文章分享到朋友圈。
历史上的今天
在LOFTER的更多文章
loftPermalink:'',
id:'fks_',
blogTitle:'solr+tomcat配置+中文分词IK配置',
blogAbstract:'一、运行solr自带例子的方法1.下载solr最新版本,这里是solr-4.2.1.zip下载地址:
{if x.moveFrom=='wap'}
{elseif x.moveFrom=='iphone'}
{elseif x.moveFrom=='android'}
{elseif x.moveFrom=='mobile'}
${a.selfIntro|escape}{if great260}${suplement}{/if}
{list a as x}
推荐过这篇日志的人:
{list a as x}
{if !!b&&b.length>0}
他们还推荐了:
{list b as y}
转载记录:
{list d as x}
{list a as x}
{list a as x}
{list a as x}
{list a as x}
{if x_index>4}{break}{/if}
${fn2(x.publishTime,'yyyy-MM-dd HH:mm:ss')}
{list a as x}
{if !!(blogDetail.preBlogPermalink)}
{if !!(blogDetail.nextBlogPermalink)}
{list a as x}
{if defined('newslist')&&newslist.length>0}
{list newslist as x}
{if x_index>7}{break}{/if}
{list a as x}
{var first_option =}
{list x.voteDetailList as voteToOption}
{if voteToOption==1}
{if first_option==false},{/if}&&“${b[voteToOption_index]}”&&
{if (x.role!="-1") },“我是${c[x.role]}”&&{/if}
&&&&&&&&${fn1(x.voteTime)}
{if x.userName==''}{/if}
网易公司版权所有&&
{list x.l as y}
{if defined('wl')}
{list wl as x}{/list}如何在Solr中实现多core查询_百度知道<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
您的访问请求被拒绝 403 Forbidden - ITeye技术社区
您的访问请求被拒绝
亲爱的会员,您的IP地址所在网段被ITeye拒绝服务,这可能是以下两种情况导致:
一、您所在的网段内有网络爬虫大量抓取ITeye网页,为保证其他人流畅的访问ITeye,该网段被ITeye拒绝
二、您通过某个代理服务器访问ITeye网站,该代理服务器被网络爬虫利用,大量抓取ITeye网页
请您点击按钮解除封锁&

我要回帖

更多关于 solr ik分词器 的文章

 

随机推荐