solr6.2如何整合ik中文solr5 ik 分词器配置，往solr6.2添加ik的core。

风水堪舆学 | 网络营销 | 住宅风水 | 英文歌曲 | Adobe After Effects | 电脑配置 | 书籍改编电影 | 下载 | Legion | 网络推广 | 动画制作 | 赛事 | PLC | 小说创作 | 虚拟专用服务器 | 成语 | 家庭 | 单反相机 | 电视节目 | 投影机 | 面相 | 香港购物 | 配音 | 文具 | 二次元 | 影视 | 固态硬盘ssd | 虚拟机 | 跆拳道 | r（编程语言） | 秦时明月之天行九歌 | 使命召唤 | 网盘 | 地图 | 琅琊榜（电视剧） | 手机内存 | 角色扮演 | 华硕 | 百度输入法 | 盗墓笔记（小说） | 营销策划 | 化妆品 | Windows | ip地址 | 装修设计 | 齐内丁·齐达内 | 动画电影 | 中国中央电视台 | 罗兰 | 网站优化 | 斗鱼直播 | 冷知识 | 张帅 | 任天堂 | 摄影师 | 三菱商事 | 迅雷（软件） | 计算机病毒 | amd | 屏幕 | 微单相机 | 电学 | qq浏览器 | MacOS | 联赛 | snh48 | 芯片（集成电路） | 后宫·甄嬛传（书籍） | 植物辨识 | 运动 | 大一 | 美容 | 双色球 | 蓝牙音箱 | 楼盘 | 电脑电源 | 采暖 | 显卡驱动 | 体育赛事 | thinkpad | 离婚 | 武侠小说 | 索尼笔记本 | 中国足球协会超级联赛（csl） | youtube | 王力宏（人物） | 外星人 | 努比亚（手机品牌） | 海贼王 | 移动电源 | 完美世界（游戏） | 摩托车 | 编辑器 | 低音炮 | 收益 | 海关 | 徐波 | akb48 | 互联网创业 | 张璐 | 男性 | 性价比 | MacBook Air | 新疆维吾尔自治区 | 插座 | 外汇平台 | 华为Mate30 | 羽毛球技术 | 腾讯 QQ | 蓝屏 | 字幕 | 免费软件 | 电脑故障 | 女生 | 周星驰（人物） | 足球欧洲杯 | pdf | macbook | 直播 | 生活经历 | 骁龙处理器 | 主题曲 | 户外运动 | CPU | 娱乐圈 | 初恋 | 家居 | 流氓软件 | 名言 | 中国足球 | 近视眼 | acg | 一级方程式赛车（f1） | 小品 | 网站运营 | 英格兰足球超级联赛 | 一体机 | 人肉搜索 | 日本电影 | 系统软件 | 人生 | 流星花园 | 电钢琴 | 分辨率 | 迅雷 | 机械设计 | 古典音乐 | 液晶电视 | 睡眠 | 大片 | 资产 | Html/Css | ansys | 天蝎座 | 对联 | 大二 | 吉他学习 | 实习 | uc浏览器 | 计算机科学 | 新华社 | 脱毛 | 视力 | 乐视超级电视 | 大学生活 | 开关电源 | 平面设计 | 音乐版权 | iPhone 11 Pro | 面膜 | 鞠婧祎 | 胡歌（演员） | 郭富城 | 语言 | 赵丽颖（演员） | 意大利 | 电路设计 | 情侣 | NBA篮球 | 蔡徐坤 | 豆瓣电影 | 社交软件 | 微信开发 | 足球彩票 | 电工 | 手机摄像头 | 用户界面设计师 | 华语流行音乐 | 网卡 | 易烊千玺 | 笛子 | 日语学习 | 日语歌曲 | 歌手 | 张子枫 | 搏击项目 | 谭松韵 | 快捷键 | O2O | 移民 |

你的位置：网站首页 >> 频道首页 >>编程语言 >>solr6.2如何整合ik中文solr5 ik 分词器配置，往solr6.2添加ik的core。

solr6.2如何整合ik中文solr5 ik 分词器配置，往solr6.2添加ik的core。

来源：蜘蛛抓取(WebSpider) 时间：2016-09-05 08:45 标签： solr ik分词器

& & & 用过Lucene.net的都知道，我们自己搭建索引服务器时和解决搜索匹配度的问题都用到过盘古分词。其中包含一个词典。那么既然用到了这种国际化的框架，那么就避免不了中文分词。尤其是国内特殊行业比较多。比如油田系统从勘探、打井、投产等若干环节都涉及一些专业词汇。再像电商，手机、手机配件、笔记本、笔记本配件之类。汽车，品牌、车系、车型等等，这一系列数据背后都涉及各自领域的专业名次，所以中文分词就最终的目的还是为了解决搜索结果的精确度和匹配度的问题。
IK搜索预览
& & &我的univeral Core里包含两条数据，第二条数据的title和author都是中文的。然后我用关键字q=title:平凡来搜索，搜索出来第二条数据。如果你在你的索引库里没搜索出来也不要奇怪，配置下IK中文分词就可以了。
中文语义分析
& & 在索引库Core左侧菜单Analysis中，你可以输入复杂的查询【关键字】，选择对应字段，点击【Analysis Values】会帮你分析出当前这个复杂的词组都会分解出那几个搜索关键字或关键词来。如果这里满足不了你的专业词汇，那就该从词典下手了。我这里输入了：平凡的世界。分析后得出两个词：平凡、世界。也就是我在上一张图中用平凡搜索的结果。
中文分词的配置和使用
& & &1、下载对应IK版本。我本地部署的Solr5.5.1。所以就下载最新版本。
& & &2、把ik目录下的文件复制到tomcat/webapps/solr/WEB-INF/lib目录下。 ik目录里有一个ext.dic、stopword.dic。可以打开看一看里面内容。
& & &3、修改schema.xml。我本地是univeral/conf/managed-schema。增加中文分词配置节点，内容如下
&fieldType name="text_ik" class="solr.TextField"&
&analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/&
&analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/&
&/fieldType&
& & & 4、修改对应field的类型。我修改了两个字段
&field name="title" type="text_ik" indexed="true" stored="true" required="true" multiValued="false" /&
&field name="author" type="text_ik" indexed="true" stored="true" required="true" multiValued="false" /&
& & &参考教程：
& & 如果之前你已经创建了索引，那么配置IK中文分词后先修改schema.xml中的field对应类型。清空索引后重新创建索引。 OK。大功搞成。
阅读(...) 评论()Linux(CentOS 6.4)Solr4.8.1中文分词配置（IK分词）_服务器应用_Linux公社-Linux系统门户网站
你好，游客
Linux(CentOS 6.4)Solr4.8.1中文分词配置（IK分词）
来源：Linux社区&
1、环境准备
6.4、Tomcat6.0、Jdk1.7、Solr4.8.1、IK Analyzer 2012FF_hf1
2、配置步骤
（1）下载IK Analyzer分词包，解压缩
（2）将IKAnalyzer2012FF_u1.jar拷贝到solr服务的目录solr/WEB-INF/lib下
cp /usr/download/IK Analyzer 2012FF_hf1/IKAnalyzer2012FF_u1.jar
/usr/local/tomcat6/webapps/solr/WEB-INF/lib/
（3）将IKAnalyzer.cfg.xml、stopword.dic拷贝到的conf下面solr/example/solr/collection1/conf目录下（和schemal.xml同一目录）
（4）修改schema.xml，加入如下配置：
&fieldType
name="text_ik" class="solr.TextField"&
&analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/&
&/fieldType&
如上表示加入"text_ik"类型的分词器（即：IKAnalyzer）
最后配置field通过name使用text_ik分词
&field name="text_ik"& & & type="text_ik"&
indexed="true"& stored="true"& multiValued="false" /&
3、中文分词测试
4、OK搞定！
Solr3.6.1 在Tomcat6下的环境搭建
基于Tomcat的Solr3.5集群部署
在Linux上使用Nginx为Solr集群做负载均衡
Linux下安装使用Solr
12.04 LTS 上通过 Tomcat 部署 Solr 4
Solr实现Low Level查询解析（QParser）
基于Solr 3.5搭建搜索服务器
Solr 3.5开发应用教程 PDF高清版
Solr 4.0 部署实例教程
Solr 的详细介绍：Solr 的下载地址：
更多CentOS相关信息见专题页面
本文永久更新链接地址：
相关资讯 & & &
& (05月31日)
& (05月22日)
& (02月25日)
& (05月28日)
& (03月04日)
& (02月24日)
　　　同意评论声明
　　　发表
尊重网上道德，遵守中华人民共和国的各项有关法律法规
承担一切因您的行为而直接或间接导致的民事或刑事法律责任
本站管理人员有权保留或删除其管辖留言中的任意内容
本站有权在网站内转载或引用您的评论
参与本评论即表明您已经阅读并接受上述条款温馨提示！由于新浪微博认证机制调整，您的新浪微博帐号绑定已过期，请重新绑定！&&|&&
LOFTER精选
网易考拉推荐
用微信&&“扫一扫”
将文章分享到朋友圈。
用易信&&“扫一扫”
将文章分享到朋友圈。
下载地址：，可以选择一个mirror站点下载2.解压下载后的solr压缩包3.运行start.jar，该jar包在solr目录的example文件夹中，命令如下： java -jar start.jar4.启动后出现如下图信息，说明启动成功，即可访问&来访问solr。至此完成solr自带例子的访问。官方参考文档：二、在tomcat下配置与使用solr的方法1、配置好tomcat的运行环境。2、建立solr的运行目录（也可以直接放在tomcat的webapps目录下），如：G:\solr\，随后的solr应用就放在这个目录中。3、拷贝下载解压solr后的目录dist下的solr-4.2.1.war文件到G:\solr\&目录下，可以解压到solr目录，形成G:\solr\solr的目录形式（也可以不解压）。4、拷贝解压后的solr的example目录下的solr文件夹到G:\solr\目录，把原来的solr-4.2.1.war解压后的solr目录合并。即最终结果是：G:\solr\solr目录下有solr-4.2.1.war里面的WEB-INF等目录和文件信息，还包括example/solr目录下面的bin、collection1等文件和文件夹，如下图：5、更改G:\solr\solr\collection1\conf\solrconfig.xml文件的内容，将“&dataDir&${solr.data.dir:}&/dataDir&”更改为：&dataDir&${solr.data.dir:G:\solr\solr\data}&/dataDir&&6、创建tomcat的Context文件用来部署solr。创建$CATALINA_HOME/conf/Catalina/localhost/solr.xml文件，文件内容为：&?xml version="1.0" encoding="utf-8"?&&Context docBase="G:\solr\solr" debug="0" crossContext="true"&
&Environment name="solr/home" type="java.lang.String" value="G:\solr\solr" override="true"/&&/Context&7、启动tomcat访问即可看到solr的管理界面。至此，tomcat中配置solr成功。官方参考文档：三、配置中文分词参考网址：1、下载IK中文分词下载地址：2、解压下载后的中文分词，并将IKAnalyzer.cfg.xml、IKAnalyzer2012FF_u1.jar、stopword.dic三个文件拷贝到solr项目的WEB-INF/lib目录下。3、配置IK分词首先编辑solr的web工程下面的\collection1\conf文件夹中的schema.xml文件，在&types&&/types&标签项中中增加如下内容：&!-- 我添加的IK分词 --& &fieldType name="text_ik" class="solr.TextField"&
&analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/&
&analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/&
&/fieldType&既可以使用ik分词器进行中文的分词。具体可以参考上面的网址。四、索引数据库
阅读(3102)|
用微信&&“扫一扫”
将文章分享到朋友圈。
用易信&&“扫一扫”
将文章分享到朋友圈。
历史上的今天
在LOFTER的更多文章
loftPermalink:'',
id:'fks_',
blogTitle:'solr+tomcat配置+中文分词IK配置',
blogAbstract:'一、运行solr自带例子的方法1.下载solr最新版本，这里是solr-4.2.1.zip下载地址：
{if x.moveFrom=='wap'}
{elseif x.moveFrom=='iphone'}
{elseif x.moveFrom=='android'}
{elseif x.moveFrom=='mobile'}
${a.selfIntro|escape}{if great260}${suplement}{/if}
{list a as x}
推荐过这篇日志的人：
{list a as x}
{if !!b&&b.length>0}
他们还推荐了：
{list b as y}
转载记录：
{list d as x}
{list a as x}
{list a as x}
{list a as x}
{list a as x}
{if x_index>4}{break}{/if}
${fn2(x.publishTime,'yyyy-MM-dd HH:mm:ss')}
{list a as x}
{if !!(blogDetail.preBlogPermalink)}
{if !!(blogDetail.nextBlogPermalink)}
{list a as x}
{if defined('newslist')&&newslist.length>0}
{list newslist as x}
{if x_index>7}{break}{/if}
{list a as x}
{var first_option =}
{list x.voteDetailList as voteToOption}
{if voteToOption==1}
{if first_option==false},{/if}&&“${b[voteToOption_index]}”&&
{if (x.role!="-1") },“我是${c[x.role]}”&&{/if}
&&&&&&&&${fn1(x.voteTime)}
{if x.userName==''}{/if}
网易公司版权所有&&
{list x.l as y}
{if defined('wl')}
{list wl as x}{/list}如何在Solr中实现多core查询_百度知道<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
您的访问请求被拒绝 403 Forbidden - ITeye技术社区
您的访问请求被拒绝
亲爱的会员，您的IP地址所在网段被ITeye拒绝服务，这可能是以下两种情况导致：
一、您所在的网段内有网络爬虫大量抓取ITeye网页，为保证其他人流畅的访问ITeye，该网段被ITeye拒绝
二、您通过某个代理服务器访问ITeye网站，该代理服务器被网络爬虫利用，大量抓取ITeye网页
请您点击按钮解除封锁&

solr6.2如何整合ik中文solr5 ik 分词器配置，往solr6.2添加ik的core。

我要回帖

更多关于 solr ik分词器的文章

随机推荐

solr6.2如何整合ik中文solr5 ik 分词器 配置，往solr6.2添加ik的core。

我要回帖

更多关于 solr ik分词器 的文章

随机推荐

solr6.2如何整合ik中文solr5 ik 分词器配置，往solr6.2添加ik的core。

更多关于 solr ik分词器的文章