请大神给知道下postgresql 结巴分词中文分词的问题

风水堪舆学 | 网络营销 | 住宅风水 | 英文歌曲 | Adobe After Effects | 电脑配置 | 书籍改编电影 | 下载 | Legion | 网络推广 | 动画制作 | 赛事 | PLC | 小说创作 | 虚拟专用服务器 | 成语 | 家庭 | 单反相机 | 电视节目 | 投影机 | 面相 | 香港购物 | 配音 | 文具 | 二次元 | 影视 | 固态硬盘ssd | 虚拟机 | 跆拳道 | r（编程语言） | 秦时明月之天行九歌 | 使命召唤 | 网盘 | 地图 | 琅琊榜（电视剧） | 手机内存 | 角色扮演 | 华硕 | 百度输入法 | 盗墓笔记（小说） | 营销策划 | 化妆品 | Windows | ip地址 | 装修设计 | 齐内丁·齐达内 | 动画电影 | 中国中央电视台 | 罗兰 | 网站优化 | 斗鱼直播 | 冷知识 | 张帅 | 任天堂 | 摄影师 | 三菱商事 | 迅雷（软件） | 计算机病毒 | amd | 屏幕 | 微单相机 | 电学 | qq浏览器 | MacOS | 联赛 | snh48 | 芯片（集成电路） | 后宫·甄嬛传（书籍） | 植物辨识 | 运动 | 大一 | 美容 | 双色球 | 蓝牙音箱 | 楼盘 | 电脑电源 | 采暖 | 显卡驱动 | 体育赛事 | thinkpad | 离婚 | 武侠小说 | 索尼笔记本 | 中国足球协会超级联赛（csl） | youtube | 王力宏（人物） | 外星人 | 努比亚（手机品牌） | 海贼王 | 移动电源 | 完美世界（游戏） | 摩托车 | 编辑器 | 低音炮 | 收益 | 海关 | 徐波 | akb48 | 互联网创业 | 张璐 | 男性 | 性价比 | MacBook Air | 新疆维吾尔自治区 | 插座 | 外汇平台 | 华为Mate30 | 羽毛球技术 | 腾讯 QQ | 蓝屏 | 字幕 | 免费软件 | 电脑故障 | 女生 | 周星驰（人物） | 足球欧洲杯 | pdf | macbook | 直播 | 生活经历 | 骁龙处理器 | 主题曲 | 户外运动 | CPU | 娱乐圈 | 初恋 | 家居 | 流氓软件 | 名言 | 中国足球 | 近视眼 | acg | 一级方程式赛车（f1） | 小品 | 网站运营 | 英格兰足球超级联赛 | 一体机 | 人肉搜索 | 日本电影 | 系统软件 | 人生 | 流星花园 | 电钢琴 | 分辨率 | 迅雷 | 机械设计 | 古典音乐 | 液晶电视 | 睡眠 | 大片 | 资产 | Html/Css | ansys | 天蝎座 | 对联 | 大二 | 吉他学习 | 实习 | uc浏览器 | 计算机科学 | 新华社 | 脱毛 | 视力 | 乐视超级电视 | 大学生活 | 开关电源 | 平面设计 | 音乐版权 | iPhone 11 Pro | 面膜 | 鞠婧祎 | 胡歌（演员） | 郭富城 | 语言 | 赵丽颖（演员） | 意大利 | 电路设计 | 情侣 | NBA篮球 | 蔡徐坤 | 豆瓣电影 | 社交软件 | 微信开发 | 足球彩票 | 电工 | 手机摄像头 | 用户界面设计师 | 华语流行音乐 | 网卡 | 易烊千玺 | 笛子 | 日语学习 | 日语歌曲 | 歌手 | 张子枫 | 搏击项目 | 谭松韵 | 快捷键 | O2O | 移民 |

你的位置：网站首页 >> 频道首页 >>编程语言 >>请大神给知道下postgresql 结巴分词中文分词的问题

请大神给知道下postgresql 结巴分词中文分词的问题

来源：蜘蛛抓取(WebSpider) 时间：2018-03-02 01:04 标签： postgresql 安装

为什么postgresql-9.1服务启动不了启动的时候提示在启动后停止是什么问题球大神指教_百度知道
为什么postgresql-9.1服务启动不了启动的时候提示在启动后停止是什么问题球大神指教
每次卸载重装后可以启动
但是电脑只要重新开机就又不能启动了
我有更好的答案
\program files下的安装目录（假设是windows)看看log 文件夹里的日志6、进入cmd, netstat -na ，看看开了多少端口。5，是不是服务设置手动;试试看，上一次的安装没有卸载干净？4、手动启动服务试试看，看看系统日志有没有相应内容分;C&#39，包括5432端口，如果5432被占用，肯定不行、密码，必须用 postres 用户启动的。2、鉴于重启后就启动不了、会不会是安装的时候。netstat -navbo 会查看是哪个进程7、安装的时候，locale 是不是选择了默认一路Next, 卸载，用locale = &#39、到 c，很多病毒会强占许多端口1、看看服务里的 Postgres 服务的用户名，或者是安装了影子系统3
采纳率：53%
为您推荐：
其他类似问题
您可能关注的内容
postgresql的相关知识
换一换
回答问题，赢新手礼包
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。您所在位置： &
&nbsp&&nbsp&nbsp&&nbsp
德哥PostgreSQL_经验谈.pptx 73页
本文档一共被下载：
次 ,您可全文免费在线阅读后下载本文档。
下载提示
1.本站不保证该用户上传的文档完整性，不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值，立即自动返金币，充值渠道很便利
德哥PostgreSQL_经验谈
你可能关注的文档：
········
··········
PostgreSQL 经验谈Digoal.zhou温馨提醒 - Happy Father's Day主要内容浅析PostgreSQL数据库特点构建高效,稳定,安全,易扩展的PostgreSQL数据库系统PostgreSQL容灾PostgreSQL备份, 还原.PostgreSQL优化PostgreSQL迁移PostgreSQL压力测试PostgreSQL监控PostgreSQL CaveatPostgreSQL展望浅析 PostgreSQL 特点功能严格遵循ACID(事务操作原子性(支持savepoint),状态一致性,隔离(read committed, repeatable read, serializable),持久化(fsync xlog))在保证ACI的前提下, 降低持久化标准可以提升百倍性能. (异步提交, 异常DOWN库或DOWN机可能导致wal_buffer里面未flush到xlogfile的信息丢失(最多wal_writer_delay*3时间的wal信息),不会导致数据库不一致或不可恢复.)two phase commit(例如利用dblink做跨库事务)MVCC, 8个锁级别(DML读写不冲突)更新优化机制(HOT, 降低索引需要更新的概率, 索引字段没有被更新且被更新的记录所在的BLOCK有足够的空间存下更新后的记录时符合HOT)垃圾数据通过VACUUM机制回收(Object's VM file中的块不需要扫描, 触发full scan除外.vacuum 与DML不冲突)HOT UpdateHeap PageIndex PagePageHeadPageHeadFreeSpaceLinePoint1LinePoint2ItemPointTuple2HEAP_HOT_TUPLETuple1t_ctid, HEAP_HOT_UPDATEDHOT UpdateHeap PageIndex PagePageHeadPageHeadLP_FLAGS(2)LP_REDIRECTFreeSpaceLinePoint1LinePoint2ItemPointTuple2HEAP_HOT_TUPLETuple1Dead,vacuumedItemIdData Layout /* An item pointer (also called line pointer) on a buffer page */ /* In some cases an item pointer is &in use& but does not have any associated */ /* storage on the page.
By convention, lp_len == 0 in every item pointer */ /* that does not have storage, independently of its lp_flags state. */typedef struct ItemIdData{ unsigned lp_off:15,
/* offset to tuple (from start of page) */ lp_flags:2,
/* state of item pointer, see below */ lp_len:15;
/* byte length of tuple */} ItemIdD/* lp_flags has these possible states. An UNUSED line pointer is available *//* for immediate re-use, the other states are not. */#define LP_UNUSED 0
/* unused (should always have lp_len=0) */#define LP_NORMAL 1
/* used (should always have lp_len&0) */#define LP_REDIRECT 2
/* HOT redirect (should have lp_len=0) */#define LP_DEAD
/* dead, may or may not have storage */浅析 PostgreSQL 特点功能存储(表空间,临时表空间)字段存储选项(plain, main, external, extended)支持在线创建,删除索引(不和select,update,delete,insert冲突)索引维护(支持多个完全一致的索引,使得维护索引更加自由)索引类型(btree,hash,gi
正在加载中，请稍后...postgres 8.3提供了2个数据类型tsvector,tsquery来支持全文检索，所以只需要一个中文分词组件就可以提供中文全文检索。google..很快发现了NlpBamboo项目，使用起来很方便。
安装和配置NlpBamboo
1.安装编译工具cmake
apt-get install cmake
2.安装Bamboo依赖库crf++，下载crf++代码后　　
cd CRF++./configuremakemake install
编译CRF++需要g++支持，否则会出现checking if g++ supports namespaces (required) & no这样的信息，直接apt-get install g++就可以了
3.编译安装Bamboo
cd nlpbamboomkdir buildcd buildcmake .. -DCMAKE_BUILD_TYPE=releasemake allmake install
4.安装postgresql分词库扩展
从bamboo项目主页下载分词数据库文件index.tar.bz2，解压到/opt/bamboo/index
编辑中文索引停止词（干扰词），文本中有些字符串不希望被索引，比如常用标点符号，&的&，英文中的&a&等。
touch /usr/share/postgresql/8.4/tsearch_data/chinese_utf8.stop
上面建了一个空的中文索引停止词文件，也可以自行用文本编辑器编辑，一个停止词占一行
cd /opt/bamboo/exts/postgres/pg_tokenizemakemake installcd /opt/bamboo/exts/postgres/chinese_parsermakemake install
如果出现&pgxs.mk找不到&的错误，则安装 apt-get install postgresql-server-dev-8.4
将分词函数和分词模块导入到你的数据库:
psql mydbname -U usernamemydbname=#\i /usr/share/postgresql/8.4/contrib/pg_tokenize.sqlmydbname=#\i /usr/share/postgresql/8.4/contrib/chinese_parser.sql
select to_tsvector('chinesecfg', '欢迎光临我的博客chengwei.org');---------------------------------------------------------------'chengwei':6 'org':8 '光临':2 '博客':5 '我':3 '欢迎':1 '的':4(1 row)
到此为止，数据库已经支持中文全文检索了，但在项目中使用sql语句查询，还需要做些额外的工作。
使用postgresql的全文检索功能
Postgresql使用tsvector数据类型来保存索引后的内容，将一段文本转换成tsvector类型只需要使用to_tsvector函数就可以
select to_tsvector('english', 'Better late than never');------------------------------- 'better':1 'late':2 'never':4(1 row)
要查询一个单词是否出现在&Better late than never&句子中，　
select to_tsvector('english', 'Better late than never') @@ 'better' as in; in---- t(1 row)select to_tsvector('english', 'Better late than never') @@ 'right' as in; in---- f(1 row)
@@全文索引操作符返回一个true或者false值，@@后面实际上是一个 tsquery类型，可以使用 &, |等进行组合查询
select to_tsvector('english', 'Better late than never') @@ to_tsquery('right | better') as in; in---- t(1 row)
中文全文索引实践
对数据库archive表的title字段做全文索引，假设表结构是
create table archive(
id serial primary key,
title text);
新建一个表用来保存tsvector类型，当然也可以直接保存在archive表中。ON DELETE CASCADE用来规则当父表删除数据时，同时删除子表中外键关联数据。默认是NO ACITON，即禁止删除父表数据
create table fti_archive(
id integer primary key,
fti_title tsvector,
foreign key (id) references portal_archive(id) ON DELETE CASCADE);
archive表中已经有大量数据，根据现有数据生成title字段的全文索引
insert into fti_archive(id, fti_title)select id, to_tsvector('chinesecfg',title) from archive
很显然，当在archive表中新增数据记录或者更新tilte字段是，对应记录的索引也需要更新，这可以创建一个触发器来实现
create or replace function update_fti_title()returns trigger as $$begin
if TG_OP = 'INSERT' then
insert into fti_archive(id, fti_title) values(NEW.id, to_tsvector('chinesecfg',NEW.title));
update fti_archive set fti_title=to_tsvector('chinesecfg',NEW.title) where id=NEW.
returnend$$ LANGUAGEcreate trigger update_fti_trigger after insert or updateon archive for each row execute procedure update_fti_title()
在全文索引表的fti_title字段建立索引　　
create index fti_archive_fti_title_inx on fti_archiveusing gin(fti_title);
只需要一个连接查询就可以进行全文索引查询了：
select archive.* from archive inner join fti_archiveon archive.id=fti_archive.idwhere fti_title @@ plainto_tsquery('chinesecfg','今天天气不错')
阅读(...) 评论()4,221被浏览482,180分享邀请回答cs.umb.edu/~poneil/iso.pdfMySQL 不支持多个表从同一个序列中取 id, 而 Pg 可以.MySQL 不支持 OVER 子句, 而 Pg 支持. OVER 子句能简单的解决 "每组取 top 5" 的这类问题.几乎任何数据库的子查询 (subquery) 性能都比 MySQL 好.更多的坑:不少人踩完坑了, 以为换个数据库还得踩一次, 所以很抗拒, 事实上不是!!!Pg 不仅仅是 SQL 数据库它可以存储 array 和 json, 可以在 array 和 json 上建索引, 甚至还能用表达式索引. 为了实现文档数据库的功能, 设计了 jsonb 的存储结构. 有人会说为什么不用 Mongodb 的 BSON 呢? Pg 的开发团队曾经考虑过, 但是他们看到 BSON 把 ["a", "b", "c"] 存成 {0: "a", 1: "b", 2: "c"} 的时候就决定要重新做一个 jsonb 了... 现在 jsonb 的性能已经优于 BSON.现在往前端偏移的开发环境里, 用 Pg + PostgREST 直接生成后端 API 是非常快速高效的办法:postgREST 的性能非常强悍, 一个原因就是 Pg 可以直接组织返回 json 的结果.它支持服务器端脚本: TCL, Python, R, Perl, Ruby, MRuby ... 自带 map-reduce 了.它有地理信息处理扩展 (GIS 扩展不仅限于真实世界, 游戏里的地形什么的也可以), 可以用 Pg 搭寻路服务器和地图服务器:它自带全文搜索功能 (不用费劲再装一个 elasticsearch 咯): 不过一些语言相关的支持还不太完善, 有个 bamboo 插件用调教过的 mecab 做中文分词, 如果要求比较高, 还是自己分了词再存到 tsvector 比较好.它支持 trigram 索引.trigram 索引可以帮助改进全文搜索的结果: trigram 还可以实现高效的正则搜索 (原理参考
)MySQL 处理树状回复的设计会很复杂, 而且需要写很多代码, 而 Pg 可以高效处理树结构:它可以高效处理图结构, 轻松实现 "朋友的朋友的朋友" 这种功能:它可以把 70 种外部数据源 (包括 Mysql, Oracle, CSV, hadoop ...) 当成自己数据库中的表来查询:心动不如行动1.3K77 条评论分享收藏感谢收起45822 条评论分享收藏感谢收起

请大神给知道下postgresql 结巴分词中文分词的问题

我要回帖

更多关于 postgresql 安装的文章

随机推荐

请大神给知道下postgresql 结巴分词中文分词的问题

我要回帖

更多关于 postgresql 安装 的文章

随机推荐

更多关于 postgresql 安装的文章