请大神给知道下postgresql 结巴分词中文分词的问题

为什么postgresql-9.1服务启动不了 启动的 时候提示在启动后停止 是什么问题 球大神 指教_百度知道
为什么postgresql-9.1服务启动不了 启动的 时候提示在启动后停止 是什么问题 球大神 指教
每次卸载重装后可以启动
但是电脑只要重新开机就又不能启动了
我有更好的答案
\program files下的安装目录(假设是windows)看看log 文件夹里的日志6、进入cmd, netstat -na ,看看开了多少端口。5,是不是服务设置手动;试试看,上一次的安装没有卸载干净?4、手动启动服务试试看,看看系统日志有没有相应内容分;C&#39,包括5432端口,如果5432被占用,肯定不行、密码,必须用 postres 用户启动的。2、鉴于重启后就启动不了、会不会是安装的时候。netstat -navbo 会查看是哪个进程7、安装的时候,locale 是不是选择了默认一路Next, 卸载,用locale = &#39、到 c,很多病毒会强占许多端口1、看看服务里的 Postgres 服务的用户名,或者是安装了影子系统3
采纳率:53%
为您推荐:
其他类似问题
您可能关注的内容
postgresql的相关知识
换一换
回答问题,赢新手礼包
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
德哥PostgreSQL_经验谈.pptx 73页
本文档一共被下载:
次 ,您可全文免费在线阅读后下载本文档。
下载提示
1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
德哥PostgreSQL_经验谈
你可能关注的文档:
········
··········
PostgreSQL 经验谈Digoal.zhou温馨提醒 - Happy Father's Day主要内容浅析PostgreSQL数据库特点构建高效,稳定,安全,易扩展的PostgreSQL数据库系统PostgreSQL容灾PostgreSQL备份, 还原.PostgreSQL优化PostgreSQL迁移PostgreSQL压力测试PostgreSQL监控PostgreSQL CaveatPostgreSQL展望浅析 PostgreSQL 特点功能严格遵循ACID(事务操作原子性(支持savepoint),状态一致性,隔离(read committed, repeatable read, serializable),持久化(fsync xlog))在保证ACI的前提下, 降低持久化标准可以提升百倍性能. (异步提交, 异常DOWN库或DOWN机可能导致wal_buffer里面未flush到xlogfile的信息丢失(最多wal_writer_delay*3时间的wal信息),不会导致数据库不一致或不可恢复.)two phase commit(例如利用dblink做跨库事务)MVCC, 8个锁级别(DML读写不冲突)更新优化机制(HOT, 降低索引需要更新的概率, 索引字段没有被更新且被更新的记录所在的BLOCK有足够的空间存下更新后的记录时符合HOT)垃圾数据通过VACUUM机制回收(Object's VM file中的块不需要扫描, 触发full scan除外.vacuum 与DML不冲突)HOT UpdateHeap PageIndex PagePageHeadPageHeadFreeSpaceLinePoint1LinePoint2ItemPointTuple2HEAP_HOT_TUPLETuple1t_ctid, HEAP_HOT_UPDATEDHOT UpdateHeap PageIndex PagePageHeadPageHeadLP_FLAGS(2)LP_REDIRECTFreeSpaceLinePoint1LinePoint2ItemPointTuple2HEAP_HOT_TUPLETuple1Dead,vacuumedItemIdData Layout /* An item pointer (also called line pointer) on a buffer page */ /* In some cases an item pointer is &in use& but does not have any associated */ /* storage on the page.
By convention, lp_len == 0 in every item pointer */ /* that does not have storage, independently of its lp_flags state. */typedef struct ItemIdData{ unsigned lp_off:15,
/* offset to tuple (from start of page) */ lp_flags:2,
/* state of item pointer, see below */ lp_len:15;
/* byte length of tuple */} ItemIdD/* lp_flags has these possible states. An UNUSED line pointer is available *//* for immediate re-use, the other states are not. */#define LP_UNUSED 0
/* unused (should always have lp_len=0) */#define LP_NORMAL 1
/* used (should always have lp_len&0) */#define LP_REDIRECT 2
/* HOT redirect (should have lp_len=0) */#define LP_DEAD
/* dead, may or may not have storage */浅析 PostgreSQL 特点功能存储(表空间,临时表空间)字段存储选项(plain, main, external, extended)支持在线创建,删除索引(不和select,update,delete,insert冲突)索引维护(支持多个完全一致的索引,使得维护索引更加自由)索引类型(btree,hash,gi
正在加载中,请稍后...postgres 8.3提供了2个数据类型tsvector,tsquery来支持全文检索,所以只需要一个中文分词组件就可以提供中文全文检索。google..很快发现了NlpBamboo项目,使用起来很方便。
安装和配置NlpBamboo
1.安装编译工具cmake
apt-get install cmake
2.安装Bamboo依赖库crf++,下载crf++代码后  
cd CRF++./configuremakemake install
编译CRF++需要g++支持,否则会出现checking if g++ supports namespaces (required) & no这样的信息,直接apt-get install g++就可以了
3.编译安装Bamboo
cd nlpbamboomkdir buildcd buildcmake .. -DCMAKE_BUILD_TYPE=releasemake allmake install
4.安装postgresql分词库扩展
从bamboo项目主页下载分词数据库文件index.tar.bz2,解压到/opt/bamboo/index
编辑中文索引停止词(干扰词),文本中有些字符串不希望被索引,比如常用标点符号,&的&,英文中的&a&等。
touch /usr/share/postgresql/8.4/tsearch_data/chinese_utf8.stop
上面建了一个空的中文索引停止词文件,也可以自行用文本编辑器编辑,一个停止词占一行
cd /opt/bamboo/exts/postgres/pg_tokenizemakemake installcd /opt/bamboo/exts/postgres/chinese_parsermakemake install
如果出现&pgxs.mk找不到&的错误,则安装 apt-get install postgresql-server-dev-8.4
将分词函数和分词模块导入到你的数据库:
psql mydbname -U usernamemydbname=#\i /usr/share/postgresql/8.4/contrib/pg_tokenize.sqlmydbname=#\i /usr/share/postgresql/8.4/contrib/chinese_parser.sql
select to_tsvector('chinesecfg', '欢迎光临我的博客chengwei.org');---------------------------------------------------------------'chengwei':6 'org':8 '光临':2 '博客':5 '我':3 '欢迎':1 '的':4(1 row)
到此为止,数据库已经支持中文全文检索了,但在项目中使用sql语句查询,还需要做些额外的工作。
使用postgresql的全文检索功能
Postgresql使用tsvector数据类型来保存索引后的内容,将一段文本转换成tsvector类型只需要使用to_tsvector函数就可以
select to_tsvector('english', 'Better late than never');------------------------------- 'better':1 'late':2 'never':4(1 row)
要查询一个单词是否出现在&Better late than never&句子中, 
select to_tsvector('english', 'Better late than never') @@ 'better' as in; in---- t(1 row)select to_tsvector('english', 'Better late than never') @@ 'right' as in; in---- f(1 row)
@@全文索引操作符返回一个true或者false值,@@后面实际上是一个 tsquery类型,可以使用 &, |等进行组合查询
select to_tsvector('english', 'Better late than never') @@ to_tsquery('right | better') as in; in---- t(1 row)
中文全文索引实践
对数据库archive表的title字段做全文索引,假设表结构是
create table archive(
id serial primary key,
title text);
新建一个表用来保存tsvector类型,当然也可以直接保存在archive表中。ON DELETE CASCADE用来规则当父表删除数据时,同时删除子表中外键关联数据。默认是NO ACITON,即禁止删除父表数据
create table fti_archive(
id integer primary key,
fti_title tsvector,
foreign key (id) references portal_archive(id) ON DELETE CASCADE);
archive表中已经有大量数据,根据现有数据生成title字段的全文索引
insert into fti_archive(id, fti_title)select id, to_tsvector('chinesecfg',title) from archive
很显然,当在archive表中新增数据记录或者更新tilte字段是,对应记录的索引也需要更新,这可以创建一个触发器来实现
create or replace function update_fti_title()returns trigger as $$begin
if TG_OP = 'INSERT' then
insert into fti_archive(id, fti_title) values(NEW.id, to_tsvector('chinesecfg',NEW.title));
update fti_archive set fti_title=to_tsvector('chinesecfg',NEW.title) where id=NEW.
returnend$$ LANGUAGEcreate trigger update_fti_trigger after insert or updateon archive for each row execute procedure update_fti_title()
在全文索引表的fti_title字段建立索引  
create index fti_archive_fti_title_inx on fti_archiveusing gin(fti_title);
只需要一个连接查询就可以进行全文索引查询了:
select archive.* from archive inner join fti_archiveon archive.id=fti_archive.idwhere fti_title @@ plainto_tsquery('chinesecfg','今天天气不错')
阅读(...) 评论()4,221被浏览482,180分享邀请回答cs.umb.edu/~poneil/iso.pdfMySQL 不支持多个表从同一个序列中取 id, 而 Pg 可以.MySQL 不支持 OVER 子句, 而 Pg 支持. OVER 子句能简单的解决 "每组取 top 5" 的这类问题.几乎任何数据库的子查询 (subquery) 性能都比 MySQL 好.更多的坑:不少人踩完坑了, 以为换个数据库还得踩一次, 所以很抗拒, 事实上不是!!!Pg 不仅仅是 SQL 数据库它可以存储 array 和 json, 可以在 array 和 json 上建索引, 甚至还能用表达式索引. 为了实现文档数据库的功能, 设计了 jsonb 的存储结构. 有人会说为什么不用 Mongodb 的 BSON 呢? Pg 的开发团队曾经考虑过, 但是他们看到 BSON 把 ["a", "b", "c"] 存成 {0: "a", 1: "b", 2: "c"} 的时候就决定要重新做一个 jsonb 了... 现在 jsonb 的性能已经优于 BSON.现在往前端偏移的开发环境里, 用 Pg + PostgREST 直接生成后端 API 是非常快速高效的办法:postgREST 的性能非常强悍, 一个原因就是 Pg 可以直接组织返回 json 的结果.它支持服务器端脚本: TCL, Python, R, Perl, Ruby, MRuby ... 自带 map-reduce 了.它有地理信息处理扩展 (GIS 扩展不仅限于真实世界, 游戏里的地形什么的也可以), 可以用 Pg 搭寻路服务器和地图服务器:它自带全文搜索功能 (不用费劲再装一个 elasticsearch 咯): 不过一些语言相关的支持还不太完善, 有个 bamboo 插件用调教过的 mecab 做中文分词, 如果要求比较高, 还是自己分了词再存到 tsvector 比较好.它支持 trigram 索引.trigram 索引可以帮助改进全文搜索的结果: trigram 还可以实现高效的正则搜索 (原理参考
)MySQL 处理树状回复的设计会很复杂, 而且需要写很多代码, 而 Pg 可以高效处理树结构:它可以高效处理图结构, 轻松实现 "朋友的朋友的朋友" 这种功能:它可以把 70 种外部数据源 (包括 Mysql, Oracle, CSV, hadoop ...) 当成自己数据库中的表来查询:心动不如行动1.3K77 条评论分享收藏感谢收起45822 条评论分享收藏感谢收起

我要回帖

更多关于 postgresql 安装 的文章

 

随机推荐