请教一下,如何找回予财缘的世纪佳缘登录首页密码?

【图片】〖求助〗我想做一个角磨机压板的模型,发现模型布尔后布线好乱【3dmax吧】_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0成为超级会员,使用一键签到本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:396,810贴子:
〖求助〗我想做一个角磨机压板的模型,发现模型布尔后布线好乱收藏
还有就是调不出角磨机压板的纹理,靠贴图的话有做不出反射的效果。
你选对了吗?
希望大神来帮忙解决下。
没大神来帮下忙吗?
布尔很容易出错的,用高级布尔,不过线条方面,还是会有点乱的。
一开始没必要弄那么圆,少点边好调一些,高度分段调成一该硬的地方压边或者平滑组最后一涡轮。。。
登录百度帐号推荐应用3541人阅读
经典信息检索模型(一)
一.布尔模型:
布尔模型是基于集合理论和布尔代数的一种简单的检索模型。由于集合的概念非常直观,所以布尔模型为信息检索系统的普通用户提供了一种易于掌握的框架,此外,查询被表示成有确切语义的布尔表达式。由于布尔模型内部简单,形式简洁,在过去的几年的几年引起了人们广泛关注,并且在早期的许多商业系统中得以采用。
布尔模型假定标引词(关键词)在文献中要么出现要么不出现,因此标引词的权值全部被设为二值数据,Wi,j&{0,1},查询词q由连接词not,and,or连接起来的多个标引词所组成。这样,查询q本质上是一个常规的布尔表达式,它可以表示为多个何去向量的析取,即析取范式DNF。比方说,查询[q = Ka&(Kb&&Kc)],可以写成析取范式的形式[qdnf =(1,1,1) &(1,1,0) &(1,0,0)],其中的每一个分量都是三元组(Ka,Kb,Kc)的二值加权向量,这些二值加权向量称之为qdnf 的合取分量。
这里需要解释一下,Ka,Kb,Kc的权值只可能为{1,0},其中1表示存在,而0表示不存在。上面提到的查询语句[q = Ka&(Kb&&Kc)]的含义为:查找所有含有Ka,并且含有Kb或含有Ka并且不含有Kc的文献。假设文献,对Ka,Kb,Kc的含有情况有向量(Ka,Kb,Kc)表示,那么(1,1,1)表示同时含有Ka,Kb,Kc 满足上述查询,同样(1,1,0)含有Ka,Kb,也满足上述查询,(1,0,0)含有Ka,并且不含有Kc,也满足上述查询,所以符合[qdnf
=(1,1,1) &(1,1,0) &(1,0,0)]范式的文献都将返回。
来看一下定义:对于布尔模型而言,标引词权值变量都是二值的,即Wi,j&{0,1},查询q是一个常规的布尔表达式,用qdnf& 表示q的析取范式,qcc 表示qdnf 的任意合取分量。文献dj和查询q的相似度可以定义为:&&
&&&&&& 解释一下相似度为1的情况:相似对为1需要同时满足两个条件,存在一个属于qdnf& &的qcc 并且,对如任何一个标引词Ki ,都有dj关于这个标引词的权重等于查询的合取分量qcc 对于这个标引词的权重,函数gi 返货对应标引词i的权重。拿上面的例子来说,qcc 为查询布尔表达式的一个合取分量,则可能为(1,1,0)那么如果存在这样一篇文献d,他含有Ka,Kb但是不含有Kc,则当i = Ka时 gi(d)= gi(qcc) = 1, &I = Kb时,gi(d)= gi(qcc) = 1,
I = Kc时gi(d)= gi(qcc) = 0,即,对于任意一个标引词Ka,Kb,Kc都有gi(dj)=gi(qcc ) ,则这篇文献满足检索条件。
&&相关文章推荐
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:20180次
排名:千里之外
原创:10篇
(1)(1)(3)(5)信息检索-布尔模型
核心提示:希望这个系列会对自己有用,同样对你也有用!加油……布尔检索(BooleanRetrieval),布尔对于我们来说对比较熟悉,就是不是0就是1。顾名思义,布尔检索肯定跟0,1分不开了。剩下的我还是按照ppt顺序,娓娓道来吧。1....
下面我们进入正式的学习,希望这个系列会对自己有用,同样对你也有用!加油……
布尔检索(BooleanRetrieval),布尔对于我们来说对比较熟悉,就是不是0就是1。顾名思义,布尔检索肯定跟0,1分不开了。剩下的我还是按照ppt顺序,娓娓道来吧。
1.信息检索:
Information Retrieval_r(IR) is finding material (usuallydocuments) of an unstructured nature (usually text) that satisfiesan information need from within large collections (usually storedon computers).
信息检索是从大规模非结构化数据(通常是文本)的集合(通常保存在计算机上)中找出满足用户信息需求的资料(通常是文档)的过程。
这是中英文的定义。之前在第一节也说过这个定义。现在我们就按照高中的学习方法对这个定义深究下。
关键词一--------非结构化数据。结构化数据是什么呢?即我们经常看的表格中分类好的数据。如下:
根据表中我们可以很容易的查到Salary & AND Manager就是smith这个人。但现实是复杂的,往往我们见到的都是非结构化数据。通常指的是自由文本。比如:关键词加上操作符号的查询。或者是更复杂的概念性查询:找出所有的有关药物滥用(drugabuse)的网页。我们应该怎么办?还有,经典的检索模型一般都针对自由文本进行处理。这里。还提到一个半结构化数据的概念。比如:和
……。半结构化查询:Title contains data AND Bullets contain search。等等……最后需要提出的是,现实生活中这三种数据都是存在的,而且可能大量存在。
针对布尔查询的检索,布尔查询是指利用 AND, OR 或者 NOT操作符将词项 连接起来的查询。
3 一个例子
问题:莎士比亚的哪部剧本包含Brutus及Caesar但是不包含Calpurnia? 布尔表达式为 Brutus ANDCaesar AND NOT Calpurnia。
笨方法: 从头到尾扫描所有剧本,对每部剧本判断它是否包含Brutus AND Caesar,同时又不包含Calpurnia这个方法为什么不好呢?速度超慢 (特别是大型文档集)、处理NOT Calpurnia并不容易(一旦包含即可停止判断)、不太容易支持其他操作 (e.g., find the word Romans nearcountrymen) 、不支持检索结果的排序 (即只返回较好的结果)。
关联矩阵:
这个矩阵很重要,也许是使自然语言处理迈入新的阶段吧。也许你现在看起来是那么顺其自然。我们继续说关联向量吧,关联矩阵的每一列都是0/1向量,每个0/1都对应一个词项。给定查询Brutus AND Caesar AND NOT Calpurnia,取出三个列向量,并对Calpurnia 的列向量求补,最后按位进行与操作。 AND AND =。这样最后的1对应的剧本就是我们所要找到的。相信你应该可以明白的。
4.IR的一些问题
基本假设:
文档集Collection: 由固定数目的文档组成目标:返回与用户需求相关的文档并辅助用户来完成某项任务相关性Relevance
主观的概念
反映对象的匹配程度
不同应用相关性不同
检索过程:
检索效果的评价:
正确率:返回结果文档中正确的比例。如返回80篇文档,其中20篇相关,正确率1/4
召回率:全部相关文档中被返回的比例。如返回80篇文档,其中20篇相关,但是总的应该相关的文档是100篇,召回率1/5
正确率和召回率反映检索效果的两个方面,缺一不可。
假定N = 1 百万篇文档(1M),每篇有1000个词(1K),假定每个词平均有6个字节(包括空格和标点符号), 那么所有文档将约占6GB空间。假定词汇表的大小(即词项个数) M = 500K,那么词项-文档矩阵将非常大,是 500K x1M=500G。但是但是该矩阵中最多有10亿(1G)个1,所以词项-文档矩阵高度稀疏(sparse)。有没有更好的办法呢?比如仅仅记录所有1的位置。这或许是个好的方法。
5.倒排索引(Inverted index)
对每个词项t,记录所有包含t的文档列表。每篇文档用一个唯一的docID来表示,通常是正整数,如1,2,3…通常采用变长表方式来存储docID列表,磁盘上,顺序存储方式比较好,便于快速读取;内存中,采用链表或者可变长数组方式,存储空间/易插入之间需要平衡。
左边的倒排记录表就是我们最后统计到的结果,也就是经过右图的一系列步骤就可以写出这个倒排表。
下面着重介绍索引构建过程。第一步是词条序列。我们从文档中读出&词条,docID&二元组。第二步是排序。按词项排序,然后每个词项按docID排序。这步是核心步骤。第三步是词典和倒排记录表。某个词项在单篇文档中的多次出现会被合并,拆分成词典和倒排记录表两部分,每个词项出现的文档数目(doc. frequency, DF)会被加入。具体过程见下图:
这样的存储开销是非常大的。如何快速构建索引?如何减少存储开销?这两个问题我们需要去思考。
6 布尔检索
之前,我们已经建立了索引,现在我们怎么利用这个来处理查询。首先,我们需要定位某个词项,然后返回倒排记录表,在根据交还是并来处理我们的倒排记录表。
and是交集,or是并集,not是减。比如:killed andbrutus。由于brutus在二个文档都出现了,而killed只在第一个文档出现,我们求交集就知道是第一个文档。当然我举的例子比较简单了。实际上,是很复杂的。
下面我们来看看这个优化:
1.合并过程。即求交集或者并集的时候,这个需要遍历所有的docID。每个倒排记录表都有一个定位指针,两个指针同时从前往后扫描,每次比较当前指针对应倒排记录,然后移动某个或两个指针。合并时间为两个表长之和的线性时间。假定表长分别为x 和y,那么上述合并算法的复杂度为 O(x+y),关键原因: 倒排记录表按照docID排序。
2.查询过程:如果有n个词项的and?我们通常按照表从小到大(即df从小到大)的顺序进行处理(每次从最小的开始合并),这个就是为什么保存df的原因。
更通用的优化策略:
e.g., (madding OR crowd) AND (ignoble ORstrife)。每个布尔表达式都能转换成上述形式(合取范式),获得每个词项的df。(保守)通过将词项的df相加,估计每个OR表达式对应的倒排记录表的大小,按照上述估计从小到大依次处理每个OR表达式。
布尔检索的优点:
构建简单,或许是构建IR系统的一种最简单方式
在30多年中是最主要的检索工具
当前许多搜索系统仍然使用布尔检索模型:电子邮件、文献编目、MacOS X Spotlight工具。布尔检索例子:WestLaw
这里有两个例子,想看的可以去看下ppt。
布尔检索的缺点
布尔查询构建复杂,不适合普通用户。构建不当,检索结果过多或者过少
没有充分利用词项的频率信息
通常出现的越多越好,需要利用词项在文档中的词项频率(term frequency,tf)信息
不能对检索结果进行排序至此,第二节的布尔检索的内容结束。欢迎指正……
摘自/wbgxx333/article/details/您还可以使用以下方式登录
当前位置:&>&&>& > 布尔逻辑检索模型的分析探讨
布尔逻辑检索 布尔逻辑检索模型的分析探讨
假期兼职及社会养老情况调查 才智是实践的女儿——达·芬奇 在大学里面,学习只是其中的一部分,进入大学那就意味着大家的一只脚踏 进了社会的舞台,实践是大学生活的第二课堂,是知识发展的源泉,也是大学生锻 炼成长的有效途径。 一个人的知识和能力只有在实践中…摘要:基于新课程改革标准,数学教学活动必须调动学生学习的积极性和主动性,改变过去以教师为主体的教学现状,构建高效课堂。高中数学教学也是如此。因此,教师应积极探究构建高中数学高效课堂的方式,并充分发挥其作用,以使学生更好地掌握知识。关键词:高中数学;高…《生命喜悦的祈祷》节选 各位SUPER家人,《生命喜悦的祈祷》是我最最喜欢的祈祷文选,作者是沈妙瑜。这是一本让我成为爱的源泉的书,这是一本让我与生命的本源链接的书,这是一本真正伴我回家的书。本书共有31篇祈祷文,我从中节选了目前对大家最有用的10篇祈…
现代情报2004年9月第9期September12004No.9布尔逻辑检索模型的分析探讨刘红泉 张亮峰(湖南工程学院,湘潭411104)1摘 要2 布尔逻辑检索模型(BooleanRetrievalModel简称BRM)是最早的一种检索模型,其理论已基本成熟。过去以及现在的许多检索系统,很多都是采用这种检索模型为工作原理。本文对布尔逻辑检索模型进行分析、对比,指出各自的优缺点和存在的问题。1关键词2 BRM;分析u1Abstract2 TheBooleanRetrievalModelisthemostearlyretrievalmodel,whichtheoryhasmaturatedelemen-tarily.Manypreviousandpresentretrievalsystemsalladoptthisretrievalmodelforworkingprincipium.ThearticleisanalyzingandcontrastingtheBooleanRetrievalModel,pointingitsadvantagesanddisadvantagesrespectively.1Keywords2 BooleanRetrievalManalysis1中图分类号2G354121文献标识码2A1文章编号(4-03*(3)q=t1Dt2,7(q)=t*1Gt2*(4)q=t1Ct2,7(q)=t*1Ht2很明显,布尔逻辑运算实际上就是集合之间的并、交、补运算,也就是说,布尔逻辑检索系统实际上是通过对若干个文献集合(文献集D或D的子集)的并、交、补运算回答用户提问的。如提问式为/AandB0,表示以词A检索出的文献集合与以词B检索出的文献集合进行集合交运算;如提问式为/AorB0,表示以词A检索出的文献集合与以词B检索出的文献集合进行并运算。这三种运算可以用文氏图直观表达如下:1 传统的布尔逻辑检索模型在传统的情报检索模型中,文档存贮的是由一组关键词或标引词表示的文献描述,用户查询则是由一组标引词构成的布尔操作式,检索策略依赖于一个倒排文档,指出哪些文献描述是与布尔查询准确匹配的文献。一般用tk表示标引词序列,dkn表示与tk有关的文献,则tk*={dk1,dk2,,,dkn}就可以用来表示与标引词tk有关的文献全体组成的集合。令7(q)表示关于查询q的检出文献,则(1)q=t,
7(q)=t*(2)q=ht,7(q)=t=D-t*理论探索布尔逻辑运算的文氏图表示标准的布尔逻辑模型为二元逻辑,即一系列对应于文献特征的二元变量。这些变量包括从文献中提取的文本检索词、短语、私人签名和手工加入的标引词。用户根据检索项在文档中的布尔逻辑关系递交查询,匹配函数由布尔逻辑的基本法则确定。所检索出的文档或者与查询相关,或者与查寻无关,查寻结果一般不进行相关性排序。用户的思维习惯相一致,所以成为布尔逻辑检索的一个突出优点。11112 这种模型把复杂的检索过程简单化,能够将较复杂的情报提问按其概念组面的逻辑关系描述出来,从而变成可以由计算机执行的逻辑运算,变成机器根据事先确定的程序进行自动匹配的过程,这种运算上的简单易行是布尔逻辑检索系统的突出特征。11113 用布尔逻辑检索进行操作的某些系统允许用户通过一个有结构的词来缩小或扩大检索。所谓有结构的词是指对任何一个给定的标引词都存贮了与之相关的更一般的(上位)或更精确的(下位)关键词的词,布尔逻辑检索很容易利用这些相关项来进行检索。111 布尔逻辑检索模型的优点11111 在布尔检索中,用户的查询要求用普通的语言叙述,即用户可完全按照自己的思维习惯提问。其中的查询要求(条件)A、B,可以分别用若干个标引词来表示,接着可以用布尔逻辑算符/D0、/C0、/h0将用户的提问/翻译0成系统可以接受的形式。这种结构化的提问方式与收稿日期:作者简介:刘红泉(1966)),男,现任湖南工程学院图书馆期刊部主任,武汉大学信息管理学院访问学者,研究方向:信息资源管理。张亮峰,男,现任湖南工程学院图书馆馆长,教授。2004年9月第9期September12004No.9现代情报由于拥有上述几个优点,1967年后,布尔逻辑检索模型正式被大型文献检索系统采用,并逐渐成为各种商业性联机检索系统的标准检索模式。Lq(d)=1-aLt(d);(4)q=(ht,a),Lt(d)。a通过对标引词进行加权,解决了传统布尔逻辑检索模型的一些缺点,比如无法排序、不能区分检索词的重要程度,但同时也带来了一个问题,即布尔逻辑操作算符在不加权布尔逻辑查询情形下的许多算律(如交换律、结合律等)已不再成立。传统布尔逻辑检索的一个最大特点是允许将一个布尔逻辑查询转换成一个形式上更简单的布尔逻辑查询,而不影响检索结果。例如,查询q1与查询q1D(q1Cq2)是逻辑上等价的,即q1D(q1Cq2)。因而这两个Lq(d)=1-1,112 布尔逻辑检索模型理论上的缺陷11211 布尔逻辑式的构造不易全面反映用户的需求对于文献描述与布尔查询中的标引词没有一种加权的方法,在文献描述或布尔查询中出现的词在检索时都呈现出相同的重要性,以至标引词的简单组配不能完全反映用户的实际需要。用户需要哪一方面内容的文本,需要到多大程度,这是检索式无法表达清楚的。如对前面所述的检索逻辑式,AandB,究竟用户希望能得到更多地反映A内容的文本还是反映B内容的文本,传统的布尔检索无法解决此问题。查询应该检索出相同的文献集。这一特点在Bookstein的模11212 匹配标准存在某些不合理的地方型中却不被保持,例如查询(T,a)C(T,a)和查询(T,a)在响应某个用/C0连接的检索时,对提问式/Aand的检索结果是不一样的。BandCand,andZ0,系统把只含有其中一个或数个但非全212 扩展布尔逻辑检索模型部检索词的文本看作与那些根本不含有其中任何一个检索这是由Salton于1983年提出的检索模型,该模型通过词的文本一样差,同样加以排除;另一方面,用响应某个对标引词加权值,将向量检索模型与布尔检索模型融为一用/D0连接的检索式时,如对提问式/AorBorCor,or体,克服了传统布尔逻辑模型的一些缺陷。扩展规模是传Z0,系统都不能把含有所有这些检索词的文本看作比那些统布尔逻辑检索模型完全匹配的严格性和向量模型提问的只含有其中一个检索词的文本更好一些,而是没有区别的无结构性的折中,在保持布尔逻辑检索的结构式提问的同同等输出。时,也吸取了模糊检索和向量检索模型的长处。而且该模11213 检索结果不能按照用户定义的重要性排序输出型中巧妙地引入了一个模型参数P,通过适当调节这个参系统检索输出的文本中,排在第一位的文本不一定是数,Salton模型可以分别表现为布尔逻辑模型、向量模型和文本集中最适合用户需要的文本,用户只能从头到尾浏览模糊模型。才能知道输出文本中哪些更适合自己的需要。设标引词集合为{t1,t2,,,tn}11214 很难控制输出量的大小文献集中某一文献的向量表示为D={d1,d2,,,检索输出完全依赖于布尔逻辑查询与文档中文档的匹dn}配情况,很难控制输出量的大小,检索结果可能是很多的其中,0[di[1,表示标引词ti在文献D的权值。文献,也可能是很少的文献,甚至检索失败。Salton在其模型中设计的由布尔逻辑操作算子/D0和11215 对用户的素质有很高的要求/C0确定的布尔逻辑查询分别为一般用户在使用某一检索系统之前,需经过一段时间QD(p)=(t1,A1)Dp(tp2,A2)D,Dp(tn,An)的培训。不但要掌握该系统的服务类型、检索模式,而且QC(p)=(t1,A1)Cp(t2,A2)Cp,Cp(tn,An)还要熟悉使用该系统的构造策略技巧,因而一般需要有检其中,p为模型参数,0[p[];0[ai[1表示查询词索专家辅助完成,或完全交由检索专家完成。ti的权值。2 加权布尔逻辑检索模型文献D和查询QD(p)以及QC(p)的相似性程度分别定义针对传统布尔逻辑检索模型的上述缺陷,提出了一些如下改进的加权布尔逻辑检索模型。sim(D,QAp1dp1+A2pdppp2+,+Andn211 Bookstein模型D(p))=p1+Ap2+,+ApnBookstein模型是这样描述的:设文献集合D:D={d1,d2,,,dm}sim(D,QAp(1-dp1)+Ap1-dpC(p))=1-12(2)p+,+Apn(1-dn)标引词集合T:T={tp+Ap,+Ap12+n1,t2,,,tn}这就是Salton扩展布尔逻辑检索模型。对任意的dID及tIT,设标引词t在文献d中的权值当p=1时,上述扩展检索模型就变成向量检索模型,为Lt(d)。对标引词t进行加权就构成一个最简单的查询q:即sim(D,QD)=sim(D,QC)。q=(t,a)这表明提问式中/AND0和/OR0逻辑算符已经毫无Bookstein定义了这种最简单查询关于文献d的检索状区别,即两者功能都减退为0,而相关度运算采取简单的态值:Lq(d)=min{aLt(d),1}。向量检索模型计算方法,即提问向量和文献向量的内积作对于由/D0、/C0、/h0等布尔逻辑运算符构成的为文献与向量的相似度。查询,Bookstein定义了如下的检索状态值:当p=],且查询标引词的权值限制在0或1时,扩展(1)q=(t1,a)D(t2,b),布尔逻辑检索模型就变成建立在模糊集合论基础上的布尔Lq(d)=max{aLt1(d),bLt2(d)};检索模型,此时(2)q=(t1,a)C(t2,b),sim(D,QC(]))=1-max{Ai(1-di)}/max{Ai}L尤其,当Ai=Aj(1[i<j[n)时,q(d)=miLt1(d)Lt2(d),;sim(D,QC(]))=1-max{1-di}=min{di}(3)q=h(t,a),同理可得,sim(D,QD(]))=max{Aidi}/max{Ai}u理论探索现代情报2004年9月第9期September12004No.9当Ai=Aj(1[i<j[n时,sim(D,QD(]))=max{di}),则当文献标引词的权值也限制在0或1时,就变成传统布尔逻辑检索模型。当p值在1与]之间时,扩展布尔逻辑检索模型就介于向量检索模型和布尔检索模型之间。P值越大,C和D的功能越强;p值越小,C和D的功能越弱。直至p=1,其功能完全消退。还可以通过p值的调节控制检索输出。对于p取1到]的值时,/AND0算子(C)可以解释为:短语中的所有词出现总比仅出现几个词有价值,并不一定苛求所有的提问项都出现;对/OR0(D)算子的解释则为多出现几个提问项总比少好。克服了传统布尔逻辑检索模型的不足,接近于现实的检索要求。(m/fk)加权,于是sim(D1,q)=[log2(5/2)+log2(5/3)+log2(5/4)]/[log2(5)+log2(5/2)+log2(5/2)+log2(5/3)+log2(5/4)]=01395,,。这里,有和p=2时差不多的性能,能够将文献区分开,但是通过对照D2和D3可以发现,D3由于少1个词而相似性函数的值反而大,这正是向量检索模型/重0专著而/轻0涉及面广的经典著作的弱点所在。另外,原来提问式的结构在此也不予考虑。从上面的例子看出,扩展布尔逻辑检索模型确实有比传统布尔逻辑检索模型和模糊检索模型更优越的特点,概括如下:311 采用结构式的提问,与用户的思维和使用习惯兼容。用户既可以使用/AND0算子表达短语关系,也可用/OR0算子连接同义词,这种结构化的提问可避免文献)))提问相似性依赖匹配词的数目和可能造成的对提问的语义的错误解释。312 可以对文献的标引词和提问词分别加权,以反映文献中词语的相对重要程度和用户提问的侧重点所在。313 可以通过设置一个阀值来控制检索的输出量,检索的输出按与提问的相似性大小进行排序,这样的顺序在一定程度上能够反映用户的观点并且便于对结果评价。314 通过p值的调节,可以自由选择提问式的结构形式,或象传统布尔逻辑检索模型的严密逻辑结构,或象向量检索模型的松散结构,或介于两者之间,以自如地表达复杂的情报需求。还可通过p值调节,控制命中文献量,特别是借助叙词表进行检索的系统。如对于概念较宽泛而高频的上位词,用AND并指定较大的p值,组织成专指的提问式,以控制命中文献量;对于概念专指且低频的词应用OR并指定较大的p值,将该词的同义词、近义词及相关词组织成提问式,以增加命中文献量。315 扩展布尔逻辑检索模型更吸引人的地方是复合提问式中根据需要可以采用不同的Q值,如提问式[(computerAND(2)science)OR(2)(computerAND(2)engineering)]AND(])(authorpSmithp),表示用户需要Smith写的所有计算机科学或计算机工程方面的文献,其他作者有关这方面的文献一律不要。316 扩展布尔逻辑检索模型适用于反馈系统,即可通过首次检索出的文献的相关反馈信息,对提问式作修改,以期获得更佳的检索效果。除可以增加相关提问词权值、减少或除去弱相关词权值及非相关词外,扩展检索模型还可以对出现词频高的词组增加p值,出现词频低的词组减少p值,在传统布尔逻辑检索模型和向量检索模型间权衡,以期获得最佳检索结果。3 扩展布尔逻辑检索模型的特点u下面举一个例子,以便对扩展布尔逻辑检索模型作出评价。设有一个存贮5篇文献的文献库D,有一提问q=(AorB)and(CorDorE)。词的分布情况如表1。表1文 献D1D2D3D4D5A00100B11000表2P=]Sim(d,q)rankD1D2D3D4D5P=2Sim(d,q)RankD1D2D3D4D5P=1Sim(d,q)rankD1D2D3D4D5C01010D10101E11011理论探索11100表2分别对应着p=],p=2和p=1的文献)))提问相似度及文献的排序情况,这里文献中的标引词并未加权,而且除了p=1外,提问词也未加权。(1)当p=]时,sim(D1,q)=min{max{0,1},max{0,1,1}}=min{1,1}=1,等等。即为常规布尔逻辑检索。此时,强调完全匹配,只有严格满足布尔逻辑式的文献才命中,并且从结果看命中的文献之间没有差别。(2)当p=2时,sim(D1,AorB)=1/2,sim(D1,CorDorE)=于是,sim(D1,q)=1-参考文献[1]王娟琴.三种检索模型的比较分析研究[J].情报科学,1998,(5).[2]杨建林.信息检索的逻辑模型[J].情报学报,2000,(4).[3]焦玉英,雷春明.模糊理论在信息检索中的应用研究[J].情报学报,2000,(5).[4]巢乃鹏,倪波.论情报检索的逻辑模型[J].情报学报,2000,(1).[(1-1/2+(1-2]/2=01756,,。在这里,文献D1,D2和D3虽然都满足布尔逻辑式,但由于AND(2)和OR(2)算子使这些文献之间有了区别,D3则由于少了1个词而相似性函数的值也小。此外,由于D3和D5不满足布尔逻辑式,因此,相似度比D1、D2、D3要小,可以将它们区别开,同时也体现了D4和D5与提问也具有一定的相关性。(3)当p=1时,对提问词用倒置文献频率法idfk=log2
现代情报 2004年9月第9期 September12004No.9 布尔逻辑检索模型的分析探讨 刘红泉 张亮峰 (湖南工程学院,湘潭摘 要2 布尔逻辑检索模型(BooleanRetrievalModel简称BRM)是最早的一种检索…2 0 年 第 1期( 第 19 ) 09 2 总 期 1 ~ . _一 一 一 … … 一 … ~ 一 ● “ 空瓶换 饮料" 问题的思考 吴 申宏 庐 江县 万 山镇 明德 小 学 ,安徽 初等 数 学名 题是 一颗 颗璀 璨 明珠 , 古 到今…(中国电子商务研究中心讯)迄今为止,从98年起中国化工网、8848诞生起,电子商务在中国的发展历史已经有十三个年头。在经历了萌芽与起步期、冰冻与调整期、复苏与回暖期、崛起与高速增长期以及转型与升级期后,2010年国内电子商务尤其是B2C,迎来了前所未…上学期第一次月考测试题 学号:____________姓名:____________得分:____________ 一.单项选择题(每小题3分,共45分) 1.下列现象中,能表明分子在不停地做无规则运动的是( ) A.濛濛细雨从空中…就爱阅读网友整理上传,为您提供最全的百科知识,期待您的分享,转载请注明出处。
欢迎转载:
推荐:    

我要回帖

更多关于 世纪佳缘网登录 的文章

 

随机推荐