13507474271搜索过什么是搜索引擎

第一代搜索引擎_百度百科
第一代搜索引擎
本词条缺少名片图,补充相关内容使词条更完整,还能快速升级,赶紧来吧!
Archie被公认为是第一代搜索引擎雏形,也是第一代搜索引擎的鼻祖。它是由加拿大麦吉尔大学(University of McGill)计算机学院的师生于1990开发出来,随后Yahoo、Altavista、Inktomi、Google提供先后对搜索引擎服务进行了升级优化,真正的搜索引擎真正诞生。
第一代搜索引擎历史概述
第一代搜索引擎鼻祖
1990年,麦吉尔大学(University of McGill)计算机学院的师生开发出Archie。当时,万维网(WWW)还没有问世,人们通过FTP来共享交流资源。Archie能定期搜集并分析FTP服务器上的文件名信息,提供查找分别在各个FTP主机中的文件。用户必须输入精确的文件名进行搜索,Archie告诉用户哪个FTP服务器能下载该文件。虽然Archie搜集的信息资源不是网页(HTML文件),但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务。所以,Archie被公认为第一代搜索引擎的鼻祖。
第一代搜索引擎问世
1994年4月,斯坦福大学的两名生,美籍华人杨致远和David Filo共同创办了Yahoo!。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。Yahoo以后陆续有Altavista、Inktomi、Google提供搜索引擎服务。Yahoo!几乎成为20世纪90年代的因特网的代名词。1996年8月,sohu公司成立,制作中文网站分类目录,曾有“出门找,上网找搜狐”的美誉。
第一代搜索引擎基本特征
第一代搜索引擎的特征是基于人工分类目录搜索。目录式搜索是以人工方式或半自动方式建立起来的目录导航,目录的用户界面是分级结构,首页提供了几个分类入口,把信息放在目录下,逐级向下查询,用它可以找到需要的信息。因为是手工输入,所以算不上是真正的搜索引擎,只是按分类链接而已。
第一代搜索引擎应用缺陷
随着互联网的发展,人工编辑的分类目录已经不适应。其显著缺陷是完全依靠手工操作,需要人工按照分类一层一层填写,逐层进入才能找到,搜索速度非常慢,使用比较复杂。尽管现在仍有使用,但可以确定的是,依靠目录式搜索这种原始方式就将走到尽头,使用搜索引擎的时代已经到来。
第一代搜索引擎发展趋势
信息分类是式搜索的发展趋势,它让互联网变的更普及更贴近、更方便人们的生活。人们日常在互联网上所看到的信息,往往是不管你愿不愿意,接受不接受它都会强加给你,人们称这类信息为被动信息;而人们主动去查询招聘、租房、旅游等方面的信息称它为主动信息。在信息社会逐步发展的今天,被动信息越来越引起人们的反感,而主动信息却受到人们的广泛青睐。几乎每个网站都少不了分类信息的身影,而且办得越好的网站,分类信息的篇幅往往越大。
企业信用信息什么是站内搜索?_百度知道什么叫搜索关键词_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
什么叫搜索关键词
上传于||暂无简介
阅读已结束,如果下载本文需要使用0下载券
想免费下载更多文档?
定制HR最喜欢的简历
你可能喜欢之前只是好奇在淘宝上搜了一下,没想到留下了搜索历史,然后买东西的时候同事点电脑看到了,好尴尬!本人女,同事男,今后是不是要用异样的眼光看我了!啊啊啊,好烦
来一炮就好了,别担心
已有帐号?
无法登录?
社交帐号登录
有人喜欢白,有人喜欢黑,有人喜欢灰,可我只喜欢彩虹。查找算法_百度百科
查找是在大量的信息中寻找一个特定的信息元素,在计算机应用中,查找是常用的基本运算,例如编译程序中符号表的查找。
查找算法概念
用关键字标识一个,查找时根据给定的某个值,在表中确定一个关键字的值等于给定值的记录或数据元素。在计算机中进行查找的方法是根据表中的记录的组织结构确定的。  也称为线形查找,从数据结构线形表的一端开始,顺序扫描,依次将扫描到的结点关键字与给定值k相比较,若相等则表示查找成功;若扫描结束仍没有找到关键字等于k的结点,表示查找失败。  要求线形表中的结点按值升序或降序排列,用给定值k先与中间结点的关键字比较,中间结点把线形表分成两个子表,若相等则查找成功;若不相等,再根据k与该中间结点关键字的比较结果确定下一步查找哪个子表,这样递归进行,直到查找到或查找结束发现表中没有这样的结点。  也称为索引查找,把线形分成若干块,在每一块中的数据元素的存储顺序是任意的,但要求块与块之间须按关键字值的大小有序排列,还要建立一个按关键字值递增顺序排列的索引表,索引表中的一项对应线形表中的一块,索引项包括两个内容:① 键域存放相应块的最大关键字;② 链域存放指向本块第一个结点的指针。分块查找分两步进行,先确定待查找的结点属于哪一块,然后在块内查找结点。  哈希表查找是通过对记录的关键字值进行运算,直接求出结点的地址,是关键字到地址的直接转换方法,不用反复比较。假设f包含n个结点,Ri为其中某个结点(1≤i≤n),keyi是其关键字值,在keyi与Ri的地址之间建立某种函数关系,可以通过这个函数把关键字值转换成相应结点的地址,有:addr(Ri)=H(keyi),addr(Ri)为哈希函数。
查找算法顺序查找
顺序查找过程:从表中的最后一个记录开始,逐个进行记录的关键字与给定值进行比较,若某个记录的关键字与给定值相等,则查找成功,找到所查的记录;反之,若直到第一个记录,其关键字和给定值比较都不相等,则表明表中没有所查的记录,查找失败。  算法描述为  int Search(int d,int a[],int n)  {  /*在数组a[]中查找等于,若找到,则函数返回d在数组中的位置,否则为0。其中n为数组长度*/  int i ;  /*从后往前查找*/  for(i=n-1;a!=d;--i)    /*如果找不到,则i为0*/  }
查找算法二分查找
二分查找又称折半查找,它是一种效率较高的查找方法。
  【二分查找要求】:1.必须采用2.必须按大小有序排列。
【优缺点】的优点是比较次数少,查找速度快,平均性能好;其缺点是要求待查表为有序表,且插入删除困难。因此,折半查找方法适用于不经常变动而查找频繁的列表。  【算法思想】首先,将表中间位置记录的关键字与查找关键字比较,如果两者相等,则查找成功;否则利用中间位置记录将表分成前、后两个子表,如果中间位置记录的关键字大于查找关键字,则进一步查找前一子表,否则进一步查找后一子表。  重复以上过程,直到找到满足条件的记录,使查找成功,或直到子表不存在为止,此时查找不成功。  【算法】假设其数组长度为n,其算法复杂度为o(log(n))
  下面提供一段二分查找实现的:
BinarySearch(max,min,des)
mid-des then  max=mid-1  else  min=mid+1  return max
  折半查找法也称为二分查找法,它充分利用了元素间的次序关系,采用分治策略,可在最坏的情况下用O(log n)完成搜索任务。它的基本思想是,将n个元素分成个数大致相同的两半,取a[n/2]与欲查找的x作比较,如果x=a[n/2]则找到x,算法终止。如 果xa[n/2],则我们只要在数组a的右 半部继续搜索x。
查找算法分块查找
分块查找又称索引顺序查找,它是顺序查找的一种改进方法。  方法描述:将n个数据元素&按块有序&划分为m块(m ≤ n)。每一块中的结点不必有序,但块与块之间必须&按块有序&;即第1块中任一元素的关键字都必须小于第2块中任一元素的关键字;而第2块中任一元素又都必须小于第3块中的任一元素,……。  操作步骤:  step1 先选取各块中的最大关键字构成一个索引表;  step2 查找分两个部分:先对索引表进行二分查找或顺序查找,以确定待查记录在哪一块中;然后,在已确定的块中用顺序法进行查找。
查找算法哈希表查找
1 基本原理
我们使用一个下标范围比较大的数组来存储元素。可以设计一个函数(哈希函数, 也叫做),使得每个元素的关键字都与一个函数值(即数组下标)相对应,于是用这个数组单元来存储这个元素;也可以简单的理解为,按照关键字为每一个元素&分类&,然后将这个元素存储在相应&类&所对应的地方。
但是,不能够保证每个元素的关键字与函数值是一一对应的,因此极有可能出现对于不同的元素,却计算出了相同的函数值,这样就产生了&冲突&,换句话说,就是把不同的元素分在了相同的&类&之中。后面我们将看到一种解决&冲突&的简便做法。
总的来说,&直接定址&与&解决冲突&是哈希表的两大特点。
2 函数构造
的常用方法(下面为了叙述简洁,设 h(k) 表示关键字为 k 的元素所对应的函数值):
a) 除余法:
选择一个适当的正整数 p ,令 h(k ) = k mod p  这里, p 如果选取的是比较大的,效果比较好。而且此法非常容易实现,因此是最常用的方法。
b) 数字选择法:
如果关键字的位数比较多,超过长整型范围而无法直接运算,可以选择其中数字分布比较均匀的若干位,所组成的新的值作为关键字或者直接作为函数值。
线性重新散列技术易于实现且可以较好的达到目的。令数组元素个数为 S ,则当 h(k) 已经存储了元素的时候,依次探查 (h(k)+i) mod S , i=1,2,3…… ,直到找到空的存储单元为止(或者从头到尾扫描一圈仍未发现空单元,这就是已经满了,发生了错误。当然这是可以通过扩大数组范围避免的)。
4 支持运算
哈希表支持的运算主要有:初始化(makenull)、哈希函数值的运算(h(x))、插入元素(insert)、查找元素(member)。  设插入的元素的关键字为 x ,A 为存储的数组。  初始化比较容易,例如  const empty= // 用非常大的整数代表这个位置没有存储元素  p=9997; // 表的大小    var i:  begin  for i:=0 to p-1 do  A:=  E
哈希函数值的运算根据函数的不同而变化,例如除余法的一个例子:  function h(x:longint):I  begin  h:=  
我们注意到,插入和查找首先都需要对这个元素定位,即如果这个元素若存在,它应该存储在什么位置,因此加入一个定位的函数 locate  function locate(x:longint):  var orig,i:  begin  orig:=h(x);  i:=0;  while (ix)and(A[(orig+i)mod S]empty) do  inc(i);  //当这个循环停下来时,要么找到一个空的存储单元,要么找到这个元  //素存储的单元,要么表已经满了  locate:=(orig+i) mod S;    插入元素  procedure insert(x:longint);  var posi:  begin  posi:=locate(x); //定位函数的返回值  if A[posi]=empty then A[posi]:=x   //error 即为发生了错误,当然这是可以避免的  
查找元素是否已经在表中  procedure member(x:longint):  var posi:  begin  posi:=locate(x);  if A[posi]=x then member:=true  else member:=  
企业信用信息

我要回帖

更多关于 什么是搜索引擎 的文章

 

随机推荐