数据(Date):把事件的某些属性规范化后的表现形式,分为模拟数据和数字数据
模拟数据:在时间和幅度取值上连续。
数字数据:在时间上离散在幅度上经过量化。
信息:按照一定要求以某种格式组织起来的数据
表现信息的形式可以是数值、文字、图形、声音、图像及动画等。
数据和信息的区别:数据仅涉及事物的表现形式而信息涉及数据的内容和解释。
信号:数据的具体物理表现表达信息的一种载体。
根据数据表示方式不同分为:模拟信号和数字信号
模拟信号:一种随时间而连续变化的量值波形
数字信号:不连续变化的离散量值波形。
模/数转换器:实现模拟信号和数字信号之间的相互转换
信道:指传输信息时信号沿发送端到接收端的通路,分为物理信道和逻辑信道
物理信道/通信链路:传输信号的物理通道由传输介质及相关通信设备组成。
逻辑信道:建立在物理信道基础上一个物理信道可以提供多个逻辑信道。
物理信道1按传输信号类型分为模拟信道和数字信道
模拟信道:传输模拟信号
数字信道:传输数字脉冲信号。
数字信号通过调制解调设备可在模拟信道传输模拟信号进行數字化可在数字信道中传输。
2按传输介质分为:有线信道和无线信道
有线信道:电话线、双绞线、光缆等
无线信道:无线电、微波、红外线和卫星通信等。
均以电磁波的形式在空间传播
3按信道的使用方式分为:专用信道(专线)和公共交换信道
通信:信息的传输与交换。
每个通信系统都具备信源、信道、信宿三个基本要素
信源:信息产生和出现的发源地;
信道:信息传送过程中承载信息的媒体;
信宿:接收信息的目的地;
数据通信:以传输数据为业务的通信,分为模拟数据通信和数字数据通信
数据通信网:数据通信系统的网络形式,广域通信网或计算机网络必备知识等基础通信设施属于通信子网。
码元:一个信号编码单元数据的基本信号单位,计算机网络必备知识中一般把数字序列中的每一个脉冲称为码元
码字:由码元组成的二进制字符串序列。
数据分组/数据包:计算机网络必备知识在传输數据时一般把较大的数据块分成较小的数据段。并在每一段上附加一些(如分组号、源地址、目的地址、差错校验等)控制信息每个數据段和相应的控制信息就是一个分组,在系统中是一个传输单位
在实际传输中,还会将分组进一步分割成更小的逻辑单位
在不同的網络或不同的层中,分组名称也不同如在Ethernet中称为“帧”,ATM中称为“信元”IP中称为“IP数据报”。
基带传输:指在传输信号时用表示信息的原有信号形式(模拟数据用模拟信号传输,数字数据用数字信号传输)进行
基带信号:原始的数字信号(电脉冲信号)。
基本频带(基带):基带信号所占用(固有)的频率范围
基带传输:在信道中直接传输基带信号的传输方式/数字数据直接在信道中传输
局域网系統大多采用基带传输,如以太网、令牌环网一种最简单、最基本的传输方式。
频带传输:将基带信号变换为较高频率范围的频带信号頻带信号是模拟信号(如音频信号),然后将这种频带信号放到模拟信道中传输
远距离通信信道通常采用频带传输,如Modem
宽带传输:利用寬带信号进行的传输采用频带传输技术,但频带传输不一定是宽带传输;采用模拟传输的技术将不同频率的多种调制信号在同一传输線路中传输(将声音、图像和数字数据等信息综合到一个物理信道上)。
宽带:在电信界指带宽大于语言级信道(4KHZ)的信道包括大部分電磁波频谱。
宽带网:网络的传输速率>2Mbps
窄带网:网络的传输速率<2Mbps
数据传输速率度量方法:比特率(信息速率)和波特率(调制速率)
传输数据的质量度量方法:误码率、延遲、抖动和丢包率。
比特率bit(S):衡量数字信号的传输速率指单位时间内所传输的二进制位序列的位(bit)数,是度量通信系统每秒传输嘚信息量
波特(Baud)率(B)/调制速率/波形速率/码元速率:指数字信号经过调制后的传输速率/每秒传输的脉冲(波形)信号个数。每秒通过信道传输的码元数通常用于调制解调器传输信号的速率。
B=1/T(T:每个脉冲(波形)信号的持续时间;单位:秒)
比特率和波特率的关系:S=B*log2n(n:一个脉冲(波形)信号所表示的有效状态数)
误码率Pe/出错率:表示传输系统中二进制数据位被传错的概率是衡量传输系统可靠性的指标。
Pe=Ne/N(N:传输的二进制码元总数;Ne:接收码元中被传错的码元数)
计算机网络必备知识中一般要求误码率<10^-6,即平均每传输1Mbit
信道容量S:指物理信道能达到的最大传输能力
带宽:1模拟信道:指信道所能传输的信号的频率宽度可传输信号的最高频率与最低频率之差。
频率单位为:Hz(赫兹)、KHz(千赫兹)、MHz(兆赫兹)、THz(兆赫)等
2数字信号:用数据传输速率表示
带宽、数据传输速率和信道容量的区别:贷款囷数据传输速率都是用来度量实际传输能力的。
数据速率:数字信道的容量
带宽:模拟信道的容量一般用来表示传输介质和模拟信道的傳输能力。
比特间隔(对应于周期):发送一个比特所需要的时间
比特率(对应于频率):每秒发送的比特位数(单位:bps)
比特间隔和比特率均用来描述数字信号
延迟/时延:指将一个比特从网络的一端传输到另一端所花费的时间
抖动/可变延迟:指在同一条路由上发送的一組数据中数据包之间的时间差异。
吞吐量:指在网络中发送数据报的速率可用平均速率和峰值速率表示。
丢包率:指在网络中发送数据包时丢弃数据包的最高比率数据包的丢包是网络拥塞引起的。
这四个参数均是服务质量QoS的主要度量参数
数据通信系统基本模型:
信源囷信宿(计算机或者终端设备):数字式,交换的信息均属于离散的数字序列二进制数字数据,在信息发送前须转换为信号。
点到点嘚通信系统模型:计算机(终端)——编(译)码器——信号变换器—信道(噪声)—信号变换器——编(译)码器——计算机(终端)
編(译)码器/通信控制器:将信息通过ASCII代码(或其他编码)转变为0和1的二进制模式然后将这些二进制并行数据,转换成适合线路传输的串行数据序列而接收端的编(译)码器将传输来的串行数据序列转换成并行数据,还原成信息
功能:负责DTE和通信线路的连接,完成数據缓冲、速度匹配、串并转换等
通信控制器:微机内部的异步通信控制器、网卡。
通信线路:信号变换器和线路
信号变换器:将通信控淛器发出的二进制数字序列根据不同信道的传输特性,变换为适合于信道传输的数字信号或模拟信号(即使是利用数字信道进行数据通信一般也需要使用变换/反变换器,而不是将数字信号直接送入数字信道)然后送入信道传输。而接收端的信号变换器完成相反的工作如调制解调器、光纤通信网中的光电转换器等就是信号变换器
信道:有线信道和无线信道
模拟通信系统:由信源得到的模拟数据电信号,变成适合信道传输的电信号后若其电流或电压仍然是随时间连续变化。如:电话系统、电视系统
数字通信系统:当信源发出的信号是離散的数字数据时通过信道传输到信宿的信号都是数字信号。
优点:比模拟通信系统费用低抗干扰(如噪声等)能力强,不易失真
缺点:数字信号比模拟信号易衰减,因而只能在有限的距离上传输为了获得更大范围的传输,可使用中继器
信号衰减的克服:1用放大器来增强信号的能量;
2使用中继器,把数字信号“0”、“1”整形恢复为标准电平后继续传输
编码:将模拟数据或数字数据变换成数字信號
调制:将模拟数据或数字数据变换成模拟信号。
四种数据的编码和调制方法:1数字数据用数字信号传输
2模拟数据用数字信号传输
3数字数據用模拟信号传输
4模拟数据用模拟信号传输
(1)单极性和双极性编码
单极性编码:二进制数据“0”和“1”在编碼时只使用一种电压
双极性编码:使用两种电压
(2)归零和不(非)归零编码
归零编码:在表示数字信号时每一个表示“0”和“1”的电壓(假如有电压),当表示一个数字信号的中部电平都变为零电压时
不(非)归零编码:如果表示信号结束后电压还保持原来电压状态。
(3)双相位编码:当表示一位数字信号的编码时在信号的中间将电压变为相反(注意不是归零,而是由正电压变为负电压或由负电壓变为正电压)。
单极性不归零编码(NRZ):只使用一个电压值
缺点:1平均振幅不是零产生了直流分量(频率为0的分量),不能由无法处悝直流分量能力的介质传输
双极性不归零编码(BNRZ):用正电平和负电平分别表示二进制数据的1和0,正的幅值和负的幅值相等
使用了两个電压线路上的平均电压值下降,减轻了单极性编码中的直流分量问题
双极性归零编码(BRZ):使用了正电平、负电平和零三个电平,编碼信号本身携带同步信息解决了同步问题。
缺点:编码一个比特需要两次信号变化,增加了占用的带宽;线路上的平均电压值不为零
双相位编码:1曼切斯特编码:
编码器:A/D转换器,又称为数/模转换器进行模/数(A/D)转换
解码器:D/A转换器,又稱为模/数转换器进行数/模(D/A)转换
脉冲振幅调制(PAM):对原始的模拟信号每间隔一个相等的时间进行采样一次。
脉码调制(PCM):将PAM采样結果修改成完全数字化的信号
量化:一种对采样结果赋予一个特定范围内的整数值的方法。
3)采样频率:是原始的有效信号中最高频率汾量或其带宽的2倍
作用:决定了模拟数据的数字信号的质量。
公共交换网是一种模拟信道
调制解调器:实现数字信号与模拟信号互换嘚设备
模拟信号:载波信号,载波信号具有振幅、频率和相位三大要素三种基本调制技术:幅移键控法(ASK)、频移键控法(FSK)、相移鍵控法(PSK)
幅移键控法(ASK)/振幅键控:通过控制正弦载波信号两个不同的振幅分别表示0和1,频率和相位保持不变
限制因素:传输介质、噪声(热、电磁感应等)
频移键控法(FSK)/频率键控:通常用载波频率附近的两个不同频率来表示两个二进制值,振幅和相位保持不变
限淛因素:载波的物理容量
相移键控法(PSK)/相位键控:通过改变正弦载波信号的相位来表示两个二进制值,振幅和频率保持不变
正交调幅:ASK和PSK的结合
为了便于无线传输和频分多路复用等的需要,模拟数据可在甚高频正弦波下进行模拟调制
调制技术:调幅AM、调频FM、调相PM
调幅AM:经AM调制后,载波的振幅会随着原始模拟数据的振幅呈线性变化频率和相位保持不变。调幅信号的带宽是原来模拟信号带宽的两倍
调頻FM:在调频传输中,原来模拟载波信号的频率会随着调制信号电压(振幅)的改变而调整而振幅和相位保持不变。调频信号的带宽是原來模拟信号带宽的10倍
调相PM:在调相传输技术中,原始模拟载波信号的相位随调制信号电压(振幅)的改变而调整振幅和频率保持不变。
数据传输方式有串行传输和并行传输
串行传输:指数据在信道上一位一位地逐个传输,从发送端接收到接收端只有一根传输线是计算机网络必备知识中普遍采用的传输方式。
优点:线路成本高架设方便,容易维护易于实现
1单工通信(双线制):只允许传输的信息始终向一个方向流动,采用双线制一个用于传输数据的主信道,另一个用于传输控制信息的监测信道
例:听广播和看电视、寻呼机
2半雙工通信(双线制+开关):允许信息流向两个方向都可传输,但同一时刻只能朝一个方向传输不能同时进行双向传输。
3全双工通信(四線制):指在同一时刻能同时进行双向通信,即通信的一方在发送信息的同时也能接收信息
并行传输:指数据以成组的方式在多个并荇的信道上同时传输,即多个数据位并排同时在线路上传输相应地需要若干根传输线。
缺点:费用高维修不易,易受干扰
同步技术:串行传输方式中,为了保证接收二进制序列与发送的数据一致(何时发送数据、双方传输速率是否一致、每个比特持续时间、比特间的時间间隔)并将其组合成字符,需要依靠收/发双方之间的定时机制来实现
常用的同步技术:同步传输和异步传输
同步传输:将一个大的數据块(一组数据或一个报文)一起发送
优点:线路利用率高无起始位和停止位,中间不须停顿可连续不断的发送
缺点:线路控制比較复杂
异步传输/起止式传输:允许码字之间存在存在不确定的空闲时间,即码字之间没有确定的时间关系每个字符都带有起始位和停止位,当没有数据发送时传输线一直处于高电平状态(停止位/1),一旦接收端检测到传输线上有1到0的跳变意味着发送端已经开始发送字苻。
优点:设备简单技术容易,费用不高
作鼡:提高了传输介质的利用率
常用的多路复用技术:频分多路复用(FDM)、时分多路复用(TDM)、波分多路复用(WDM)等
频分多路复用(FDM):一種模拟技术把信道的频谱分割成若干个互不重叠的子信道,各相邻子信道间要留有一个狭长的带宽(保护带)
时分多路复用(TDM):将粅理信道按时间分成许多等长的时间片,轮流、交替地分配给多路信源这样使多路输入信号能共享物理信道。
实现方式:同步时分多路複用、异步时分多路复用
同步时分多路复用:时隙预先分配且固定不变无论时隙拥有者是否传输数据都占有一定时隙,这就形成了时隙浪费其时隙的利用率很低,为了克服STDM的缺点引入了异步时分复用技术。
异步时分多路复用/统计时分复用STDM:能动态地按需分配时隙以避免每个时间段中出现空闲时隙
波分多路复用(WDM):对于光信号用波长二不用频率来表示的光载波,主要用于光纤通信
密集波分多路复鼡DWDM:有助于灵活扩大现有光纤骨干网的容量
和波分多路复用区别:一根光纤复用80路甚至更多路光信号
三种常用复用技术的比较:
1频分多路複用(FDM):传输模拟信号
2时分多路复用(TDM):传输数字电信号
3波分多路复用(WDM):传输光波信号
单位:比特(bit)。向上直接和信道(传输介质)相连接向上对数据链路层屏蔽各种物理传输介质的差异
作用:在网络节点之间的物理媒体上提供线路的建立、维持和释放,实现二进制位流的透明传输并进行差错检查等。物理层是对DTE和DCE之间通信接口的描述和规定
数据终端设备DTE:对所有聯网设备或工作站的统称,是通信的信源或信宿如计算机、终端、路由器等
数据电路端接设备DCE:对为提供网络设备接入点的统称,如交換机、自动呼叫应答设备、调制解调器等
功能:1保证数据按位传送的正确性同时提供通信接口定义、控制信号、数据传输速率、接口信號电平等;
3建立、维持和释放物理连接。
特性: 1)机械特性:规定了DTE和DCE之间实际的物理连接
2)电气特性:规定了信号及有关电路的特性。
3)功能特性:规定了接口信号的来源、作用及其他信号之间的关系即接口中各引脚线的功能分配和确切定义。
4)规程特性:就是协议定义了DTE和DCE接口进行二进制比特流传输前的控制步骤,包括各信号线的工作规程和时序
计算机网络必备知识基础是我们認识计算机了解计算机网络必备知识的入门学科,只要了解什么计算机网络必备知识了解了信息怎么发送接收,我们才能更好的从事這个学科相关的职业21世纪以来,网络越来越亲民当下无论男女老幼都在使用网络,网络技术也得到了前所未有的普及作为新青年和計算机网络必备知识相关专业从业者的我们,了解计算机网络必备知识的基础及原理势在必行接下来带大家全面了解计算机网络必备知識基础。
分组(packet ) :因特网中传送的数据单元。由首部 header 和数据段组成分组又称为包,首部可称为包头
存储转发(store and forward ) :路由器收到一个分组,先检查分組是否正确并过滤掉冲突包错误。确定包正确后取出目的地址,通过查找表找到想要发送的输出端口地址然后将该包发送出去。
带寬(bandwidth) :在计算机网络必备知识中表示在单位时间内从网络中的某一点到另一点所能通过的“最高数据率”。常用来表示网络的通信线蕗所能传送数据的能力单位是“比特每秒”,记为 b/s
吞吐量(throughput ) :表示在单位时间内通过某个网络(或信道、接口)的数据量。吞吐量哽经常地用于对现实世界中的网络的一种测量以便知道实际上到底有多少数据量能够通过网络。吞吐量受网络的带宽或网络的额定速率嘚限制
下面的内容会介绍计算机网络必备知识的五层体系结构:物理层+数据链路层+网络層(网际层)+运输层+应用层。
数据(data) :运送消息的实体
信号(signal) :数据的电气的或电磁的表现。或者说信号是适合在传输介质上传输的對象
码元( code) :在使用时间域(或简称为时域)的波形来表示数字信号时,代表不同离散数值的基本波形
单工(simplex ) : 只能有一个方向的通信而没有反方向的交互。
半双工(half duplex ) :通信的双方都可以发送信息但不能双方同时发送(当然也就不能同时接收)。
全双工(full duplex) : 通信的双方可以同时发送和接收信息
失真:失去真实性,主要是指接受到的信号和发送的信号不同有磨损和衰减。影响失真程度的因素:1.码元傳输速率 2.信号传输距离 3.噪声干扰 4.传输媒体质量
奈氏准则 : 在任何信道中码元的传输的效率是有上限的,传输速率超过此上限就会出现严偅的码间串扰问题,使接收端对码元的判决(即识别)成为不可能
香农定理 :在带宽受限且有噪声的信道中,为了不产生误差信息的數据传输速率有上限值。
基带信号(baseband signal) : 来自信源的信号指没有经过调制的数字信号或模拟信号。
带通(频带)信号(bandpass signal) :把基带信号经過载波调制后把信号的频率范围搬移到较高的频段以便在信道中传输(即仅在一段频率范围内能够通过信道),这里调制过后的信号就昰带通信号
调制(modulation ) : 对信号源的信息进行处理后加到载波信号上,使其变为适合在信道传输的形式的过程
信道复用(channel multiplexing ) :指多个用户囲享同一个信道。(并不一定是同时)
物理层主要做的事情就是 透明地传送比特流。也可以将物理层的主要任务描述为确定与传输媒体的接口的一些特性即:机械特性(接口所用接线器的一些物理属性如形状尺寸),电气特性(接口电缆的各条线上出现的电压的范围)功能特性(某条线上出现嘚某一电平的电压的意义),过程特性(对于不同功能能的各种可能事件的出现顺序)
物理层考虑的是怎样才能在连接各种计算机的传輸媒体上传输数据比特流,而不是指具体的传输媒体 现有的计算机网络必备知识中的硬件设备和传输媒体的种类非常繁多,而且通信手段也有许多不同的方式物理层的作用正是尽可能地屏蔽掉这些传输媒体和通信手段的差异,使物理层上面的数据链路层感觉不到这些差異这样就可以使数据链路层只考虑完成本层的协议和服务,而不必考虑网络的具体传输媒体和通信手段是什么
用户箌互联网的宽带接入方法有非对称数字用户线 ADSL(用数字技术对现有的模拟电话线进行改造,而不需要重新布线ASDL 的快速版本是甚高速数字鼡户线 VDSL。)光纤同轴混合网 HFC(是在目前覆盖范围很广的有线电视网的基础上开发的一种居民宽带接入网)和 FTTx(即光纤到······)。
链蕗(link) :一个结点到相邻结点的一段物理链路
数据链路(data link) :把实现控制数据运输的协议的硬件和软件加到链路上就构成了数据链路。
循环冗余检验 CRC(Cyclic Redundancy Check) :为了保证数据传输的可靠性CRC 是数据链路层广泛使用的一种检错技术。
帧(frame) :一个数据链路层的传输单元由一个數据链路层首部和其携带的封包所组成协议数据单元。
误码率 BER(Bit Error Rate ) :在一段时间内传输错误的比特占所传输比特总数的比率。
MAC 地址(Media Access Control 或鍺 Medium Access Control) :意译为媒体访问控制或称为物理地址、硬件地址,用来定义网络设备的位置在 OSI 模型中,第三层网络层负责 IP 地址第二层数据链蕗层则负责 MAC 地址。因此一个主机会有一个 MAC 地址而每个网络位置会有一个专属于它的 IP 地址 。地址是识别某个系统的重要标识符“名字指絀我们所要寻找的资源,地址指出资源所在的地方路由告诉我们如何到达该处。
进程(process) :指计算机中正在运行的程序实体。
应用进程互相通信 :一台主机的进程和另一台主机中的一个进程交换数据的過程(另外注意通信真正的端点不是主机而是主机中的进程也就是说端到端的通信是应用进程之间的通信)。
传输层的复用与分用 :复鼡指发送方不同的进程都可以通过统一个运输层协议传送数据分用指接收方的运输层在剥去报文的首部后能把这些数据正确的交付到目嘚应用进程。
**端口(port) ** :端口的目的是为了确认对方机器是那个进程在于自己进行交互比如 MSN 和 QQ 的端口不同,如果没有端口就可能出现 QQ 进程和 MSN 交互错误端口又称协议端口号。
停止等待协议(stop-and-wait) :指发送方每发送完一个分组就停止发送等待对方确认,在收到确认之后在发送下一个分组
流量控制 : 就是让发送方的发送速率不要太快,既要让接收方来得及接收也不要使网络发生拥塞。
拥塞控制 :防止过多的數据注入到网络中这样可以使网络中的路由器或链路不致过载。拥塞控制所要做的都有一个前提就是网络能够承受现有的网络负荷。
以下知识点需要重点关注:
文件传输协议(FTP) :FTP 是 File TransferProtocol(文件传输协议)的英文简称而中文简称为“文传协议”。用于 Internet 上的控制文件的双向传输同时,它也是一个应用程序(Application)基于不同的操作系统有不同的 FTP 应用程序,而所有这些应用程序都遵守同一种协议以传输文件在 FTP
的使用当中,用户经常遇到两个概念:“下载”(Download)和"上传"(Upload) "下载"文件就是從远程主机拷贝文件至自己的计算机上;"上传"文件就是将文件从自己的计算机中拷贝至远程主机上。用 Internet 语言来说用户可通过客户机程序姠(从)远程主机上传(下载)文件。
简单文件传输协议(TFTP) :TFTP(Trivial File Transfer Protocol,简单文件传输协议)是 TCP/IP 协议族中的一个用来在客户机与服务器之间进行簡单文件传输的协议提供不复杂、开销不大的文件传输服务。端口号为 69
远程终端协议(TELENET) :Telnet 协议是 TCP/IP 协议族中的一员,是 Internet 远程登陆服务嘚标准协议和主要方式它为用户提供了在本地计算机上完成远程主机工作的能力。在终端使用者的电脑上使用 telnet 程序用它连接到服务器。终端使用者可以在 telnet 程序中输入命令这些命令会在服务器上运行,就像直接在服务器的控制台上输入一样可以在本地就能控制服务器。要开始一个 telnet 会话必须输入用户名和密码来登录服务器。Telnet 是常用的远程控制 Web 服务器的方法
万维网(WWW) :WWW 是环球信息网的缩写,(亦作“Web”、“WWW”、“‘W3’”英文全称为“World Wide Web”),中文名字为“万维网”"环球网"等,常简称为 Web分为 Web 客户端和 Web 服务器程序。WWW 可以让 Web 客户端(瑺用浏览器)访问浏览 Web 服务器上的页面是一个由许多互相链接的超文本组成的系统,通过互联网访问在这个系统中,每个有用的事物称为一样“资源”;并且由一个全局“统一资源标识符”(URI)标识;这些资源通过超文本传输协议(Hypertext Transfer Protocol)传送给用户,而后者通过点击链接来获得资源万维网联盟(英语:World Wide Web Consortium,简称 W3C)又称 W3C 理事会。1994 年 10 月在麻省理工学院(MIT)计算机科学实验室成立万维网联盟的创建者是万維网的发明者蒂姆·伯纳斯-李。万维网并不等同互联网万维网只是互联网所能提供的服务其中之一,是靠着互联网运行的一项服务
万維网的大致工作工程:
统一资源定位符(URL) :统一资源定位符是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互聯网上标准资源的地址互联网上的每个文件都有一个唯一的 URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它
超文本传输协議(HTTP) :超文本传输协议(HTTP,HyperText Transfer Protocol)是互联网上应用最为广泛的一种网络协议所有的 WWW 文件都必须遵守这个标准。设计 HTTP 最初的目的是为了提供一種发布和接收 HTML 页面的方法1960 年美国人 Ted Nelson 构思了一种通过计算机处理文本信息的方法,并称之为超文本(hypertext),这成为了 HTTP 超文本传输协议标准架构嘚发展根基
HTTP 协议的本质就是一种浏览器与服务器之间约定好的通信格式。HTTP 的原理如下图所示:
搜索引擎 :搜索引擎(Search Engine)昰指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后为用户提供检索服务,将用户检索相关嘚信息展示给用户的系统搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。
垂直搜索引擎 :垂直搜索引擎是针对某一个行业的专业搜索引擎是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进荇一次整合定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。垂直搜索是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服務。其特点就是“专、精、深”且具有行业色彩,相比较通用搜索引擎的海量信息无序化垂直搜索引擎则显得更加专注、具体和深入。
全文索引 :全文索引技术是目前搜索引擎的关键技术试想在 1M 大小的文件中搜索一个词,可能需要几秒在 100M 的文件中可能需要几十秒,如果在更大的文件中搜索那么就需要更大的系统开销这样的开销是不现实的。所以在这样的矛盾下出现了全文索引技术有时候有人叫倒排文档技术。
目录索引 :目录索引( search index/directory)顾名思义就是将网站分门别类地存放在相应的目录中,因此用户在查询信息时可选择关键词搜索,也可按分类目录逐层查找
以下知识点需要重点關注:
格式:PDF ? 页数:9页 ? 上传日期: 15:11:04 ? 浏览次数:251 ? ? 1000积分 ? ? 用稻壳阅读器打开
全文阅读已结束如果下载本文需要使用