如何通过IIS网站日志分析软件网站的情况

常用软件推荐
原创软件推荐
网站日志分析工具能快速分析IIS站点的日志文件,让您对百度,Google等蜘蛛的爬行记录一目了然。选择日志目录:可以自行定义常用的站点,以及站点的日志目录,方便随时打开查看,只需一次设置,以后直接选择。来访记录分析:可以指定分析单个日志文件或同时分析所有日志文件,指定要分析的蜘蛛类型,指定响应代码比如404。来访次数分析:可以指定分析单个日志文件或同时分析所有日志文件,列出每个日志文件内每种蜘蛛来访的次数。设置蜘蛛表示:软件自带常用的蜘蛛标识,您可以自己设置新的蜘蛛标识,以分析陌生蜘蛛(比如国外蜘蛛)的记录。时差矫正:矫正Windows系统IIS日志内记录时间早8小时的问题,用户看日志不用再自己加8小时了,非常直观。
高速下载器地址
适合机型:三星Note4,三星Note4 ROM
Android版本:6.0.1
ROM大小:1370.00 MB
本站提供的软件会测试再上传,但无法保证所有软件都没有问题,如果您发现链接错误或其它问题,请在评论里告诉我们!
下载点支持点击下载(IE图标)或(迅雷图标),若直接点击下载速度太慢,请尝试点击其他的下载点,若文件太大请使用高速下载器。为确保下载的文件能正常使用,请使用最新版本解压本站软件。
建议大家谨慎对待所下载的文件,大家在安装的时候务必留意每一步!关于或的有关提示,请自行注意选择操作。
本站所有资源均是软件作者、开发商投稿、网上搜集,任何涉及商业盈利目的均不得使用,否则产生的一切后果将由您自己承担!将不对任何资源负法律责任。所有资源请在下载后24小时内删除。我们只能通过各种系统日志来分析网站的运行状况,对于部署在IIS上的网站来说,IIS日志提供了最有价值的信息,我们可以通过它来分析网站的响应情况,来判断网站是否有性能问题,或者存在哪些需要改进的地方
对于一个需要长期维护的网站来说,如何让网站长久稳定运行是件很有意义的事情。有些在开发阶段没有暴露的问题很有可能就在运维阶段出现了,这也是很正常的。还有些时候,我们希望不断地优化网站,让网站更快速的响应用户请求,这些事情都发生在开发之后的运维阶段。
与开发阶段不同的,运维阶段不可能让你去调试程序,发现各类问题,我们只能通过各种系统日志来分析网站的运行状况,对于部署在IIS上的网站来说,IIS日志提供了最有价值的信息,我们可以通过它来分析网站的响应情况,来判断网站是否有性能问题,或者存在哪些需要改进的地方。
IIS日志包含了哪些信息
我前面说到【IIS日志提供了最有价值的信息】,这些信息有哪些呢?看看这个截图吧:
这里面记录了:1. 请求发生在什么时刻,2. 哪个客户端IP访问了服务端IP的哪个端口,3. 客户端工具是什么类型,什么版本,4. 请求的URL以及查询字符串参数是什么,5. 请求的方式是GET还是POST,6. 请求的处理结果是什么样的:HTTP状态码,以及操作系统底层的状态码,7. 请求过程中,客户端上传了多少数据,服务端发送了多少数据,8. 请求总共占用服务器多长时间、等等。
这些信息在分析时有什么用途,我后面再说。先对它有个印象就可以了。
IIS日志的配置
默认情况下,IIS会产生日志文件,不过,还是有些参数值得我们关注。IIS的设置界面如下(本文以 IIS 8 的界面为例)。
在IIS管理器中,选择某个网站,双击【日志】图标,请参考下图:
此时(主要部分)界面如下:
在截图中,日志的创建方式是每天产生一个新文件,按日期来生成文件名(这是默认值)。说明:IIS使用UTC时间,所以我勾选了最下面的复选框,告诉IIS用本地时间来生成文件名。
点击【选择字段】按钮,将出现以下对话框:
注意:【发送的字段数】和【接收的字节数】默认是没有选择的。建议勾选它们。至于其它字段,你可以根据需要来决定是否要勾选它们。
如何分析IIS日志
如果你按照我前面介绍的方法设置了IIS日志参数,那么IIS在处理请求后(的一段时间之后),会生成IIS日志。我们可以在【日志界面】的右边区域【操作】中点击【查看日志文件】快速定位到IIS日志的根目录,然后到目录中寻找相应的日志文件(默认会根据应用程序池序号来区分目录)。
比如:我找到了我需要的日志:
这个文件一大堆密密麻麻的字符,现在我该如何分析它呢?
的工具就可以专门解析IIS日志,我们可以用它来查看日志中的信息。比如我可以运行下面的命令行(说明:为了不影响页面宽度我将命令文本换行了):
"C:\Program Files\Log Parser 2.2\LogParser.exe" -i:IISW3C -o:DATAGRID "SELECT c-ip,cs-method,s-port,cs-uri-stem,sc-status,sc-win32-status,sc-bytes,cs-bytes,time-taken FROM u_ex130615.log"
现在就可以以表格形式来阅读IIS日志了:
说明:我不推荐用这种方法来分析IIS日志,原因有二点:1. 慢:当日志文件稍大一点的时候,用它来分析就比较浪费时间了(尤其是需要多次统计时)。2. 不方便:它支持的查询语法不够丰富,没有像SQL Server针对数据表查询那样全面。
推荐的IIS日志分析方法
虽然Log Parser支持将解析的IIS日志以表格形式供人阅读,但是有时候我们需要再做一些细致分析时,可能会按不同的方式进行【多次】查询,对于这种需求,如果每次查询都直接运行Log Parser,你会浪费很多时间。幸运的是,Log Parser支持将解析结果以多种格式导出(以下为帮助文档截图):
在此,我建议选择输出格式为 SQL 。注意:这里的SQL并不是指SQLSERVER,而是指所有提供ODBC访问接口的数据库。我可以使用下面的命令将IIS日志导入到SQLSERVER中(说明:为了不影响页面宽度我将命令文本换行了):
"C:\Program Files\Log Parser 2.2\logparser.exe"
'D:\Temp\u_ex130615.log'
to MyMVC_WebLog" -i:IISW3C -o:SQL -oConnString:"Driver={SQL Server};server=localhost\database=MyTestDb;Integrated Security=SSPI" -createtable:ON
导入完成后,我们就可以用熟悉的SQLSERVER来做各种查询和统计分析了,例如下面的查询:
SELECT cip,csmethod,sport,csuristem,scstatus,scwin32status,scbytes,csbytes,timetaken FROM dbo.MyMVC_WebLog
如果如下:
注意:1. IIS日志在将结果导出到SQLSERVER时,字段名中不符合标识符规范的字符将会删除。&&&例如:c-ip 会变成 cip, s-port 会变成 sport 。2. IIS日志中记录的时间是UTC时间,而且把日期和时间分开了,导出到SQLSERVER时,会生成二个字段:&&&
date, time这二个字段看起来很不舒服,对吧?我也很反感这个结果,下面来说说的二种解决方法:
1. 在SQLSERVER中增加一列,然后把UTC时间换成本地时区的时间,T-SQL脚本如下:
alter table MyMVC_WebLog add RequestTime datetimegoupdate MyMVC_WebLog set RequestTime=dateadd(hh,8,convert(varchar(10),date,120)
+ ' ' + convert(varchar(13),time,114))
2. 直接在导出IIS日志时,把时间转换过来,此时要修改命令:
"C:\Program Files\Log Parser 2.2\logparser.exe"
"SELECT TO_LOCALTIME(TO_TIMESTAMP(ADD(TO_STRING(date, 'yyyy-MM-dd '), TO_STRING(time, 'hh:mm:ss')), 'yyyy-MM-dd hh:mm:ss')) AS RequestTime, *
'D:\Temp\u_ex130615.log'
MyMVC_WebLog2" -i:IISW3C -o:SQL -oConnString:"Driver={SQL Server};server=localhost\database=MyTestDb;Integrated Security=SSPI"-createtable:ON
再看这三列:
select RequestTime, date, time from MyMVC_WebLog2
这样处理后,你就可以直接把date, time这二列删除了(你也可以在导出IIS日志时忽略它们,但要明确指出每个字段名)。
IIS日志中的UTC时间问题就说到这里,但愿每个人都懂了~~~~~~~~~~~
IIS日志中的异常记录
IIS日志中记录了每个请求的信息,包括正常的响应请求和有异常的请求。
这里所说的【异常】与 .net framework 中的异常没有关系。对于一个ASP.NET程序来说,如果抛出一个未捕获异常,会记录到IIS日志中(500),但我所说的异常不仅限于此。
本文所说的异常可分为四个部分:1. (ASP.NET)程序抛出的未捕获异常,导致服务器产生500的响应输出。2. 404之类的请求资源不存在错误。3. 大于500的服务器错误,例如:502,5034. 系统错误或网络传输错误。
前三类异常可以用下面的查询获得:
select scStatus, count(*) AS count, sum(timetaken * 1.0) /1000.0 AS sum_timetaken_secondfrom MyMVC_WebLog with(nolock)group by scStatusorder by 3 desc
IIS日志中有一列:sc-win32-status ,它记录了在处理请求过程中,发生的系统级别错误,例如网络传输错误。正常情况下,0 表示正常,出现非零值意味着出现了错误。我们可以这样统计这类错误
declare @recCselect @recCount = count(*) from MyMVC_WebLog with(nolock)select scWin32Status, count(*) AS count, (count(*) * 100.0 / @recCount) AS [percent] from MyMVC_WebLog with(nolock)where scWin32Status & 0group by scWin32Statusorder by 2 desc
下表列出了比较常见的与网络相关的错误及解释:
scWin32Status
客户端连接已关闭(或者断开)
本地网络中断
所有状态码都可以通过下面的命令来获取对应的解释:
D:\Temp&net helpmsg 64指定的网络名不再可用。
关于scwin32status与scStatus,我还想补充说明一下:它们没有关联。比如请求这个地址:/test.aspx有可能scStatus=200,但scwin32status=64,此时表示ASP.NET已成功处理请求,但是IIS在发送响应结果时,客户端的连接断开了。另一种情况是:scStatus=500,但scwin32status=0,此时表示,在处理请求过程中发生了未捕获异常,但异常结果成功发送给客户端。
再谈 scwin32status=64
记得以前看到 scStatus=200,scwin32status=64 这种情况时很不理解,于是搜索了互联网,各种答案都有,有的甚至说与网络爬虫有关。为了验证各种答案,我做了一个试验。我写一个ashx文件,用它来模拟长时间的网络传输,代码如下:
public class Test_IIS_time_taken : IHttpHandler {
public void ProcessRequest (HttpContext context) {
context.Response.ContentType = "text/plain";&/p&& p&
System.Threading.Thread.Sleep(1000 * 2);
context.Response.Write(string.Format("{0}, {1}\r\n", "Start", DateTime.Now));
context.Response.Flush();
System.Threading.Thread.Sleep(1000 * 2);&/p&& p&
for( int i = 0; i & 20; i++ ) {
context.Response.Write(string.Format("{0}, {1}\r\n", i, DateTime.Now));
context.Response.Flush();
System.Threading.Thread.Sleep(1000 * 1);
context.Response.Write("End");
段代码很简单,我不想做过多的解释,只想说一句:我用Thread.Sleep与Response.Flush这二个方法来模拟一个长时间的持续发送过程。
我们可以在浏览器中看到这样的输出(显示还没有完全结束时我截图了)
我把这个测试做了8次,只有2次是全部显示完成了,其余6次我提前关闭了浏览器窗口。然后,我们再来看IIS日志的内容:
根据IIS日志并结合我自己的操作可以发现:1. 当我提前关闭浏览器窗口时,就会看到scStatus=200,scwin32status=642. 如果请求内容全部显示完成,我就会看到scStatus=200,scwin32status=0从这个试验我们还可以发现:timeTaken 包含了网络传输时间。
根据这个试验的结果,你是否想过一个问题:如果你的网站的IIS日志中出现了大量的scStatus=200,scwin32status=64,而且请求是由用户的浏览器发起的。这是什么原因造成的呢?我的【猜想】是:用户在访问这个网站时已经不愿意再等待了,他们把浏览器窗口关掉了。换句话说:可以从scwin32status=64的统计结果看出网站的响应速度是否能让用户满意。
寻找性能问题
IIS日志中有一列叫:timeTaken,在IIS的界面中显示了它的含义:所有时间。这个所用时间的定义是:从服务端收到请求的第一个字节开始起,直到把所有响应内容发送出去为止的时间。微软的网站有对这个字段做过说明:/kb/944884
知道了timeTaken的定义后,我们就可以利用它来分析一些请求的处理时间,即性能分析。
例如,我想查看最慢的20个页面的加载情况,可以这样查询:
select top 20 csuristem,scstatus,scwin32status,scbytes,csbytes,timetakenfrom dbo.MyMVC_WebLog with(nolock)where csUriStem like '/Pages/%'order by timeTaken desc
再或者我想再看看最慢的20个AJAX情况的响应情况,可以这样查询:
select top 20 csuristem,scstatus,scwin32status,scbytes,csbytes,timetakenfrom dbo.MyMVC_WebLog with(nolock)where csUriStem like '/Pages/%'order by timeTaken desc
再或者我想再看看最慢的20个AJAX情况的响应情况,可以这样查询:
select top 20 csuristem,scstatus,scwin32status,scbytes,csbytes,timetakenfrom dbo.MyMVC_WebLog with(nolock)where csUriStem like '/ajax/%'order by timeTaken desc
总之,寻找性能问题的方法就是:在查询选择timeTaken字段,并且用它做降序排序。
注意:scbytes,csbytes 这二个字段也是值得我们关注的:1. csbytes如果过大,我们就要分析一下到底是不是因为表单包含了过多的无用数据,可否将表单拆分。&&&csbytes变大还有一种可能:Cookie太大,但它会表现为很多请求的csbytes都偏大,因此容易区分。2. scbytes如果过大,我们就要检查页面是否没有分页,或者可以考虑用按需加载的方式来实现。典型的情况是:当大量使用ViewState时,这二个值都会变大。因此我们能通过IIS日志发现ViewState的滥用问题。还有一种特殊情况是:上传下载文件也会导致这二个数值变大,原因我就不解释了。
scbytes,csbytes,不管是哪个数值很大,都会占用网络传输时间,对于用户来说,就需要更长的等待时间。
一下子说了三个字段,在寻找性能问题时,到底该参考哪个呢?我认为:应该优先关注timeTaken,因为它的数值直接反映了用户的等待时间(不包括前端渲染时间)。如果timeTaken过大时,有必要检查scbytes,csbytes是否也过大,如果后二者也过大,那么优化的方向就是减少数据传输量,否则表示是程序处理占用了大量的时间,应该考虑优化程序代码。
寻找可改进的目标
除了可以从IIS日志中发现性能问题,还可以用它来寻找可改进的目标。例如:1. 有没有404错误?2. 是否存在大量的304请求?3. 是否存在大量重复请求?
当发现有404响应时,我们应该分析产生404的原因:1. 是用户输入错误的URL地址吗?2. 还是开发人员引用不存在的资源文件?如果是后者,就应该尽快移除无效的引用,因为404响应也是一个页面响应,而且它们也会占用网络传输时间,尤其是这类请求不能缓存,它会一直出现,浪费网络资源。
http://www.jb51.net/os/windows/Win.html
阅读(...) 评论()当前位置: >
从网站的IIS日志分析蜘蛛爬行情况
【导读】从网站的IIS日志分析蜘蛛爬行情况,来了解一下网站运行中,搜索引擎蜘蛛爬行情况。 先下载IIS日志文件。如果你有自己独立的服务器,那最好,在IIS信息服务窗口中,点击要设置的网
从网站的IIS日志分析蜘蛛爬行情况,来了解一下网站运行中,搜索引擎蜘蛛爬行情况。
先下载IIS日志文件。如果你有自己独立的服务器,那最好,在IIS信息服务窗口中,点击要设置的网站的属性,在&网页&选项卡中你可以看到&启动日志记录&项,可以设置日志的保存位置、日志的记录格式等等,虚拟主机用户比较麻烦,可以通过空间商提供的后台生成IIS日志,如万网中称为&weblog日志下载&。看各自情况。
找到了IIS日志文件,然后把它下载下来,用ultraedit将其打开(为什么不用记事本打开呢?记事本要打开一个几十M、上百M的文本文件,其速度实在是不能让人忍受)。下面就以开心网的IIS日志为例进行一下分析演示:
首先:通过IIS日志了解搜索引擎的到访记录:
  用ultraedit打开后,按CTRL+F键,弹出窗口,输入Googlebot,按回车,在新窗口中显示的页面就是google机器人的到访问记录,选中其中之一双击,可以看到访问的时间和页面,在这里要注意的是所显示的时间是国际标准时间,所以要在这个时间上加8个小时,这样才是北京时间,如果是自己的独立服务器可以设置为北京时间,这里就不详述了。我们继续查找Baiduspider可以看到baidu蜘蛛的爬行记录。其他搜索引擎通过查找如Yahoo、Sogou、msnbot、YodaoBot& 比如我们新做了一个网站,也在和google中提交了,可是site站点的时候就是看不到收录的页面,这时我们就可以利用上面的方法查看一下IIS日志,只要和google等搜索引擎的蜘蛛已经爬行过我们的站点了,我们就不用担心网站的收录问题了,搜索引擎会慢慢的放出已经抓取的页面,站长们继续增加内容就行了。通过此项查找还可以了解搜索引擎的到访时间和抓取页面的时间及频率。上面是通过IIS日志查看搜索引擎的爬行记录,可能有人会问了,为什么搜索引擎的爬行记录不能被流量统计工具统计到?因为流量统计代码是采用JS调用的方式,搜索引擎蜘蛛爬行时不会调用JS文件。我们可以自己写个流量统计功能,然后include流量统计功能的这个动态页面到各个页面中,这样所有对页面的访问就都可以统计到了,并且通过agent参数,可以判断来自哪个搜索引擎,这里不再详述。
第二,通过IIS日志查找网站是否存在死链接:在用ultraedit打开的IIS日志文件中按CTRL+F键,在出现的窗口中,选中第一和第三个复选框,输入404,然后按回车,看看在弹出的窗口中有没有找到记录。如果找到,说明你的网站存在死链接,大家都知道死链接对网站的收录是有影响的,怎么去处理就不用我说了吧。
  下面是搜索404时我的网站IIS日志中出现的几条记录:
   16:05:08 GET /Login.asp - 60.182.153.56 HTTP/1.1 Mozilla/3.0+(+Indy+Library) - 404 0 1003
   16:05:08 POST /Login.asp - 60.182.153.56 HTTP/1.1 Mozilla/3.0+(+Indy+Library) //web/column.asp?cid=1 404 0 1003
   16:05:08 GET /reg.asp - 60.182.153.56 HTTP/1.1 Mozilla/3.0+(+Indy+Library) /web/column.asp?cid=1 404 0 1003
   16:05:09 POST /reg.asp - 60.182.153.56 HTTP/1.1 Mozilla/3.0+(+Indy+Library) /web/column.asp?cid=1 404 0 1003
  相信有经验的站长都明白了吧?这是有人在用一些漏洞扫描工具对网站进行漏洞测试,看看有没有漏洞,使用通用的CMS、DIG、BBS、BLOG系统的站长可要注意了,你所用的网页程序如果有漏洞,网站就会有被黑掉的危险!
  第三、通过IIS日志查找网站是否存在程序错误:我们再输入500进行查找,如果查找到相关页面,说明网站 的程序在运行过程中出现了错误,需要对程序进行修改。
  第四、通过IIS日志查找网站是否被入侵过:通过IIS日志可以判断网站是否曾被通过SQL注入过,是怎样被入侵的。在网站IIS日志我们搜索一下%20和&单引号(半角的),看看是否有相关的页面存在,当然不是所有包括%20和&的页面都是被注入页面,但一般的SQL注入都是通过%20(空格的ASC码的16进制值是20)和单引号进行的。此方法可以判断出程序上的漏洞,这样我们可以修改程序防止SQL注入。我曾经用这个办法将网站被SQL注入的全过程及入侵的破坏程度进行了解,然后修改了程序,防止了网站再次被入侵。
  对于apache的日志,分析方法也类似。现在有一些IIS日志分析软件可以帮助我们分析出搜索引擎的到访情况以及404错误的网页,但对于通过网站漏洞被入侵的问题只能靠我们手工查找了。
你也去试试你的网站吧!!!!!
今年又有好多韩国明星要去服兵役了,每年的这个日子都会哭倒一大片粉丝,当然也有
冰桶挑战是什么?als渐冻人症与冰桶挑战的关系 冰桶挑战是什么?als渐冻人症与冰桶挑
我读书少你别骗我出处哪里?是哪部电视剧的台词 图书名称:我读书少,你别骗我 作
高帅粗是什么意思?高帅粗的故事天涯原帖 最近天涯又出来一个神词高帅粗,来自娱乐
么么哒是什么意思,么么哒的真正意思及性暗示意思解读 网络见解 么么一般用于恋爱的
康桑思密达是什么意思?康桑哈密达的意思 康桑思密达 韩文:????? 韩语里是
cos圈是什么?cosplay是什么意思? cosplay是指? 顾名思义,cosplay是英文costume play的简略
屌丝对话体全图、屌丝对话体是什么意思? 屌丝对话体,日,一组被冠以女
电视剧《秦时明月》以秦始皇兼并六国之初,各方势力并存、百家学术争鸣的时
《了不起的挑战》引进自韩国MBC电视台真人秀《无限挑战》,由灿星出品,在原
《芈月传》由甄嬛传导演郑晓龙执导,孙俪、刘涛、方中信、黄轩、高云翔领衔
《007:幽灵党》是《007》系列第24部电影,由丹尼尔·克雷格、蕾雅·赛杜等联袂
Powered by
Inc. Copyright (C)
Copyright &
厦门佰领网络科技有限公司 版权所有 许可证: 闽ICP备号-1轻松教你如何查看网站日志
可能还有很多seoer和一些新手站长们,还不会怎么去分析日志。可能有人会说,会不会分析日志,关我屁事呀!有统计工具不就行了,如果是这样那你就大错特错了。为什么这么说呢?因为日志分析和流量软件分析都可以分析出网站各种流量、受访页情况、关键字数据等数据,除了这几点,日志分析还可以:1、了解搜索引擎抓取网页的问题2、了解网站内容及链接是否正常3、了解网站是否安全而流量软件分析却不能。所以说学会如何去看日志和分析日志,是我们从事seoer必须掌握的一项基础。那么什么又是网站日志呢?网站日志:保存于网站空间内的一种文本文件,用来记录网站运行状态的各种数据,通常是在网站运行的过程中,由服务器程序实时更新记录。网站日志与网站的服务器程序密不可分,不同的服务器程序在生成网站日志时方法相差相大。互联网上常见的服务器程序有:Apache服务器,IIS服务器,Lighttpd服务器下面就以我博客的日志为案列,教大家如何去看日志:第一步:先把日志下载到本地,然后用编辑工具进行打开(我这里使用的是EditPlus),先把不需要的部分进行删除。如图:第二步:新建一个Excel表格,然后点击数据,接着选择导入数据。详细步骤请见下图:第三步:对数据进行筛选(点击开始,数据筛选。以百度蜘蛛访问为例)如图:&一些常见日志的参数说明:日期:date &服务器名:s-computername时间:time &服务器IP:s-ip客户端IP地址:c-ip &服务器端口:s-port用户名:cs-username &方法:cs-method服务名:s-sitename &URI资源:cs-uri-stemURI查询:cs-uri-query &接收的字节数:cs-bytes协议状态:sc-status &所有时间:time-taken协议子状态:sc-substatus &协议版本:cs-versionWIN32状态:sc-win32-status &主机:cs-host发送的字节数:sc-bytes &用户代理:cs &user-agent总结:如果说你将来从事seoer和站长这条路,那么就得学会看网站日志和分析日志。因为这是每个站长的基本功,如果你连日志都不会观看。还谈什么优化呢?本文由段亮个人博客原创,如需转载请注明出处:
如果您觉得文章对你有帮助,可以进行打赏。
打赏多少,您高兴就行,谢谢您对段亮这小子的支持! ~(@^_^@)~
微信扫一扫
支付宝扫一扫
把此文章分享给其它人..
或许你还喜欢以下内容:
评论列表(网友评论仅供网友表达个人看法,并不表明本站同意其观点或证实其描述)
打个比方,有个广场很多人进去了。你就说了哪些人进去了,没然后了 相当于没说
你这没啥用
运达来家具贺
甜美范超模
不错~~~~~~
爱奇趣分享网
我来留下脚印
段亮自媒体博客
第一你的服务器或空间要开启,在就是直接去下载,按照我的方法来就是
怎麼下載網站日誌的哦?
你也想建立一个独立博客?付出不亚于任何人的努力,每天学习一点点,你就离梦想更近了一步!
网站日志记录了网站运营中被访问请求,通过网站日志可以清楚的得知用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪个页面,是否访问成功。对于优化人员来说有重要的作用,不论是针对搜索引擎的优化还是用户需求的分析都提供了数据支持,对于优化方案的建立起到了一定作用,今天小编就给大家分享一下网站IIS日志分析技巧详解。
一、网站日志种类
虽然我们经常把网站日志称为IIS日志,但是其实网站日志是有两种不同的种类,依据主机操作系统来划分,格式略有不同,作用是一样的。
1、window主机网站日志
对于window主机的网站日志就是我们比较熟悉的IIS日志,日志的格式是ex123.log,比如ex150129.log,ex后边是日志的时间以.log结尾。window主机的IIS日志相对信息比较详细,日志都有详细的英文对照,容易理解分析,相对比较简单,
2、Linux主机网站日志
相对于window主机日志Linux主机的日志有一个比较个性的名字阿帕奇日志,它的格式是apache_xxx.log.gz,Apache后边是日志时间.log.gz的一个压缩文件,所以Linux主机的日志下载下来是需要解压的,相对于window主机的IIS日志阿帕奇日志要精简一些没有详细的说明、对照,只保留了重要的信息,所以对于新手来说还是先学会学习window主机的IIS日志在来分析阿帕奇日志会好一点。
二、网站日志分析
网站日志的分析是今天的重点,当然日志的分析也是有不同的方法,可以直接用工具进行分析,也能够人工运用表格来分析,各有利弊。
1、工具分析
网站日志分析可以通过工具来实现,目前比较流行的就是爱站网提供的一款爱站SEO工具包(下载地址:/course/32.html)
(1)点击下载文件,安装之后打开选择网站日志分析。
(2)选择你下载的日志文件,导入确定分析。
(3)查看分析数据结果,总结归纳。
这个工具能够帮助你直接分析网站日志的一些基本情况,主要是针对蜘蛛分析的,像搜索引擎蜘蛛抓取抓取的数量,访问的次数,停留的时间,蜘蛛访问的哪些页面,状态码之类的,通过这个可以了解搜索引擎蜘蛛在你的网站上的一个大致情况,对于优化搜索引擎有一定的帮助作用,但是这个工具有一定的缺陷,它没有兼顾到用户,我们知道网站日志是记录所有访问者的信息,相对于搜索引擎蜘蛛的数量来说更多的是用户信息,那这个工具对于网站用户数据的分析就比较缺失了,所以这个工具我们可以参考。
2、手动表格分析
上面我们看到工具分析日志是有很大缺陷的,不能完整的把日志内容呈现给我们,很多有用的数据没有显示出来,日志的作用没有完全展示出来,那接下来我就给大家分享一个独特的方法来分析网站日志,运用excel表格来分析网站日志。
(1)首先把下载的日志文件的格式.log后缀改为文本模式即.txt结尾的格式。
(2)新建一个excel表格,选择导入数据,选择添加刚刚修改过的文件,点击确定导入。
(3)微调布局,精简日志,把不需要的多余重复的删除,留下重要信息就行分析。
手动表格分析虽然繁琐一点,但是更能了解网站的情况,把握网站全局,非常明确的能够看出网站内容对于搜索引擎和用户的满足度如何,并且能够提升自身的专业水平,对于优化网站具有更好的推动作用,如果这种方法能够熟练掌握,那么分析日志是非常轻松的事情。
想成为一名优秀的SEO优化人员,想以后做一位SEO优化主管,SEO总监,学习网站日志分析是十分必要的,前面说了这么多,都只是方法而已,只有你亲身去做了,才能有真正的收获,只看不做是没有什么效果的,SEO是操作出来的,不是看出来的,希望大家看了这篇文章能有点收获,我是郑州SEO彩虹,更多的会持续更新的,谢谢阅读。
转载请注明: &
or分享 (0)

我要回帖

更多关于 日志分析工具 的文章

 

随机推荐