如何分析网站日志

发布:zhubinbin | 发布时间: 2013年1月29日

网站日志是记录web服务器接收处理请求以及运行时错误等各种原始信息的以.log结尾的文件，确切的讲，应该是服务器日志。通过网站日志可以清楚的得知用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪个页面，是否访问成功。

　　对于专业从事搜索引擎优化工作者而言，网站日志可以记录各搜索引擎蜘蛛机器人爬行网站的详细情况，例如：哪个IP的百度蜘蛛机器人在哪天访问了网站多少次，访问了哪些页面，以及访问页面时返回的HTTP状态码。做为站长的你，如果是需要察看访问统计数据，那用51.la或者百度统计工具就可以了，但是如果你想察看各搜索引擎的蜘蛛是否准时来爬行自己的网站，那就要学会自己查看网站日志文件了。下面郑州seo结合我们自己的网站做为一个实例来做一个介绍：
　　首先利用FTP工具登录服务器端，一般在服务器根目录之下存在一个logs文件夹，这里面装的就是网站日志，当然不同的服务器类型，日志文件的文件夹名称和我介绍的不一样，但没关系，日志文件的扩展名是log。进入日志文件夹，你会发现，日志文件是按每一天的访问情况为一个文件保存的：

　　服务器当月结束后会将当月的日志打包供下载，只要你不人为删除，该日志文件会永远存在。然后随便下载一天的日志文件，用Windows文本工具打开该日志文件，会看到一堆酷似代码的字符，祝文件大小打开速度也不同：

注意看有背景的这一小部分，我用CTRL+F搜索功能查找baiduspider，好吧，为什么要查找baiduspider，这里先普及一下关于搜索引擎蜘蛛的一点小知识，各大搜索引擎的蜘蛛都有名字：
　　百度的叫baiduspider;
　　谷歌的叫Googlebot;
　　微软的叫bingbot;
　　搜狐的叫Sogou web spider;
　　腾讯的叫Sosospider;
　　因为国内主要是以百度为优化对象，我们来看看关于百度蜘蛛爬行记录的信息分析，在日志记录中随便找一个百度蜘蛛的信息：
　　125.90.88.96 - - [07/Sep/2012:19:16:21 +0800] "GET / HTTP/1.1" 200 5374 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)"
　　怎么解读这些信息呢?蜘蛛IP--【访问时间】“获取路径”HTTP反馈值200 反馈字节数5357 百度蜘蛛标记。
　　好吧，这里面获取路径与HTTP反馈值是非常重要的信息，200为正常读取，读取了5374个字节。我们再分析一条记录：
　　220.181.51.118 - - [07/Sep/2012:09:54:15 +0800] "GET /product/disp.php?id=93 HTTP/1.1" 301 249 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)"
　　认真看获取路径这一项，因为我的网站是老域名，原来的主人被收录的路径/product/disp.php?id=93，百度蜘蛛同样爬行，结果我的新网站里肯定不会有这一条信息，由于HTTP反馈了301，而301代表已移动 — 请求的数据具有新的位置且更改是永久的。其实这对于我来说是一件好事，蜘蛛爬行不通，知道这条收录记录已经失效，慢慢就会从百度的收录数据库中删除。现在百度正在审核我的新站点，一天爬行只有23次，也很不错了的。
　　当然，有朋友会说为什么不利用一些日志查看工具，人工手动察看费时费力，是的，有些不错的工具可以提供更便捷的操作，今天郑州seo所述内容旨在用最初级的方法教会大家学会察看自己网站的日志。希望以上内容能对你有点帮助。本文有郑州seo（http://www.zhubinbin.com）整理发布！！