网站的日志,是由服务器生成,它记录用户和网站的交互信息,它通过状态码呈现,站长常常对他不屑一顾。实际上日志是一个重要的数据,它能直观展示网站的用户访问网站的状态,爬虫的抓取频率等数据。网站日志分析,我们必须要做而且容易忽略的操作。武汉SEO和大家一起来看看。
一、网站日志你可以看到什么
1、服务器的一些错误请求信息;
2、用户访问时间,访问的页面,来访的IP,搜索引擎抓取的页面,以及一些错误的请求。
二、网站日志查看方法
1、虚拟主机
通常虚拟主机的网站日志,存放在根目录下面的log文件夹里,如果你没有发现,可以到主机的管理控制面部生成网站日志,实在不行,就联系主机商。
2、IIS服务器
查看win主机网站日志非常简单,以win2008为例,打开服务器管理器,选择IIS管理器,选择目标网站,然后在控制面部中就可以查看与操作。
三、日志分析你可以选择的工具
日志分析工具不太多,通常站长使用的免费工具有:光年SEO日志分析系统、逆火网站日志分析器、Web Log Explorer。通过这些工具,你可以得出以下数据
1、用户访问页面的次数。
2、用户来访特定的关键词。
3、各大搜索引擎爬虫抓取的频次。
4、状态码:用户状态码和蜘蛛状态码,常见的状态码包括:404、200、301、302、304状态码等。
四、如何通过日志分析对SEO工作进行改进
1、抓取页面量和流量的分配(一般抓得多的页面权重高,是否着陆合适的关键词);
2、是否有垃圾页面抓取(手机页,带参数的页面,个人profile,各种非200响应码等等);
3、抓取是否有断档,可能是服务器或者程序出了问题;
4、抓取能覆盖到页面的比例是多少,链接是否有问题。
附:网站日志代码大全
1xx-信息提示
这些状态代码表示临时的响应。客户端在收到常规响应之前,应准备接收一个或多个1xx响应。
100-继续。
101-切换协议。
2xx-成功
这类状态代码表明服务器成功地接受了客户端请求。
200-确定。客户端请求已成功。
201-已创建。
202-已接受。
203-非权威性信息。
204-无内容。
205-重置内容。
206-部分内容。
3xx-重定向
客户端浏览器必须采取更多操作来实现请求。例如,浏览器可能不得不请求服务器上的不同的页面,或通过代理服务器重复该请求。
301-对象已永久移走,即永久重定向。
302-对象已临时移动。
304-未修改。
307-临时重定向。
4xx-客户端错误
发生错误,客户端似乎有问题。例如,客户端请求不存在的页面,客户端未提供有效的身份验证信息。400-错误的请求。
401-访问被拒绝。IIS定义了许多不同的401错误,它们指明更为具体的错误原因。这些具体的错误代码在浏览器中显示,但不在IIS日志中显示:
401.1-登录失败。
401.2-服务器配置导致登录失败。
401.3-由于ACL对资源的限制而未获得授权。
401.4-筛选器授权失败。
401.5-ISAPI/CGI应用程序授权失败。
401.7–访问被Web服务器上的URL授权策略拒绝。这个错误代码为IIS6.0所专用。
403-禁止访问:IIS定义了许多不同的403错误,它们指明更为具体的错误原因:
403.1-执行访问被禁止。
403.2-读访问被禁止。
403.3-写访问被禁止。
403.4-要求SSL。
403.5-要求SSL128。
403.6-IP地址被拒绝。
403.7-要求客户端证书。
403.8-站点访问被拒绝。
403.9-用户数过多。
403.10-配置无效。
403.11-密码更改。
403.12-拒绝访问映射表。
403.13-客户端证书被吊销。
403.14-拒绝目录列表。
403.15-超出客户端访问许可。
403.16-客户端证书不受信任或无效。
403.17-客户端证书已过期或尚未生效。
403.18-在当前的应用程序池中不能执行所请求的URL。这个错误代码为IIS6.0所专用。
403.19-不能为这个应用程序池中的客户端执行CGI。这个错误代码为IIS6.0所专用。
403.20-Passport登录失败。这个错误代码为IIS6.0所专用。
404-未找到。
404.0-(无)–没有找到文件或目录。
404.1-无法在所请求的端口上访问Web站点。
404.2-Web服务扩展锁定策略阻止本请求。
404.3-MIME映射策略阻止本请求。
405-用来访问本页面的HTTP谓词不被允许(方法不被允许)
406-客户端浏览器不接受所请求页面的MIME类型。
407-要求进行代理身份验证。
412-前提条件失败。
413–请求实体太大。
414-请求URI太长。
415–不支持的媒体类型。
416–所请求的范围无法满足。
417–执行失败。
423–锁定的错误。
5xx-服务器错误
服务器由于遇到错误而不能完成该请求。
500-内部服务器错误。
500.12-应用程序正忙于在Web服务器上重新启动。
500.13-Web服务器太忙。
500.15-不允许直接请求Global.asa。
500.16–UNC授权凭据不正确。这个错误代码为IIS6.0所专用。
500.18–URL授权存储不能打开。这个错误代码为IIS6.0所专用。
500.100-内部ASP错误。
501-页眉值指定了未实现的配置。
502-Web服务器用作网关或代理服务器时收到了无效响应。
502.1-CGI应用程序超时。
502.2-CGI应用程序出错。application.
503-服务不可用。这个错误代码为IIS6.0所专用。
504-网关超时。
505-HTTP版本不受支持。
网站日志分析很简单,有问题对照状态码处理即可。以上内容来自于互联网,观点仅供参考。