手把手教你网站日志分析与找错

湖南SEO磐石网络  2017-03-29 14:06  阅读 536 次

只要搜索引擎抓取网站内容一定会在服务器上留下信息,这个信息就保存在网站日志文件里,我们通过网站日志可以了解搜索引擎的访问情况。其实网站日志文件就像飞机上的黑匣子,我们可以通过这个日志了解很多信息,那么问题来了,我们该如何分析网站日志呢?

一、网站日志在哪里下载

首先很多IDC空间商虚拟主机后台都有一个网站日志,这里湘潭SEO小编就拿万网主机来做个示范:

如上图所示,在主机管理后台就很明显的可以看到有个网站日志下载的入口,每一个网站日志类型都是.log后缀,所有网站日志都是按照日期来进行命名,我们只须选择点击下载即可。

当然还有一种方法就是通过FTP来下载,如下图:

网站日志一般都会在wwwlogs文件夹里面,我只须通过FTP工具下载即可。

二、查看网站日志

首先我们用EditPlus打开刚刚下载的网站日志,这里可能有朋友要问了,下载下来的.log网站日志不是用默认的记事本就可以打开么?为什么一定要用EditPlus?这个当然可以用记事本直接打开,如果文件过大 达到1MB 2MB了呢?用记事本打开肯定会变卡,甚至打不开,所以湘潭SEO小编还是推荐大家使用EditPlus来打开网站日志文件,又快速有不会死机。EditPlus下载

三、利用WPS表格来制作网站日志数据库

1、删除无用代码

如上图所示,打开后就是一大串的字符,首先顶部为服务器的一些信息,#Fields: 后面才是我们需要关注的内容,我们可以把#Fields: 之前的信息都删掉,这样有利于我们进行下一步的操作。

2、把网站日志文件转换成TXT格式

删除无用信息之后选择文件→另存为,然后选择保存为TXT格式。

3、用WPS表格导入网站日志文件

⑴先用鼠标选择第一行第一格;

⑵选择顶部数据菜单;

⑶选择右侧导入数据按钮;

如上图所示点击选择数据源,然后选择刚刚导出的TXT格式网站日志。(WPS表格只能够导入TXT格式,所以这就是为什么上面我们要把.log文件转换成TXT文件的原因了)

进入文件转换选项,这里什么都不用管,直接点击下一步。

这一步我们一定要选择“分割符号”选项来保证表格的美观。

在空格前面打钩,这样的做法就是利用网站日志里面的格式来自动生成表格,然后再点击下一步,这一步什么都不用管,直接点击完成就可以了。

如上图所示,完成后就是一个完整的数据表格。

4、网站日志的参数标签中文说明

网站日志的表格制作好了,但是肯定会有很多朋友发现顶部标题完全看不懂,这里湘潭SEO小编就来为大家翻译说明一下:

* date(日期)    2007-11-17

* time(时间)    16:02:09

* cs-method(方法)   GET

* cs-uri-stem(URI资源) /jianyafa/gansu/zamusishuidianzhan.html //代表访问的资源是当前这个文件

* s-port(服务器端口)  80

* c-ip(客户端IP)  220.181.108.106(实际是网站所在服务器的IP)

* cs(User-Agent)  Baiduspider+(+http://www.baidu.com/search/spider.htm) //百度在收录你呢

* sc-status(协议状态)  200 //200表示OK

* sc-substatus(协议子状态) 0

* sc-win32-status(Win32状态) 0

* sc-bytes(发送的字节数)  13015 //表示当前文件的大小

* 日期 date

* 时间 time

* 客户IP地址 c-ip

* 用户名 cs-username

* 方法 cs-method

* URI资源 cs-uri-stem

* 协议状态 sc-status

* 发送字节数 sc-bytes

* 协议版本 cs-version

* 用户代理 cs(User-Agent)

* 参照 cs(Referer)

四、网站日志的分析与找错

上面磐石网络小编给大家翻译了网站日志的参数说明,实际上我们进行网站日志分析与找错的时候根本用不到那么多,数据太多了看上去也眼花,所以我们得把表格精简一下,抛弃无用信息,留下便于自己分析的数据。

1、删减无用网站日志标签

这里我们只保留:“日期date”、“时间 time”、“方法 cs-method”、“cs-uri-stem(URI资源)”、“客户IP地址 c-ip”、“用户代理 cs(User-Agent)”、“协议状态 sc-status”这五项,删除其他无用标签之后是不是瞬间感觉网站日志数据看上去清晰很多了呢!

2、利用网站分析蜘蛛抓取页面

点击顶部筛选按钮,然后在用户代理 cs(User-Agent)这一栏点击下拉,出现内容筛选的选项,这里我们只需要搜索baiduspider(百度蜘蛛名称)就会出现所有百度蜘蛛代码,点击确定表格上就指挥展现关于baiduspider的网站日志数据了。

然后我们可以利用“日期date”、“时间 time”、“方法 cs-method”、“cs-uri-stem(URI资源)”这四项来判断百度蜘蛛何时来访问了哪个页面哪个资源。

3、通过网站日志找出错误页面

日志找错我们主要是看“协议状态 sc-status”标签,如果是200的话,那么就是属于正常访问,如果是404的话,那么我们就应该及时处理这个错误页面。不懂的话可以看看湘潭SEO小编之前发过的文章:常见的http状态码及状态码说明

4、通过网站日志处理黑客攻击

网站被黑客攻击了怎么办?我们可以利用网站日志的“方法 cs-method”、“cs-uri-stem(URI资源)”这两个标签来判断黑客攻击的目的,使用什么方法攻击哪个页面,然后我们再来进行相应的调整来制止黑客攻击。

总结:网站日志分析是我们做SEO优化的一个重要环节,每天做一个网站日志分析是一个好习惯,湘潭SEO小编说了这么多,实际上操作起来还是不难的,最重要的是你要去操作,光看看是学不会的,更多方法还得由你自己去发掘,当然网站日志分析方法不止这一个,之前湘潭SEO小编介绍过网站日志分析利器-光年日志分析软件,个人觉得用WPS表格来分析比较全面,当然你也可以选择用光年日志分析软件,只要能达到网站日志分析效果就行。

本文地址:http://www.xiangtanseo.com/seojishu/268.html
关注我们:请关注一下我们的微信公众号:扫描二维码,公众号:aiboke112
版权声明:本文为原创文章,版权归 湖南SEO磐石网络 所有,欢迎分享本文,转载请保留出处!

发表评论


表情