对于从事SEO工作的人来讲,可能都要对网站的日志进行查看分析,那么服务器必需要配置好蜘蛛日志,才能让我们浏览的更加方便,而Apache服务器的默认的日志功能有两个不是很方便的地方:
1.一个网站只生成了一个日志文件,将每天的日志都存在一个文件中,这样的日志,对于我们每天进行日志分析工作造成了很大的不便。
2.配置好后的Apache服务器,默认是不能看到如:Baiduspider、Googlebot等搜索引擎的的爬行记录,看到的只有IP地址和一些其它的访问参数,如果说要根据访问者的IP地址来判断是否是蜘蛛,估计每天看日志都会累死,再说也木有蜘蛛的访问的IP数据库。
我刚接手的一个网站<http://q.ganglongwudao.com>,自己公司租的服务器,开始接手的时候,网站的日志就存在上面的两个问题,而一般的站长,做站的时候可能都用的是虚拟空间,空间都是自带的日志,不用我们自己操心。而自己管服务器的话,就必需得了解这些东西,找服务器提供商给解决下,半天木回应,哎,还是自己解决算了,估计那边的技术也不会。
在网上找了很多相关的资料看了下,都是写的不清不楚的,讲半天也没讲重点。到一些论坛时提问也木人知道。真着急。。。。
最后在网上找了一篇写的比较全的文章研究了下,然后根据自己的理解很快就将这两个问题解决了,具体解决方法如下:
1.显示蜘蛛访问名称:
在Apache的目录中找到conf这个文件夹,找到httpd.conf这个文件,用记事本打开搜索:“LogFormat”找到如下图的结果,第一条就是可以显示蜘蛛日志的重要所在,他是控制日志生成的格式,其中“{User-Agent}”就是显示蜘蛛记录的地方,在下面我们将用到第一条的最后一个单词“combined”这个变量。
LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combined
LogFormat "%h %l %u %t \"%r\" %>s %b" common
我们继续在httpd.conf这个文件内搜索“<VirtalHost *80>”找到我们自己网站对应的域名,也就是下图中的“ ServerName”对应的:“dummy-host.example.com”这个域名。找到自己要修改的位置看到下面代码,我们只需要将图2中倒数第二行的common改成我们上面说的“combined”,就可以调用“combined”对应的日志格式,默认情况下是调用common对应的日志格式,所以是看不到蜘蛛的记录的。
如果是多站点服务器则是extra目录下的httpd-vhosts.conf文件里面寻找相应站点如下代码:
ErrorLog "logs/site1-error.log"
CustomLog "logs/site1-access.log" common
2.日志分割
在进行日志分割之前,先我们需要下载一个程序,下面是windows和Linux的两个官方下载地址:
Windows+Apache下载地址:<http://cronolog.org/download/cronolog-1.6.1-win32.zip>
Linux+Apache下载地址:<http://cronolog.org/download/cronolog-1.6.2.tar.gz>
下载解压后将cronolog.exe复制到服务器的Apache/bin/下面。
复制好后还是修改刚才的httpd.conf文件,如上图可以按照图2和图3进行对应的修改,图3中的“CustomLog “|G:/ServerPro/Apache/bin/cronolog.exe F:/wwwroot/wwwlogs/%Y%m%d.log” combined”,第一个路径是Apache的安装目录,第二个路径是在放日志的路径及日志文件的命名方式,第三个参数是调用日志内容的格式。完成以上步骤后保存httpd.conf文件,然后重启Apache服务器就可以了。
该文章由深圳seo原创,转载请出名出处!
评论列表: