百分百源码网-让建站变得如此简单! 登录 注册 签到领金币!

主页 | 如何升级VIP | TAG标签

当前位置: 主页>网站教程>服务器> linux下apache日志处理:记录搜索引擎抓取
分享文章到:

linux下apache日志处理:记录搜索引擎抓取

发布时间:01/15 来源: 浏览: 关键词:
通常用户在做apache日志记录时都会把用户访问日志与搜索引擎访问日志在一个文件中了,但有时为了方便优化网站我们需要只记录搜索引擎抓取了,那么要如何配置呢?下面来看看。

1、 识别搜索引擎:

在“/etc/httpd/conf/httpd.conf”文件“LogFormat”前面添加如下内容,用来判断是蜘蛛抓取还是真实用户访问:

SetEnvIfNoCase User-Agent "(Googlebot|Mediapartners-Google|Baiduspider|MSNBot|sogou spider|Sosospider|YodaoBot|Yahoo|Yahoo)" robot

2、 定义日志格式:

在“httpd.conf”文件“LogFormat”下面添加一行,设置一个新的日志格式:

LogFormat "%{%Y-%m-%d %H:%M:%S}t %>s %V %h %b %r \"%{User-agent}i\" \"%{Referer}i\"" big

3、 记录搜索引擎日志:

如果服务器上面架了多个站点,就在"VirtualHost"中新增下面一行,否则就在httpd.conf中“CustomLog”下面新增下面一行:

CustomLog logs/weiyule.cn-robot big env=robot

上面的big是第二步定义的日志格式,robot是第一步的判断是否为搜索引擎的变量。

4、测试配置文件并重新加载配置文件:

httpd -t
service httpd reload

注意:如果要按日志生成apache日志文件可以如下写

LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combined
CustomLog "|bin/rotatelogs.exe -l logs/www.111cn.net/access-%Y-%m-%d.log 86400" combined

这样在apache logs下的www.111cn.net目录就会生成按日期生成日志文件了 access-2015-05-21.log 了哦。

打赏

打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,你说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

百分百源码网 建议打赏1~10元,土豪随意,感谢您的阅读!

共有8人阅读,期待你的评论!发表评论
昵称: 网址: 验证码: 点击我更换图片
最新评论

本文标签

广告赞助

能出一分力是一分吧!

订阅获得更多模板

本文标签

广告赞助

订阅获得更多模板