网站首页 蜘蛛池 蜘蛛池技术 正文
以前分享过的记录百度蜘蛛抓取链接为txt的代码只能笼统的实现百度蜘蛛的记录,不能区分百度PC蜘蛛和移动蜘蛛。
现在越来越多的人说百度PC蜘蛛不收录,要移动蜘蛛才行,所以特意编写了这段代码,本代码可区别判断百度PC蜘蛛和移动蜘蛛!
其实核心是对百度蜘蛛是移动还是PC标识的判断,不过一个IF判断而已。
有了这个判断,我们还可以进行延伸,比如写PHP控制屏蔽百度PC蜘蛛抓取,只要百度移动蜘蛛抓取的代码。
好了废话不多说,直接看代码。
<?php //php直接输出蜘蛛日志 function get_naps_bot() { //获取用户UA并转换为小写 $tlc_thispage = strtolower($_SERVER['HTTP_USER_AGENT']); if (strpos($tlc_thispage, 'baiduspider') !== false){ return 'Baidu'; } return false; } //获取当前时间 function nowtime(){ $date=gmdate("Y-n-j H:i:s",time()+8*3600); return $date; } $searchbot = get_naps_bot(); if ($searchbot) { //对页面UA进行处理,它主要是对所有的 GET、POST 和 COOKIE 数据自动运行 addslashes() $useragent = strtolower(addslashes($_SERVER['HTTP_USER_AGENT'])); $url=$_SERVER['REQUEST_SCHEME'].'://'.$_SERVER['HTTP_HOST'].$_SERVER['REQUEST_URI']; if(strpos($useragent,"android") || strpos($useragent,"iphone") || strpos($useragent,"mobile")){ $file="Baidu-Mobile-Spiderlogs.txt";//如果是百度移动蜘蛛,输出到根目录任意命名方便访问即可 }else{ $file="Baidu-Pc-Spiderlogs.txt";//如果是百度PC动蜘蛛,输出到根目录任意命名方便访问即可 } $time=nowtime();//获取当前时间 $data=fopen($file,"a"); fwrite($data,"Time:$time robot:$searchbot URL:$url\n");//输出日志 fclose($data); } ?>
在上面的代码中,为记录UA的含义,以前我们分享过的输出蜘蛛统计代码都用用到,但实际并未调用。
addslashes($_SERVER['HTTP_USER_AGENT'])
其输出的结果如图所示:
为了防止小白看不懂,已经特意做了注释,只要是个人基本上都能看明白。
有时间将会将上述代码加入到蜘蛛统计插件中去,这样更加美观。
- 上一篇: php记录搜索引擎爬行记录的实现代码
- 下一篇: 百度cookie存活检测工具/无需代理IP
必看说明
- 本站中所有被研究的素材与信息全部来源于互联网,版权争议与本站无关。
- 本站文章或仅为文本内容原创,非程序原创。如有侵权、不妥之处,请联系站长第一时间删除。敬请谅解!
- 本站所有内容严格遵守国家法律的条例,所有研究的算法技术均来源于搜索引擎公开默认允许用户研究使用的接口。
- 阅读本文及获取资源前,请确保您已充分阅读并理解《访问曹操SEO网站需知:行为准则》。
- 本站分享的任何工具、程序仅供学习参考编写架构,仅可在本地的虚拟机内断网测试,严禁联网运行或上传搭建!
- 任何资源必须在下载后24个小时内,从电脑中彻底删除。不得传播或者用于其他任何用途!否则一切后果用户自负!
- 转载请注明 : 文章转载自 站群程序 分别统计百度PC蜘蛛和移动蜘蛛并输出txt的php代码
- 本文标题:《分别统计百度PC蜘蛛和移动蜘蛛并输出txt的php代码》
- 本文链接:http://www.zqcx.cn/1771.html
猜你喜欢
- 2024-10-06 关于SEO的一些真诚思考
- 2024-04-01 CCSEO原创蜘蛛统计v1.3
- 2024-01-27 CCSEO原创蜘蛛统计v1.2
- 2023-12-15 实现IP地址屏蔽和白名单功能的php代码
- 2023-10-22 CCSEO原创蜘蛛统计v1.1
- 2023-10-09 ccspider蜘蛛统计插件
- 2023-09-28 CCSEO原创蜘蛛统计v1.0
- 2023-09-28 CCSEO蜘蛛统计数据可视化的拆解
- 2023-09-28 CCSEO蜘蛛统计开发思路
- 2023-09-19 警惕:停止使用蜘蛛统计,小心tongjis.php的后门
你 发表评论:
欢迎- 8336℃遵纪守法:一起举报违法网址
- 7472℃警惕“冒用身份”的电信网络诈骗
- 7457℃备案域名的买卖管控会越来越严,不要尝试!
- 5340℃6月1日是《中华人民共和国网络安全法》实施五周年
- 4538℃违规事件分类与违规信息类型说明
- 4691℃关于严格遵守网络安全法规的公告
- 6693℃百度正打击构造虚假标题等违规站点
- 8188℃「百日行动」“断卡”行动持续发力
- 16158℃懒人开源站群程序V2.4.2:影视模板V2
- 15762℃通过Nginx配置增强网站安全性
- 14728℃搜狐号安全系统升级通知
- 14678℃多线程批量查询百家号文章存活情况
- 12314℃多线程批量查询链接收录情况(免代理)
- 12117℃百家号批量发布软件V1.8.5
- 11531℃企业网站安全漏洞应对:从修复到增强全方位安全新举措
- 8361℃CCSEO原创蜘蛛统计v1.3
- 12-09百家号批量发布软件V2.4.4
- 10-06关于SEO的一些真诚思考
- 08-18罪恶克星:不良网站举报工具填表版
- 05-01多线程批量查询百家号文章存活情况
- 04-22通过Nginx配置增强网站安全性
- 04-22企业网站安全漏洞应对:从修复到增强全方位安全新举措
- 04-21搜狐号安全系统升级通知
- 04-18多线程批量查询链接收录情况(免代理)
- 近期评论
- 文章归档
-
- 2024年10月 (1)
- 2024年8月 (1)
- 2024年5月 (1)
- 2024年4月 (10)
- 2024年3月 (6)
- 2024年1月 (2)
- 2023年12月 (4)
- 2023年11月 (2)
- 2023年10月 (7)
- 2023年9月 (24)
- 2023年8月 (6)
- 2023年7月 (20)
- 2023年6月 (13)
- 2023年5月 (26)
- 2023年4月 (48)
- 2023年3月 (21)
- 2023年2月 (15)
- 2023年1月 (10)
- 2022年12月 (10)
- 2022年11月 (3)
- 2022年10月 (28)
- 2022年9月 (37)
- 2022年8月 (16)
- 2022年7月 (23)
- 2022年6月 (24)
- 2022年5月 (10)
- 2022年4月 (53)
- 2022年3月 (67)
- 2022年2月 (3)
- 2022年1月 (4)
- 2021年12月 (24)
- 2021年11月 (18)
- 2021年10月 (3)
- 2021年9月 (22)
- 2021年8月 (60)
- 2021年7月 (3)
- 2021年6月 (16)
- 2021年5月 (25)
- 2021年4月 (1)
- 2021年3月 (39)
- 2021年1月 (7)
- 2020年12月 (19)
- 2020年11月 (11)
- 2020年10月 (49)
- 2020年9月 (114)
- 2020年8月 (63)
- 2020年7月 (28)
- 2020年6月 (50)
- 2020年5月 (124)
- 2020年4月 (83)
- 2020年3月 (91)
- 2020年2月 (81)
- 2020年1月 (18)
- 2019年12月 (79)
- 2019年11月 (16)
- 2019年10月 (35)
- 2019年9月 (3)
- 2017年12月 (1)
- 2017年11月 (203)
- 2017年10月 (155)
- 标签列表
- 站点信息
-
- 文章总数:2025
- 页面总数:7
- 分类总数:46
- 标签总数:339
- 评论总数:9366
- 浏览总数:5898972
本文暂时没有评论,来添加一个吧(●'◡'●)