本站所有内容仅限用于学习和研究目的,如有侵权请邮件与我们联系处理!
世上事本无难易,为之则易!

网站首页 蜘蛛池 蜘蛛池技术 正文

自用便于统计搜狗蜘蛛的php代码

曹操 2021-06-28 蜘蛛池技术 3232 ℃ 0 评论 1111字 free 收藏

前段时间研究搜狗收录方法,找到了来搜狗蜘蛛的渠道(目前没有渠道了),于是写了这段代码便于自己统计搜狗蜘蛛来爬的url。

本以为很简单就可以写好搜狗蜘蛛的统计的,没想到搜狗的标识符不是sougouspider。

换了好几种写法都没有成功实现,最后还是在“老虎域名”的提示之下,直接写“sougou”作为统计蜘蛛的标识,这才成功。

众里寻他千百度,蓦然回首,那搜狗标识却在灯火阑珊处~

操作方法

在服务器根目录新建:spider.php,代码如下:

<?php
function get_naps_bot()
{
	$useragent = strtolower($_SERVER['HTTP_USER_AGENT']);
if (strpos($useragent, 'sogou') !== false){
	return 'sogouspider';
}
return false;
}
function nowtime(){
	$date=gmdate("Y-n-j H:i:s",time()+8*3600);
	return $date;
}
$searchbot = get_naps_bot();
if ($searchbot) {
	$tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);
	$url=$_SERVER['HTTP_HOST'] . $_SERVER['REQUEST_URI'];
	$file="spiderlogs.txt";
	$time=nowtime();
	$data=fopen($file,"a");
	fwrite($data,"Time:$time robot:$searchbot URL:$url\n");
	fclose($data);
}
?>

在泛目录的index.php/404.php/sitemapphp的等相关蜘蛛会访问到的文件中插入:

include'spider.php';

查看蜘蛛统计的话,访问:您的域名/spiderlogs.txt


Tags:网络爬虫蜘蛛池程序蜘蛛统计

必看说明

  • 本站中所有被研究的素材与信息全部来源于互联网,版权争议与本站无关。
  • 本站文章或仅为文本内容原创,非程序原创。如有侵权、不妥之处,请联系站长第一时间删除。敬请谅解!
  • 本站所有内容严格遵守国家法律的条例,所有研究的算法技术均来源于搜索引擎公开默认允许用户研究使用的接口。
  • 阅读本文及获取资源前,请确保您已充分阅读并理解《访问曹操SEO网站需知:行为准则》。
  • 本站分享的任何工具、程序仅供学习参考编写架构,仅可在本地的虚拟机内断网测试,严禁联网运行或上传搭建!
  • 任何资源必须在下载后24个小时内,从电脑中彻底删除。不得传播或者用于其他任何用途!否则一切后果用户自负!
  • 转载请注明 : 文章转载自  站群程序 自用便于统计搜狗蜘蛛的php代码
  • 本文标题:《自用便于统计搜狗蜘蛛的php代码》
  • 本文链接:http://www.zqcx.cn/1462.html

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

网站分类
近期评论
文章归档
标签列表
站点信息
  • 文章总数:2025
  • 页面总数:7
  • 分类总数:46
  • 标签总数:339
  • 评论总数:9366
  • 浏览总数:5898972