黑帽seo培训-「阳哥seo」

做最专业的黑帽seo技术服务团队

PHP模拟百度蜘蛛-伪造IP爬取的php代码

PHP模拟百度蜘蛛-伪造IP爬取的php代码,开始我就猜想模拟X-FORWARDED-FOR和CLIENT-IP可不可以实现他这个一个IP点击一次算推广一次的方法,事实证明是可以的,但是基本所有的代刷网都有个特点 用 curl 或者 get_contents 这两个函数都不能访问,个人猜想应该是有屏蔽(PS:我没看过代刷网的源码),但是我看到似乎很多代刷网百度都有收录,就想模拟百度蜘蛛应该可以吧,于是就用模拟了百度的USER_AGENT,运行结果可行,下面贴代码:

PHP模拟百度蜘蛛-伪造IP爬取的php代码

<?php

// 关闭PHP报错

error_reporting( E_ALL^E_NOTICE^E_WARNING );

//实现使用curl模拟百度蜘蛛进行采集

function Go( $url )

{

$ch = curl_init();

//随机生成IP

$ip = rand(0,255).'.'.rand(0,255).'.'.rand(0,255).'.'.rand(0,255) ; // 百度蜘蛛

$timeout = 15;

curl_setopt($ch,CURLOPT_URL,$url);

curl_setopt($ch,CURLOPT_TIMEOUT,0);

//伪造百度蜘蛛IP

curl_setopt($ch,CURLOPT_HTTPHEADER,array('X-FORWARDED-FOR:'.$ip.'','CLIENT-IP:'.$ip.''));

//伪造百度蜘蛛头部

curl_setopt($ch,CURLOPT_USERAGENT,"Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)");

curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);

curl_setopt($ch,CURLOPT_HEADER,0);

curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,$timeout);

curl_setopt($ch,CURLOPT_SSL_VERIFYPEER,false);

curl_setopt($ch, CURLOPT_IPRESOLVE, CURL_IPRESOLVE_V4);

$content = curl_exec($ch);

}

//判断url是否存在 存在进行访问

if ($_GET['url']) {

$api = $_GET['url'];

$data = Go($api);

sleep(10);

$mydata = ['msg'=>200,'val'=>'提交成功','num'=>1];

exit(json_encode($mydata, JSON_UNESCAPED_UNICODE));

}else{

$mydata = ['msg'=>404,'val'=>'提交失败','cause'=>'URL推广链接不能为空'];

exit(json_encode($mydata, JSON_UNESCAPED_UNICODE));

}

给各位站长的建议:推广插件尽量还是别用,如果要用还是加验证码,验证码比较容易识别的就算了,你们现在那种验证码我已经写好识别了,但是考虑到问题决定暂时不发,请各位站长及时修复!


以上就是黑帽seo为您带来的“PHP模拟百度蜘蛛-伪造IP爬取的php代码”全部内容,更多内容敬请关注缑阳建黑帽研究工作室!

【版权保护】本文由黑帽seo算法研究中心原创,转载请保留链接: http://www.40ke.com/heimaojiaocheng/4.html

所属分类:黑帽教程

评论

姓名:
邮箱:
电话:
评论: