php curl 模拟搜索引擎爬虫实例 360Spider

PHP 使用Curl函数模拟搜索引擎蜘蛛爬虫,我们这里以so.com (360Spider)为例:

<?php	
    print_r(_GetContent('http://www.laoji.org'));
    /**
     * cURL获取网页内容
     */
    function _GetContent( $url )    {
        $curl = curl_init();//初始化一个curl会话;
        curl_setopt($curl,CURLOPT_URL,$url);//指定访问的url
        curl_setopt($curl,CURLOPT_USERAGENT,"Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0); 360Spider");
        curl_setopt($curl,CURLOPT_POST,$data);//post请求的参数,
        curl_setopt($curl,CURLOPT_RETURNTRANSFER,1);//获取的信息以文件流的方式返回

        $data = curl_exec($curl);//执行curl;
        curl_close($curl); // 关闭CURL会话
        return $data;
    }

 

评论

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注