仓酷云

标题: PHP网页编程之php下经由过程curl抓取yahoo boss 搜刮了局... [打印本页]

作者: 因胸联盟    时间: 2015-2-3 23:36
标题: PHP网页编程之php下经由过程curl抓取yahoo boss 搜刮了局...
我的文章不会对您的学习起到实质性的作用,您能否成功,还得靠自己的,坚持,坚持,再坚持,就是步入成功的不二法门。   1.编写curl类,停止网页内容抓取
复制代码 代码以下:
class CurlUtil
{
private $curl;
private $timeout = 10;
/**
* 初始化curl对象
*/
public function __construct()
{
$this->curl = curl_init();
curl_setopt($this->curl, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($this->curl, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)");
curl_setopt($this->curl, CURLOPT_HEADER, false); //设定是不是显示头信息
curl_setopt($this->curl, CURLOPT_NOBODY, false); //设定是不是输入页面内容
curl_setopt($this->curl, CURLOPT_CONNECTTIMEOUT, $this->timeout);
curl_setopt($this->curl, CURLOPT_FOLLOWLOCATION, true);
curl_setopt($this->curl, CURLOPT_AUTOREFERER, true);
}
/**
* 刊出函数 封闭curl对象
*/
public function __destruct()
{
curl_close($this->curl);
}
/**
* 获得网页的内容
*/
public function getWebPageContent($url)
{
curl_setopt($this->curl, CURLOPT_URL, $url);
return curl_exec($this->curl);
}
}


2.创立curl对象
复制代码 代码以下:
$CurlUtil = new CurlUtil();

3.抓取yahoo搜刮了局
复制代码 代码以下:
function getYahooSearch(CurlUtil $curl, $key)
{
$key = urlencode($key);
$searchUrl = "http://boss.yahooapis.com/ysearch/web/v1/$key?appid=你的雅虎appid&lang=tzh&region=hk&abstract=long&count=20&format=json&start=0&count=10";
$josnStr = $curl->getWebPageContent($searchUrl);
$searchDataInfo = json_decode($josnStr, true);
$searchData = $searchDataInfo['ysearchresponse']['resultset_web'];
$returnArray = array();
if (!empty($searchData)) {
foreach ($searchData as $data) {
$returnArray[] = array("url" => $data['url'], "date" => $data['date'], 'title' => strip_tags($data['title']), 'description' => strip_tags($data['abstract']));
}
}
return $returnArray;
}

4.测试了局
var_dump(getYahooSearch($CurlUtil, "百度"));多个成员之间重复做相同的工作,很容易因为交流沟通的时候没有进行一致性的文档要求而出现不明错误,严重影响开发进度,导致在预定时间内无法完成该项目或者完成的项目跟原先计划所要实现的项目功能不符合。
作者: 兰色精灵    时间: 2015-2-9 14:21
使用zendstdio 写代码的的时候,把tab 的缩进设置成4个空格是很有必要的
作者: 只想知道    时间: 2015-2-27 05:39
当然这种网站的会员费就几十块钱。
作者: 第二个灵魂    时间: 2015-3-8 22:36
在我安装pear包的时候老是提示,缺少某某文件,才发现 那群extension 的排列是应该有一点的顺序,而我安装的版本的排序不是正常的排序。没办法我只好把那群冒号加了上去,只留下我需要使用的扩展。
作者: 若天明    时间: 2015-3-16 15:20
我学习了一段时间后,我发现效果并不好(估计是我自身的问题)。因为一个人的精力总是有限的,同时学习这么多,会导致每个的学习时间都得不到保证。
作者: 因胸联盟    时间: 2015-3-17 06:40
本文当是我的笔记啦,遇到的问题随时填充
作者: 愤怒的大鸟    时间: 2015-3-24 00:11
装在C盘下面可以利用windows的ghost功能可以还原回来(顺便当做是重转啦),当然啦我的编译目录要放在别的盘下,不然自己的劳动成果就悲剧啦。
作者: 精灵巫婆    时间: 2015-3-30 14:18
首先我是坚决反对新手上来就用框架的,因为对底层的东西一点都不了解,造成知识上的真空,会对以后的发展不利。我的观点上手了解下框架就好,代码还是手写。当然啦如果是位别的编程语言的高手的话,这个就另当别论啦。
作者: 山那边是海    时间: 2015-4-9 09:06
本文当是我的笔记啦,遇到的问题随时填充
作者: 仓酷云    时间: 2015-4-12 22:23
本人接触php时间不长,算是phper中的小菜鸟一只吧。由于刚开始学的时候没有名师指,碰过不少疙瘩,呗很多小问题卡过很久,白白浪费不少宝贵的时间,在次分享一些子的学习的心得。
作者: 莫相离    时间: 2015-4-13 03:57
Ps:以上纯属原创,如有雷同,纯属巧合
作者: 金色的骷髅    时间: 2015-4-13 07:32
没接触过框架的人,也不用害怕,其实框架就是一种命名规范及插件,学会一个框架其余的框架都很好上手的。
作者: 谁可相欹    时间: 2015-4-22 01:04
Ps:以上纯属原创,如有雷同,纯属巧合
作者: 若相依    时间: 2015-5-8 10:52
当然这种网站的会员费就几十块钱。
作者: 乐观    时间: 2015-6-13 07:40
Apache不是非得用80或者8080端口的,我刚开始安得时候就是80端口老占用,就用了个 81端口,结果照常,就是输localhost的时候,应该输入为 localhost:81
作者: 爱飞    时间: 2015-6-24 07:25
基础有没有对学习php没有太大区别,关键是兴趣。
作者: 变相怪杰    时间: 2015-6-29 22:13
遇到出错的时候,我经常把错误信息直接复制到 google的搜索栏,一般情况都是能搜到结果的,不过有时候会搜出来一大片英文的出来,这时候就得过滤一下,吧中文的弄出来,挨着式方法。
作者: 再见西城    时间: 2015-7-11 05:32
最后祝愿,php会给你带来快乐的同时 你也会给他带来快乐。
作者: 透明    时间: 2015-7-12 20:19
刚开始安装php的时候,我图了个省事,把php的扩展全都打开啦(就是把php.ini 那一片 extension 前面的冒号全去掉啦),这样自然有好处,以后不用再需要什么功能再来打开。
作者: 飘灵儿    时间: 2015-7-13 10:26
首推的搜索引擎当然是Google大神,其次我比较喜欢 百度知道。不过搜出来的结果往往都是 大家copy来copy去的,运气的的概率很大。




欢迎光临 仓酷云 (http://www.ckuyun.com/) Powered by Discuz! X3.2