当前位置: 首页 > 图文教程 > 网络编程 > PHP > 简单采集了yahoo的一些数据

PHP
php 多线程上下文中安全写文件实现代码
PHP类的使用 实例代码讲解
用php实现让页面只能被百度gogole蜘蛛访问的方法
php 学习笔记
PHP编程过程中需要了解的this,self,parent的区别
php 操作excel文件的方法小结
使用PHP获取网络文件的实现代码
PHP 巧用数组降低程序的时间复杂度
php下将XML转换为数组
php 文件上传代码(限制jpg文件)
php 无极分类(递归)实现代码
PHP 采集获取指定网址的内容
PHP 将图片按创建时间进行分类存储的实现代码
PHP 存储文本换行实现方法
PHP 批量更新网页内容实现代码
用PHP查询搜索引擎排名位置的代码
用php实现的获取网页中的图片并保存到本地的代码
php实现首页链接查询 友情链接检查的代码
处理php自动反斜杠的函数代码
php实现的遍历文件夹下所有文件,编辑删除

PHP 中的 简单采集了yahoo的一些数据


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-13   浏览: 48 ::
收藏到网摘: n/a

以前在公司就写过类似的东西,这次是帮以前的上司写了一个简单的采集程序。
很简单的。。汗。没什么技术含量的。
数据来源:http://cn.finance.yahoo.co...
演示地址:http://traffic02.100steps....
(修改了下,增加了数据缓存功能。。汗,没有使用lite_cache了,自己写了个最简单的那种。。)
复制代码 代码如下:

<?
set_time_limit(0);
$max_time=3600;
$cache_file='cache_yahoo.txt';
$nowtime=time();
if(!file_exists($cache_file)){
$filetime=0;
}else{
$filetime=filemtime($cache_file);
}
if($filetime+$max_time<$nowtime){
//更新
ob_start();
function get_yahoo_info($url){
$content=file_get_contents($url);
$pattern='|<tr class="yfnc_modtitle1"><td><small><b>(.*)</b> \((.*)\) (.*)</small></td><td align="right">|U';
preg_match_all($pattern,$content,$out);
$info['company_name']=$out[1][0];
$info['company_stock']=$out[2][0];
$pattern='|<td class="yfnc_tablehead1" width="52%">最近交易价:</td><td class="yfnc_tabledata1"><big><b>(.*)</b></big></td>|U';
preg_match_all($pattern,$content,$out);
$info['stock_price']=$out[1][0];
$pattern='|<td class="yfnc_tablehead1" width="52%">涨跌:</td><td class="yfnc_tabledata1">(.*)</td>|U';
preg_match_all($pattern,$content,$out);
$info['stock_upordown']=$out[1][0];
$pattern='|<td class="yfnc_tablehead1" width="54%">市值:</td><td class="yfnc_tabledata1">(.*)</td>|U';
preg_match_all($pattern,$content,$out);
$info['stock_value']=$out[1][0];
return $info;
}
$urls=explode(',',file_get_contents('url.txt'));
$i=0;
$matchs=array();
foreach($urls as $url){
$rs=get_yahoo_info($url);
if(!empty($rs)){
$matchs[$i]=$rs;
$i++;
$rs='';
}
}
//print_r(get_yahoo_info('http://cn.finance.yahoo.com/q?s=000063.SZ'));
?>
<table border="1" width="100%" cellpadding="6" style="border-collapse: collapse" bordercolor="#8CBFF9" cellspacing="0" bgcolor="#DFEDFD">
<tr>
<td width="30" height="" valign="top" bordercolor="#ABD0FA" bgcolor="#E1EEFD" > </td>
<td valign="top" bordercolor="#ABD0FA" bgcolor="#E1EEFD" ><div align="center">公司名称</div></td>
<td valign="top" bordercolor="#ABD0FA" bgcolor="#E1EEFD" ><div align="center">股票代号</div></td>
<td valign="top" bordercolor="#ABD0FA" bgcolor="#E1EEFD" ><div align="center">股票价格</div></td>
<td valign="top" bordercolor="#ABD0FA" bgcolor="#E1EEFD" ><div align="center">股票涨幅</div></td>
<td valign="top" bordercolor="#ABD0FA" bgcolor="#E1EEFD" ><div align="center">市值</div></td>
</tr>
<?
$i=1;
foreach($matchs as $match){
?>
<tr>
<td height="" align="center" valign="top" bordercolor="#ABD0FA" bgcolor="#FFFFFF" ><?=$i?></td>
<td valign="top" bordercolor="#ABD0FA" bgcolor="#FFFFFF" ><div align="center"><?=$match['company_name']?></div></td>
<td valign="top" bordercolor="#ABD0FA" bgcolor="#FFFFFF" ><div align="center"><?=$match['company_stock']?></div></td>
<td valign="top" bordercolor="#ABD0FA" bgcolor="#FFFFFF" ><div align="center"><?=$match['stock_price']?></div></td>
<td valign="top" bordercolor="#ABD0FA" bgcolor="#FFFFFF" ><div align="center"><?=$match['stock_upordown']?></div></td>
<td valign="top" bordercolor="#ABD0FA" bgcolor="#FFFFFF" ><div align="center"><?=$match['stock_value']?></div></td>
</tr>
<?
$i++;
}?>
</table>
<?
$content=ob_get_clean();
$fp=fopen($cache_file,'w');
if(!$fp)echo '打开文件失败';
if (flock($fp, LOCK_EX)) { // 进行排它型锁定
if(!fwrite($fp, $content))echo '文件写入失败';
flock($fp, LOCK_UN); // 释放锁定
} else {
//echo "Couldn't lock the file !";
if(!fwrite($fp, $content))echo '文件写入失败';
}
fclose($fp);
//echo 'cache time:'.time();
echo $content;
}else{
//echo 'cache!';
echo file_get_contents($cache_file);
}
?>