当前位置: 首页 > 图文教程 > 网络编程 > PHP > 简单采集了yahoo的一些数据

PHP
PHP 手机归属地查询 api
php 自写函数代码 获取关键字 去超链接
检查url链接是否已经有参数的php代码 添加 ? 或 &
PHP生成网页快照 不用COM不用扩展.
一步一步学习PHP(1) php开发环境配置
一步一步学习PHP(2):PHP类型
一步一步学习PHP(3) php 函数
一步一步学习PHP(4) php 函数 补充2
提高PHP编程效率 引入缓存机制提升性能
php 数组的合并、拆分、区别取值函数集
PHP采集相关教程之一 CURL函数库
IP138 IP地址查询小偷实现代码
php 生成静态页面的办法与实现代码详细版
一步一步学习PHP(5) 类和对象
一步一步学习PHP(6) 面向对象
Apache环境下PHP利用HTTP缓存协议原理解析及应用分析
PHP 截取字符串函数整理(支持gb2312和utf-8)
php foreach 使用&(与运算符)引用赋值要注意的问题
PHP IPV6正则表达式验证代码
用PHP ob_start()控制浏览器cache、生成html实现代码

PHP 中的 简单采集了yahoo的一些数据


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-13   浏览: 40 ::
收藏到网摘: n/a

以前在公司就写过类似的东西,这次是帮以前的上司写了一个简单的采集程序。
很简单的。。汗。没什么技术含量的。
数据来源:http://cn.finance.yahoo.co...
演示地址:http://traffic02.100steps....
(修改了下,增加了数据缓存功能。。汗,没有使用lite_cache了,自己写了个最简单的那种。。)
复制代码 代码如下:

<?
set_time_limit(0);
$max_time=3600;
$cache_file='cache_yahoo.txt';
$nowtime=time();
if(!file_exists($cache_file)){
$filetime=0;
}else{
$filetime=filemtime($cache_file);
}
if($filetime+$max_time<$nowtime){
//更新
ob_start();
function get_yahoo_info($url){
$content=file_get_contents($url);
$pattern='|<tr class="yfnc_modtitle1"><td><small><b>(.*)</b> \((.*)\) (.*)</small></td><td align="right">|U';
preg_match_all($pattern,$content,$out);
$info['company_name']=$out[1][0];
$info['company_stock']=$out[2][0];
$pattern='|<td class="yfnc_tablehead1" width="52%">最近交易价:</td><td class="yfnc_tabledata1"><big><b>(.*)</b></big></td>|U';
preg_match_all($pattern,$content,$out);
$info['stock_price']=$out[1][0];
$pattern='|<td class="yfnc_tablehead1" width="52%">涨跌:</td><td class="yfnc_tabledata1">(.*)</td>|U';
preg_match_all($pattern,$content,$out);
$info['stock_upordown']=$out[1][0];
$pattern='|<td class="yfnc_tablehead1" width="54%">市值:</td><td class="yfnc_tabledata1">(.*)</td>|U';
preg_match_all($pattern,$content,$out);
$info['stock_value']=$out[1][0];
return $info;
}
$urls=explode(',',file_get_contents('url.txt'));
$i=0;
$matchs=array();
foreach($urls as $url){
$rs=get_yahoo_info($url);
if(!empty($rs)){
$matchs[$i]=$rs;
$i++;
$rs='';
}
}
//print_r(get_yahoo_info('http://cn.finance.yahoo.com/q?s=000063.SZ'));
?>
<table border="1" width="100%" cellpadding="6" style="border-collapse: collapse" bordercolor="#8CBFF9" cellspacing="0" bgcolor="#DFEDFD">
<tr>
<td width="30" height="" valign="top" bordercolor="#ABD0FA" bgcolor="#E1EEFD" > </td>
<td valign="top" bordercolor="#ABD0FA" bgcolor="#E1EEFD" ><div align="center">公司名称</div></td>
<td valign="top" bordercolor="#ABD0FA" bgcolor="#E1EEFD" ><div align="center">股票代号</div></td>
<td valign="top" bordercolor="#ABD0FA" bgcolor="#E1EEFD" ><div align="center">股票价格</div></td>
<td valign="top" bordercolor="#ABD0FA" bgcolor="#E1EEFD" ><div align="center">股票涨幅</div></td>
<td valign="top" bordercolor="#ABD0FA" bgcolor="#E1EEFD" ><div align="center">市值</div></td>
</tr>
<?
$i=1;
foreach($matchs as $match){
?>
<tr>
<td height="" align="center" valign="top" bordercolor="#ABD0FA" bgcolor="#FFFFFF" ><?=$i?></td>
<td valign="top" bordercolor="#ABD0FA" bgcolor="#FFFFFF" ><div align="center"><?=$match['company_name']?></div></td>
<td valign="top" bordercolor="#ABD0FA" bgcolor="#FFFFFF" ><div align="center"><?=$match['company_stock']?></div></td>
<td valign="top" bordercolor="#ABD0FA" bgcolor="#FFFFFF" ><div align="center"><?=$match['stock_price']?></div></td>
<td valign="top" bordercolor="#ABD0FA" bgcolor="#FFFFFF" ><div align="center"><?=$match['stock_upordown']?></div></td>
<td valign="top" bordercolor="#ABD0FA" bgcolor="#FFFFFF" ><div align="center"><?=$match['stock_value']?></div></td>
</tr>
<?
$i++;
}?>
</table>
<?
$content=ob_get_clean();
$fp=fopen($cache_file,'w');
if(!$fp)echo '打开文件失败';
if (flock($fp, LOCK_EX)) { // 进行排它型锁定
if(!fwrite($fp, $content))echo '文件写入失败';
flock($fp, LOCK_UN); // 释放锁定
} else {
//echo "Couldn't lock the file !";
if(!fwrite($fp, $content))echo '文件写入失败';
}
fclose($fp);
//echo 'cache time:'.time();
echo $content;
}else{
//echo 'cache!';
echo file_get_contents($cache_file);
}
?>