当前位置: 首页 > 图文教程 > 网络编程 > PHP > 中国站长站 For Dede4.0 采集规则

PHP
php 多线程上下文中安全写文件实现代码
PHP类的使用 实例代码讲解
用php实现让页面只能被百度gogole蜘蛛访问的方法
php 学习笔记
PHP编程过程中需要了解的this,self,parent的区别
php 操作excel文件的方法小结
使用PHP获取网络文件的实现代码
PHP 巧用数组降低程序的时间复杂度
php下将XML转换为数组
php 文件上传代码(限制jpg文件)
php 无极分类(递归)实现代码
PHP 采集获取指定网址的内容
PHP 将图片按创建时间进行分类存储的实现代码
PHP 存储文本换行实现方法
PHP 批量更新网页内容实现代码
用PHP查询搜索引擎排名位置的代码
用php实现的获取网页中的图片并保存到本地的代码
php实现首页链接查询 友情链接检查的代码
处理php自动反斜杠的函数代码
php实现的遍历文件夹下所有文件,编辑删除

PHP 中的 中国站长站 For Dede4.0 采集规则


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-13   浏览: 78 ::
收藏到网摘: n/a

转载请注明出自落伍im286.com,本贴地址:http://www.im286.com/viewthread.php?tid=1991813
只差两分就落伍了,特献出中国站长站 For Dede4.0 的采集规则,希望大家能够支持我落伍,谢谢了!!!
下面的规则为网站运营 >> 搜索优化 的采集规则,其他栏目的规则只要把“来源网址”和“文章网址需包含”这两项改成你想采集栏目的网址和目录。
如想采集站长在线 >> 好站推荐 这个栏目,你只要做如下更改:
来源网址:[url]http://www.chinaz.com/Webmaster/RecSite/Index.html[/url]
文章网址需包含:/RecSite/0
其他的不需要更改!
==================采集规则=================
{!-- 节点基本信息 --}
{dede:item name='搜索引擎'
imgurl='/upimg' imgdir='../upimg' language='gb2312'
isref='no' refurl='' exptime='10'
typeid='1' matchtype='string'}
{/dede:item}
{!-- 采集列表获取规则 --}
{dede:list source='var' sourcetype='list'
varstart='' varend=''}
{dede:url value='http://www.chinaz.com/Webbiz/Seo/Index.html'}{/dede:url}
{dede:need}/Seo/0{/dede:need}
{dede:cannot}{/dede:cannot}
{dede:linkarea}<div id="list_container">[var:区域]var contents = document.getElementsByClassName('list_news_content');{/dede:linkarea}
{/dede:list}
{!-- 网页内容获取规则 --}
{dede:art}
{dede:sppage sptype='next'}<b>1</b>[var:分页区域]<font face="webdings">4{/dede:sppage}
{dede:note field='dede_archives.title' value='[var:内容]' comment='文章标题'
isunit='' isdown=''}
{dede:match}<h1>[var:内容]</h1>{/dede:match}
{dede:function}{/dede:function}
{/dede:note}
{dede:note field='dede_addonarticle.body' value='[var:内容]' comment='文章内容'
isunit='1' isdown='1'}
{dede:match}<div class="text_body" id="textbody">[var:内容]<div class="text_tag">{/dede:match}
{dede:trim}<div align="center">(.*)</div>{/dede:trim}
{dede:trim}CHINAZ{/dede:trim}
{dede:function}{/dede:function}
{/dede:note}
{dede:note field='dede_archives.writer' value='[var:内容]' comment='文章作者'
isunit='' isdown=''}
{dede:match}者:[var:内容]| 时{/dede:match}
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:function}{/dede:function}
{/dede:note}
{dede:note field='dede_archives.source' value='[var:内容]' comment='文章来源'
isunit='' isdown=''}
{dede:match}来源:[var:内容] | 作{/dede:match}
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:function}{/dede:function}
{/dede:note}
{dede:note field='dede_archives.pubdate' value='[var:内容]' comment='发布时间'
isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}if(@me!="") @me = GetMkTime(@me);
else @me = time();{/dede:function}
{/dede:note}
{dede:note field='dede_archives.sortrank' value='[var:内容]' comment='排序级别'
isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}@me = time();{/dede:function}
{/dede:note}
{dede:note field='dede_archives.litpic' value='[var:内容]' comment='缩略图'
isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}@me = @litpic;{/dede:function}
{/dede:note}
{dede:note field='dede_archives.senddate' value='[var:内容]' comment='录入时间'
isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}@me = time();{/dede:function}
{/dede:note}
{/dede:art}