当前位置: 首页 > 图文教程 > 网络编程 > PHP > 简单站内HTML文件搜索程序

PHP
PHP教程:插件机制在PHP中实现方案
PHP开源网站程序如何使用的更好
PHP和mysql+jqueyr建立类twitter站点
PHP服务端代理页面开发
PHP理论教程:如何才能自动获取关键词
PHP教程:imagefilledrectangle函数生成渐变图片
PHP教程:配置smarty开发环境
PHP扩展curl和正则表达式轻松采集新闻
PHP4,PHP5,ASP.NET开发优劣比较
PHP教程:PHP随机显示目录下图片的源码
HTTP Headers简明易懂的教程
PHP导入和导出Excel文件
PHP 5.3 的重要特性:命名空间
PHP教程:GD库的imagecolorset函数简单修改图片颜色
PHP5教程:PHP的GD模块生成条形码
PHP网站程序乱码问题解决方法
PHP教程:php内置函数intval()
PHP大量Session的散列及过期回收
实现基本QQ功能的PHP类:QQ机器人
PHP+MYSQL网站SQL Injection攻防

PHP 中的 简单站内HTML文件搜索程序


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-08-14   浏览: 70 ::
收藏到网摘: n/a

自己写来简单的搜索自己电脑上的技术资料的。大概的思路就是寻找指定目录下的文本,然后如果有与关键字相匹配的数据就把文件名返回,最后把所有搜索结果显示出来。显示结果类似于baidu/google,呵呵,这个是纯粹为了好玩。

程序代码:

以下为引用的内容:

<?php
/**
 * 文件: search.php
 * 功能: 搜索指定目录下的HTML文件
 * 创建: 2005-9-23
 * 作者: heiyeluren <heiyeluren AT gmail.com>
 */


/* 基本函数 */

//获取目录下文件函数
function getFile($dir)
{
 $dp = opendir($dir);
 $fileArr = array();
 while (!false == $curFile = readdir($dp)) {
  if ($curFile!="." && $curFile!=".." && $curFile!="") {
   if (is_dir($curFile)) {
    $fileArr = getFile($dir."/".$curFile);
   } else {
    $fileArr[] = $dir."/".$curFile;
   }
  }
 }
 return $fileArr;
}

//获取文件内容
function getFileContent($file)
{
 if (!$fp = fopen($file, "r")) {
  die("Cannot open file $file");
 }
 while ($text = fread($fp, 4096)) {
  $fileContent .= $text;
 }
 return $fileContent;
}

//搜索指定文件
function searchText($file, $keyword)
{
 $text = getFileContent($file);
 if (preg_match("/$keyword/i", $text)) {
  return true;
 }
 return false;
}

//搜索出文章的标题
function getFileTitle($file, $default="None subject")
{
 $fileContent = getFileContent($file);
 $sResult = preg_match("/<title>.*<\/title>/i", $fileContent, $matchResult);
 $title = preg_replace(array("/(<title>)/i","/(<\/title>)/i"), "", $matchResult[0]);
 if (empty($title)) {
  return $default;
 } else {
  return $title;
 }
}

//获取文件描述信息
function getFileDescribe($file,$length=200, $default="None describe")
{
 $metas = get_meta_tags($file);
 if ($meta['description'] != "") {
  return $metas['description'];
 }
 $fileContent = getFileContent($file);
 preg_match("/(<body.*<\/body>)/is", $fileContent, $matchResult);
 $pattern = array("/(<[^\x80-\xff]+>)/i","/(<input.*>)+/i", "/(<a.*>)+/i", "/(<img.*>)+/i", "/([<script.*>])+.*([<\/script>])+/i","/&amp;/i","/&quot;/i","/&#039;/i", "/\s/");
 $description = preg_replace($pattern, "", $matchResult[0]);
 $description = mb_substr($description, 0, $length)." ...";

 return $description;
}

//加亮搜索结果中的关键字
function highLightKeyword($text, $keyword, $color="#C60A00")
{
 $newword = "<font color=$color>$keyword</font>";
 $text = str_replace($keyword, $newword, $text);
 return $text;
}

//获取文件大小(KB)
function getFileSize($file)
{
 $filesize = intval(filesize($file)/1024)."K";
 return $filesize;
}

//获取文件最后修改的时间
function getFileTime($file)
{
 $filetime = date("Y-m-d", filemtime($file));
 return $filetime;
}

//搜索目录下所有文件
function searchFile($dir, $keyword)
{
 $sFile = getFile($dir);
 if (count($sFile) <= 0) {
  return false;
 }
 $sResult = array();
 foreach ($sFile as $file) {
  if (searchText($file, $keyword)) {
   $sResult[] = $file;
  }
 }
 if (count($sResult) <= 0) {
  return false;
 } else {
  return $sResult;
 }
}


/* 测试代码 */

//指定要搜索的目录
$dir = "./php_Linux";
//要搜索的关键字
$keyword = "sendmail";

$fileArr = searchFile($dir, $keyword);
$searchSum = count($fileArr);

echo "搜索关键字: <b>$keyword</b> &nbsp; 搜索目录: <b>$dir</b> &nbsp; 搜索结果: <b>$searchSum</b><br><hr size=1><br>";

if ($searchSum <= 0) {
 echo "没有搜索到任何结果";
} else {
 foreach ($fileArr as $file) {
  echo "<a href='$file' target='_blank'>". highLightKeyword(getFileTitle($file), $keyword) .
    "</a> - ".getFileSize($file)."&nbsp;". getFileTime($file) .
    "<br>\n<font size=2>".highLightKeyword(getFileDescribe($file), $keyword) .
    "</font><br><br>";
 }
}

?>

完全可以用在自己已经生成静态内容的的搜索,但是程序效率不高。如果能够适当的加上 索引/缓存 等机制的话,我想程序会有趣很多。