当前位置: 首页 > 图文教程 > 网络编程 > PHP > 简单站内HTML文件搜索程序

PHP
php 多线程上下文中安全写文件实现代码
PHP类的使用 实例代码讲解
用php实现让页面只能被百度gogole蜘蛛访问的方法
php 学习笔记
PHP编程过程中需要了解的this,self,parent的区别
php 操作excel文件的方法小结
使用PHP获取网络文件的实现代码
PHP 巧用数组降低程序的时间复杂度
php下将XML转换为数组
php 文件上传代码(限制jpg文件)
php 无极分类(递归)实现代码
PHP 采集获取指定网址的内容
PHP 将图片按创建时间进行分类存储的实现代码
PHP 存储文本换行实现方法
PHP 批量更新网页内容实现代码
用PHP查询搜索引擎排名位置的代码
用php实现的获取网页中的图片并保存到本地的代码
php实现首页链接查询 友情链接检查的代码
处理php自动反斜杠的函数代码
php实现的遍历文件夹下所有文件,编辑删除

PHP 中的 简单站内HTML文件搜索程序


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-08-14   浏览: 74 ::
收藏到网摘: n/a

自己写来简单的搜索自己电脑上的技术资料的。大概的思路就是寻找指定目录下的文本,然后如果有与关键字相匹配的数据就把文件名返回,最后把所有搜索结果显示出来。显示结果类似于baidu/google,呵呵,这个是纯粹为了好玩。

程序代码:

以下为引用的内容:

<?php
/**
 * 文件: search.php
 * 功能: 搜索指定目录下的HTML文件
 * 创建: 2005-9-23
 * 作者: heiyeluren <heiyeluren AT gmail.com>
 */


/* 基本函数 */

//获取目录下文件函数
function getFile($dir)
{
 $dp = opendir($dir);
 $fileArr = array();
 while (!false == $curFile = readdir($dp)) {
  if ($curFile!="." && $curFile!=".." && $curFile!="") {
   if (is_dir($curFile)) {
    $fileArr = getFile($dir."/".$curFile);
   } else {
    $fileArr[] = $dir."/".$curFile;
   }
  }
 }
 return $fileArr;
}

//获取文件内容
function getFileContent($file)
{
 if (!$fp = fopen($file, "r")) {
  die("Cannot open file $file");
 }
 while ($text = fread($fp, 4096)) {
  $fileContent .= $text;
 }
 return $fileContent;
}

//搜索指定文件
function searchText($file, $keyword)
{
 $text = getFileContent($file);
 if (preg_match("/$keyword/i", $text)) {
  return true;
 }
 return false;
}

//搜索出文章的标题
function getFileTitle($file, $default="None subject")
{
 $fileContent = getFileContent($file);
 $sResult = preg_match("/<title>.*<\/title>/i", $fileContent, $matchResult);
 $title = preg_replace(array("/(<title>)/i","/(<\/title>)/i"), "", $matchResult[0]);
 if (empty($title)) {
  return $default;
 } else {
  return $title;
 }
}

//获取文件描述信息
function getFileDescribe($file,$length=200, $default="None describe")
{
 $metas = get_meta_tags($file);
 if ($meta['description'] != "") {
  return $metas['description'];
 }
 $fileContent = getFileContent($file);
 preg_match("/(<body.*<\/body>)/is", $fileContent, $matchResult);
 $pattern = array("/(<[^\x80-\xff]+>)/i","/(<input.*>)+/i", "/(<a.*>)+/i", "/(<img.*>)+/i", "/([<script.*>])+.*([<\/script>])+/i","/&amp;/i","/&quot;/i","/&#039;/i", "/\s/");
 $description = preg_replace($pattern, "", $matchResult[0]);
 $description = mb_substr($description, 0, $length)." ...";

 return $description;
}

//加亮搜索结果中的关键字
function highLightKeyword($text, $keyword, $color="#C60A00")
{
 $newword = "<font color=$color>$keyword</font>";
 $text = str_replace($keyword, $newword, $text);
 return $text;
}

//获取文件大小(KB)
function getFileSize($file)
{
 $filesize = intval(filesize($file)/1024)."K";
 return $filesize;
}

//获取文件最后修改的时间
function getFileTime($file)
{
 $filetime = date("Y-m-d", filemtime($file));
 return $filetime;
}

//搜索目录下所有文件
function searchFile($dir, $keyword)
{
 $sFile = getFile($dir);
 if (count($sFile) <= 0) {
  return false;
 }
 $sResult = array();
 foreach ($sFile as $file) {
  if (searchText($file, $keyword)) {
   $sResult[] = $file;
  }
 }
 if (count($sResult) <= 0) {
  return false;
 } else {
  return $sResult;
 }
}


/* 测试代码 */

//指定要搜索的目录
$dir = "./php_Linux";
//要搜索的关键字
$keyword = "sendmail";

$fileArr = searchFile($dir, $keyword);
$searchSum = count($fileArr);

echo "搜索关键字: <b>$keyword</b> &nbsp; 搜索目录: <b>$dir</b> &nbsp; 搜索结果: <b>$searchSum</b><br><hr size=1><br>";

if ($searchSum <= 0) {
 echo "没有搜索到任何结果";
} else {
 foreach ($fileArr as $file) {
  echo "<a href='$file' target='_blank'>". highLightKeyword(getFileTitle($file), $keyword) .
    "</a> - ".getFileSize($file)."&nbsp;". getFileTime($file) .
    "<br>\n<font size=2>".highLightKeyword(getFileDescribe($file), $keyword) .
    "</font><br><br>";
 }
}

?>

完全可以用在自己已经生成静态内容的的搜索,但是程序效率不高。如果能够适当的加上 索引/缓存 等机制的话,我想程序会有趣很多。