当前位置: 首页 > 图文教程 > 网络编程 > PHP > 面向搜索引擎的URL优化

PHP
dedecms模版制作使用方法
dede3.1分页文字采集过滤规则详说(图文教程)
dede3.1分页文字采集过滤规则详说(图文教程)续二
dede3.1分页文字采集过滤规则详说(图文教程)续四
手把手教你使用DedeCms V3的在线采集图文教程
PHP实现MVC开发得最简单的方法:模型
php下用GD生成生成缩略图的两个选择和区别
Win2003服务器安全加固设置--进一步提高服务器安全性
[php] 我的微型论坛的简单教程[已完成]
phpMyAdmin下载、安装和使用入门教程
PHP 优化配置:加速你的VBB,phpwind,Discuz,IPB,MolyX
php+mysql开源XNA 聚合程序发布 下载
Bo-Blog专用的给Windows服务器的IIS Rewrite程序
MySQL数据库转移,access,sql server 转 MySQL 的图文教程
小结下MySQL中文乱码,phpmyadmin乱码,php乱码 产生原因及其解决方法
首页四格,首页五格For6.0(GBK)(UTF-8)[12种组合][9-18][版主安装测试通过]
[PHP]经常用到的实用函数集合
php扩展ZF:Validate扩展
php开发工具之vs2005图解
PHP 5.0创建图形的实用方法完整篇

PHP 中的 面向搜索引擎的URL优化


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-08-14   浏览: 154 ::
收藏到网摘: n/a

我在写晋远信息网(www.geofuture.net)时没有考虑到URL如何面向搜索引擎优化,完成了以后才开始优化的。这时要考虑一方面要静态的URL,一方面要尽量保持原有的程序不变以便于以后维护,所以就采用url_rewrite的方法。下面是httpd.conf中相应的部分

以下为引用的内容:
<VirtualHost *:80>
    DocumentRoot /home/geofuture
    ServerName www.geofuture.net
    ServerAlias *.geofuture.net geofuture.net *.cic123.com
    DirectoryIndex index.files index.html index.php
    RewriteEngine On
    #RewriteLog logs/rewrite.log
    #RewriteLogLevel 9
    #RewriteRule / http://geofuture.vicp.net/ [L]
    RewriteCond %{REQUEST_FILENAME}    index.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    error.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    cat.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    area.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    info.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    topic.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    post.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    profile.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    userinfo.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    cert.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    revise.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    review.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    feedback.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    keyrank.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    rss.files
    RewriteRule ^(.+?)\Q(.*)$    $1=$2 [N]
    RewriteRule ^(.+?)ZZ(.+)$    $1&$2 [N]
    RewriteRule ^(.+?)\.files(.*)$      $1.php$2 [N]
    RewriteRule ^(.+?)\.php(/|&)(.+).html$      $1.php?$3 [L]
    ErrorDocument 400 /error.php?status=400
    ErrorDocument 401 /error.php?status=401
    ErrorDocument 403 /error.php?status=403
    ErrorDocument 404 /error.php?status=404
    ErrorDocument 405 /error.php?status=405
    ErrorDocument 408 /error.php?status=408
    ErrorDocument 410 /error.php?status=410
    ErrorDocument 411 /error.php?status=411
    ErrorDocument 412 /error.php?status=412
    ErrorDocument 413 /error.php?status=413
    ErrorDocument 414 /error.php?status=414
    ErrorDocument 415 /error.php?status=415
    ErrorDocument 500 /error.php?status=500
    ErrorDocument 501 /error.php?status=501
    ErrorDocument 502 /error.php?status=502
    ErrorDocument 503 /error.php?status=503
    ErrorDocument 506 /error.php?status=506
</VirtualHost>

我只把以内容为主的栏目优化了,至于登录和搜索等部分保持不变,因为这些部分也是搜索引擎不关心的。同时,一些常见的状态码(HTTP Status)也有相应的静态页面。上面只修改了外来请求的URL,而程序生成的URL通过下面的代码实现:

以下为引用的内容:
<?php
//--------------   SECTION NAME    -----------------------------------
// 动态URL改写成静态
function url_rewrite($buffer)
{
    //return $buffer;
    $search = array(
        '.php',
        '?',
        '&',
        'filesZZ',
        '=',
        'hrefQ',
    );
    $replace = array(
        '.files',
        '/',
        'ZZ',
        'files/ZZ',
        'Q',
        'href=',
    );
    preg_match_all('/href="\/(index|error|cat|area|info|topic| post|profile|userinfo|cert| revise|review|feeback|keyrank|rss) \.php(.*?)"/', $buffer, $match);
    $url = str_replace($search, $replace, $match[0]);
    $url = preg_replace('/\.files(.+?)(#.+?)?"$/', '.files\\1.html\\2"', $url);
    return str_replace($match[0], $url, $buffer);
}
?>

上面的函数定义放在公共头文件里面。然后,在需要优化的页面开始处加入以下代码:

ob_start("url_rewrite");

这也是原来的程序唯一需要修改的地方。这样做还有一个问题。 例如我写的分页函数等代码, 都要求原来动态的URL, 而优化了以后通过 $_SERVER['PHP_SELF'].'?'.$_SERVER['QUERY_STRING'] 就只能得到优化以后的静态URL, 所有依赖于动态URL的代码都得修改一下, 以能够处理原来的URL和优化的。这样得改写公共头文件的许多代码。所以我就想了一个迂回的办法:

以下为引用的内容:
<?php
//--------------   SECTION NAME    -----------------------------------
// 恢复成动态URL
function url_resume($url)
{
    $search = array(
        '.files',
        '.php/',
        'ZZ',
        '/ZZ',
        'Q',
        '.html',
    );
    $replace = array(
        '.php',
        '.php?',
        '&',
        '?&',
        '=',
        '',
    );
    $url = str_replace($search, $replace, $url);
    return $url;
}
?>

有了上面的函数,在需要动态URL的地方只要调用一下就可以了,而不需重写各个核心函数。需要注意的是,url_rewrite和url_resume虽然是相反的过程,但是它们的参数是不同的。前者的参数是整个缓冲区,后者只是一个单个的URL,因为恢复的情况毕竟很少,而全局处理重写可以提高速度。