当前位置: 首页 > 图文教程 > 网络编程 > PHP > 面向搜索引擎的URL优化

PHP
php面向对象全攻略 (十五) 多态的应用
php面向对象全攻略 (十六) 对象的串行化
php面向对象全攻略 (十七) 自动加载类
PHP parse_url 一个好用的函数
PHP 字符串分割和比较
全世界最小的php网页木马一枚 附PHP木马的防范方法
PHP 日期加减的类,很不错
PHP 日期时间函数的高级应用技巧
PHP获取163、gmail、126等邮箱联系人地址【已测试2009.10.10】
Ha0k 0.3 PHP 网页木马修改版
PHP iconv 函数转gb2312的bug解决方法
关于页面优化和伪静态
使用zend studio for eclipse不能激活代码提示功能的解决办法
PHP 身份验证方面的函数
基于OpenCV的PHP图像人脸识别技术
用mysql触发器自动更新memcache的实现代码
php 数学运算验证码实现代码
PHP网站开发方案实例
PHP教程:挖掘细节提升网站性能
搜索引擎技术核心揭密(PHP)

PHP 中的 面向搜索引擎的URL优化


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-08-14   浏览: 149 ::
收藏到网摘: n/a

我在写晋远信息网(www.geofuture.net)时没有考虑到URL如何面向搜索引擎优化,完成了以后才开始优化的。这时要考虑一方面要静态的URL,一方面要尽量保持原有的程序不变以便于以后维护,所以就采用url_rewrite的方法。下面是httpd.conf中相应的部分

以下为引用的内容:
<VirtualHost *:80>
    DocumentRoot /home/geofuture
    ServerName www.geofuture.net
    ServerAlias *.geofuture.net geofuture.net *.cic123.com
    DirectoryIndex index.files index.html index.php
    RewriteEngine On
    #RewriteLog logs/rewrite.log
    #RewriteLogLevel 9
    #RewriteRule / http://geofuture.vicp.net/ [L]
    RewriteCond %{REQUEST_FILENAME}    index.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    error.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    cat.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    area.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    info.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    topic.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    post.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    profile.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    userinfo.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    cert.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    revise.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    review.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    feedback.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    keyrank.files   [OR]
    RewriteCond %{REQUEST_FILENAME}    rss.files
    RewriteRule ^(.+?)\Q(.*)$    $1=$2 [N]
    RewriteRule ^(.+?)ZZ(.+)$    $1&$2 [N]
    RewriteRule ^(.+?)\.files(.*)$      $1.php$2 [N]
    RewriteRule ^(.+?)\.php(/|&)(.+).html$      $1.php?$3 [L]
    ErrorDocument 400 /error.php?status=400
    ErrorDocument 401 /error.php?status=401
    ErrorDocument 403 /error.php?status=403
    ErrorDocument 404 /error.php?status=404
    ErrorDocument 405 /error.php?status=405
    ErrorDocument 408 /error.php?status=408
    ErrorDocument 410 /error.php?status=410
    ErrorDocument 411 /error.php?status=411
    ErrorDocument 412 /error.php?status=412
    ErrorDocument 413 /error.php?status=413
    ErrorDocument 414 /error.php?status=414
    ErrorDocument 415 /error.php?status=415
    ErrorDocument 500 /error.php?status=500
    ErrorDocument 501 /error.php?status=501
    ErrorDocument 502 /error.php?status=502
    ErrorDocument 503 /error.php?status=503
    ErrorDocument 506 /error.php?status=506
</VirtualHost>

我只把以内容为主的栏目优化了,至于登录和搜索等部分保持不变,因为这些部分也是搜索引擎不关心的。同时,一些常见的状态码(HTTP Status)也有相应的静态页面。上面只修改了外来请求的URL,而程序生成的URL通过下面的代码实现:

以下为引用的内容:
<?php
//--------------   SECTION NAME    -----------------------------------
// 动态URL改写成静态
function url_rewrite($buffer)
{
    //return $buffer;
    $search = array(
        '.php',
        '?',
        '&',
        'filesZZ',
        '=',
        'hrefQ',
    );
    $replace = array(
        '.files',
        '/',
        'ZZ',
        'files/ZZ',
        'Q',
        'href=',
    );
    preg_match_all('/href="\/(index|error|cat|area|info|topic| post|profile|userinfo|cert| revise|review|feeback|keyrank|rss) \.php(.*?)"/', $buffer, $match);
    $url = str_replace($search, $replace, $match[0]);
    $url = preg_replace('/\.files(.+?)(#.+?)?"$/', '.files\\1.html\\2"', $url);
    return str_replace($match[0], $url, $buffer);
}
?>

上面的函数定义放在公共头文件里面。然后,在需要优化的页面开始处加入以下代码:

ob_start("url_rewrite");

这也是原来的程序唯一需要修改的地方。这样做还有一个问题。 例如我写的分页函数等代码, 都要求原来动态的URL, 而优化了以后通过 $_SERVER['PHP_SELF'].'?'.$_SERVER['QUERY_STRING'] 就只能得到优化以后的静态URL, 所有依赖于动态URL的代码都得修改一下, 以能够处理原来的URL和优化的。这样得改写公共头文件的许多代码。所以我就想了一个迂回的办法:

以下为引用的内容:
<?php
//--------------   SECTION NAME    -----------------------------------
// 恢复成动态URL
function url_resume($url)
{
    $search = array(
        '.files',
        '.php/',
        'ZZ',
        '/ZZ',
        'Q',
        '.html',
    );
    $replace = array(
        '.php',
        '.php?',
        '&',
        '?&',
        '=',
        '',
    );
    $url = str_replace($search, $replace, $url);
    return $url;
}
?>

有了上面的函数,在需要动态URL的地方只要调用一下就可以了,而不需重写各个核心函数。需要注意的是,url_rewrite和url_resume虽然是相反的过程,但是它们的参数是不同的。前者的参数是整个缓冲区,后者只是一个单个的URL,因为恢复的情况毕竟很少,而全局处理重写可以提高速度。