当前位置: 首页 > 图文教程 > 服务器 > Linux服务器 > htaccess Rewrite中文编码问题解决方法

Linux服务器
Apache+PHP和Tomcat网页乱码问题
httpd.conf设置二级域名
SSH登录工具常用命令
对Linux系统进程进行监控和保护
如何清除代理服务器cache记录?
清除Linux代理服务器上cache记录
ssh远程登录的安全设置
Linux系统下最强大的磁盘管理技术LVM
教你搭建一个安全的Linux服务器
如何在Linux系统下实现Apache与Tomcat整合
虚拟机嵌入式Linux开发前要做什么?
修改Linux系统手动分区后的挂载
Linux系统中邮件用户绰号的超能力
Linux操作系统下使用变量为文件重新命名备份
Linux磁盘设备文件混乱源于Linux内核自身
Linux系统防黑客从辨认黑客做起
修改.htaccess文件提升网站访问速度方法
Linux认证:UbuntuNativePOSIX线程库
Linux服务器:邮件系统的原理
linux入侵常用命令汇编

Linux服务器 中的 htaccess Rewrite中文编码问题解决方法


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-04   浏览: 72 ::
收藏到网摘: n/a

Seo方面对于中文地址或则文件名,在Google好像比重要大一些,今天正好看到andy的文章.转下,以后也许会用. .htaccess文件
RewriteRule ^(.*).html$ index.php?id=$1
对于一个网址http://www.ruanchen.com/��是谁.html 我们将会遇到以下4种情况
http://www.ruanchen.com/��是谁.html (这里的”我是谁”是GB2312编码)
IE打开,接收到的id是utf8编码的”我是谁”
FireFox打开,接收不到id值,并且Apache会出现403错误。
这里需要着重说明一下,因为FireFox会将”我是谁”自动urlencode,如果你的页面链接中”我是谁”的编码是gb2312就会出错。
http://www.ruanchen.com/��是谁.html (这里的”我是谁”是UTF8编码)
IE和FireFox打开,都可以接收到id值
http://www.ruanchen.com/CE%D2%CA%C7%CB%AD.html (这里是urlencode后的”我是谁”GB2312编码)
IE和FireFox打开,都接收不到id值,并且Apache会出现403错误。
http://www.ruanchen.com/E6%88%91%E6%98%AF%E8%B0%81.html (这里是urlencode后的”我是谁”UTF8编码)
IE和FireFox打开,都可以接收到id值
说明:
“我是谁”的UTF8编码urlencode后为 %E6%88%91%E6%98%AF%E8%B0%81
“我是谁”的GB2312编码urlencode后为 %CE%D2%CA%C7%CB%AD
结论:
Rewrite只接收UTF8
IE和FireFox对中文URL的编码不同,要注意.
这也是为什么上面的例子接收不到id值,并且出403错误.
为了避免这种情况出现,页面中的链接最好是UTF8编码的,如果是GB2312,一定会有问题.
最好的习惯是UTF8编码并urlencode,也就是上文的例4.