Unicode和UTF-8,GB2312

王志勇 发表于 2009年02月08日 08:35

一点拙见,如有不正确,欢迎指正,谢谢。中文网站使用ANSI(GB2312)编码,是最理想的编码。因为ANSI编码,半角字符占用一个字节,全角字符占用2个字节。Unicode则是无论半角,还是全角,都占用2个字节。UTF-8编码,半角字符占用1个字节,全角字符占用3个字节,如这里做的对比:http://www.auiou.com/relevant/00001188.jsp

20楼和21楼的朋友说得很好。ANSI编码不支持韩国语字符,在ANSI编码下韩国语字符会转化成한국어的形式(한국어),一个韩国语字符在ANSI编码中需要占用8个字节,而一个韩国语字符在Unicode编码中占用2个字节,在UTF-8编码中占用3个字节。但愿如20楼朋友所说,希望UTF-16能够解决这一问题。

因此,如果是英文网站,因为都是半角字符,所以网页文件使用ANSI编码,或者UTF-8编码,所占用的服务器资源是一样的。然而中文网站使用ANSI(GB2312)编码,显然会比UTF-8节省10%~30%的硬盘和CPU资源,如上述文章的对比,因为有半角和全角混合,所以会产生10%~30%不等的百分比。好比是ANSI编码的汉字文件占用10兆的空间,UTF-8编码的汉字文件则占用15兆的空间,Unicode编码的汉字文件与ANSI编码同样占用10兆的空间。如果字符均是半角的英文,假如UTF-8格式的文本数据库文件总共是10兆,ANSI编码同样是10兆,Unicode编码则是20兆。所以西方人在开发网页的时候,不使用Unicode编码。

中文网站,无论数据库是使用ANSI编码,或者UTF-8编码,或者Unicode编码,当被用户端页面提取的时候,GB2312语言总是会比UTF-8语言更节省资源,从而提高速度。

2条评论:
1   自由勇 2009-02-19 20:24
Trackback来自 《回复一位网友:GB2312和UTF-8的选择

如之前的讨论,如果中文网页使用UTF-8语言,会多占用一些服务器的CPU、内存、硬盘资源,速度会稍稍慢一点。

2   华晨 2009-03-10 18:17
讲的不错

发表评论:
名字: (*必填)
博客: (可省)
验证码: c48o58m68p78a88r98e108 (*必填)

正文:

  记住信息?

王志勇:1980-09-26 (44周岁)
程序设计,前端设计。

版权声明:本博客所有文章,均符合原创的定义,禁止转载,违者将必究;正确的方法是贴原文的标题和网址即可。

与此相关的链接
自由勇专栏

Blog存档 Archives

2022年07月
2022年06月(15)
2022年05月(20)
2022年04月(16)
2022年03月(9)
2022年02月(9)
2022年01月(10)
2021年 +

2020年 +
2019年 +
2018年 +
2016年-2017年(9)
2014年06月-09月(10)
2013年 +
2012年 +
2011年 +
2010年 +
2009年 +
2008年 +
2007年 +
2006年 +
2005年09月(4)

Copyright © 2006-2024 auiou.com All rights reserved.
此Blog程序由王志勇编写