Unicode和UTF-8,GB2312

王志勇 发表于 2009年02月08日 08:35

一点拙见,如有不正确,欢迎指正,谢谢。中文网站使用ANSI(GB2312)编码,是最理想的编码。因为ANSI编码,半角字符占用一个字节,全角字符占用2个字节。Unicode则是无论半角,还是全角,都占用2个字节。UTF-8编码,半角字符占用1个字节,全角字符占用3个字节,如这里做的对比:http://www.auiou.com/relevant/00001188.jsp

20楼和21楼的朋友说得很好。ANSI编码不支持韩国语字符,在ANSI编码下韩国语字符会转化成한국어的形式(한국어),一个韩国语字符在ANSI编码中需要占用8个字节,而一个韩国语字符在Unicode编码中占用2个字节,在UTF-8编码中占用3个字节。但愿如20楼朋友所说,希望UTF-16能够解决这一问题。

因此,如果是英文网站,因为都是半角字符,所以网页文件使用ANSI编码,或者UTF-8编码,所占用的服务器资源是一样的。然而中文网站使用ANSI(GB2312)编码,显然会比UTF-8节省10%~30%的硬盘和CPU资源,如上述文章的对比,因为有半角和全角混合,所以会产生10%~30%不等的百分比。好比是ANSI编码的汉字文件占用10兆的空间,UTF-8编码的汉字文件则占用15兆的空间,Unicode编码的汉字文件与ANSI编码同样占用10兆的空间。如果字符均是半角的英文,假如UTF-8格式的文本数据库文件总共是10兆,ANSI编码同样是10兆,Unicode编码则是20兆。所以西方人在开发网页的时候,不使用Unicode编码。

中文网站,无论数据库是使用ANSI编码,或者UTF-8编码,或者Unicode编码,当被用户端页面提取的时候,GB2312语言总是会比UTF-8语言更节省资源,从而提高速度。

2条评论:
1   自由勇 2009-02-19 20:24
Trackback来自 《回复一位网友:GB2312和UTF-8的选择

如之前的讨论,如果中文网页使用UTF-8语言,会多占用一些服务器的CPU、内存、硬盘资源,速度会稍稍慢一点。

2   华晨 2009-03-10 18:17
讲的不错

发表评论:
名字: (*必填)
博客: (可省)
验证码: c48o58n68s78i88d98e108r118a128t138i139o148n157 (*必填)

正文:

  记住信息?

直接发送Trackback到此文章

说明:本评论系统不支持HTML代码。(您的留言需要审核,审核规则请见这里。)

王志勇:1980-09-26 (40周岁)
程序设计,前端设计。

版权声明:本博客所有文章,均符合原创的定义,禁止转载,违者将必究;正确的方法是贴原文的标题和网址即可。

与此相关的链接
自由勇专栏

Blog存档 Archives

2020年10月
2020年09月(14)
2020年08月(14)
2020年07月(14)
2020年06月(16)
2020年05月(13)
2020年04月(18)
2020年03月(14)
2020年02月(15)
2020年01月(16)
2019年12月(11)
2019年11月(26)
2019年10月(25)
2019年09月(30)
2019年08月(10)
2019年07月(29)
2019年06月(30)
2019年05月(26)
2019年04月(30)
2019年03月(30)
2019年02月(30)
2019年01月(30)
2018年12月(30)
2018年11月(30)
2018年10月(30)
2018年09月(17)
2016年-2017年(9)
2014年06月-09月(10)
2013年 +

2012年 +
2011年 +
2010年 +
2009年 +
2008年 +
2007年 +
2006年 +
2005年09月(4)

Copyright © 2006-2020 auiou.com All rights reserved.
此Blog程序由王志勇编写 已经发布在Arsue