|
与此相关的链接
和平海底2 | Auciou | 自由勇专栏
公益:UFO问答与2012年升华
郝相国先生外星人接触官方网站
呼叫星际联邦/祈祷/许愿
我们看不见外星人的原因
郝相国先生与外星人接触进展(6)
郝相国先生与外星人接触进展(5)
Blog存档 Archives
2010年05月(4)
2010年01月(7)
2009年12月(10)
2009年11月(4)
2009年10月(8)
2009年09月(24)
2009年08月(20)
2009年07月(6)
2009年06月(11)
2009年05月(16)
2009年04月(20)
2009年03月(29)
2009年02月(18)
2009年01月(15)
2008年12月(17)
2008年11月(10)
2008年10月(13)
2008年09月(8)
2008年08月(4)
2008年07月(5)
2008年06月(9)
2008年05月(12)
2008年04月(15)
2008年03月(26)
2008年02月(22)
2008年01月(29)
2007年12月(30)
2007年11月(28)
2007年10月(30)
2007年09月(8)
2007年08月(8)
2007年07月(21)
2007年06月(23)
2007年05月(31)
2007年04月(34)
2007年03月(29)
2007年02月(18)
2007年01月(41)
2006年12月(23)
2006年11月(10)
2006年10月(10)
2006年09月(29)
2006年08月(33)
2006年07月(17)
2006年06月(30)
2006年05月(4)
2006年01月(3)
2005年09月(4)
王志勇 发表于 2007年01月17日 12:15
语言设置指的是<meta>这里的charset,如简体中文是charset=gb2312,UTF-8是charset=utf-8;文本编码指的是文件的储存格式,我们新建的文本文件默认都是ANSI格式,所以不能含有如©、®这类字符。为了不让网页出现乱码,语言设置和文本编码应该相对应,简体中文的文本编码格式是gb2312,UTF-8文本编码格式是UTF-8。语言设置和文本编码对于任何客户端网页都适用,如.htm、.asp、.php、.jsp、.aspx的网页。 ANSI和UTF-8文本编码的体积,我这里做了一些实验,同一个字符重复N次,均去掉了Unicode签名(BOM),如下表: 总结:(以下的byte就是字节) 1、半角的字符,如英文、数字、半角符号,ANSI和UTF-8文本编码的体积比是1:1,UTF-8格式会多出3个byte。 总之,英文、数字、半角符号,在ANSI和UTF-8编码格式下都占用1个byte;中文,全角标点,在ANSI下占用2个byte,在UTF-8下占用3个byte。字符 编码格式 重复次数 文件体积 英文、半角字符: a ANSI 100次 100 bytes A ANSI 100次 100 bytes a UTF-8 100次 100 bytes a UTF-8 1000次 1000 bytes a UTF-8 10000次 10000 bytes 汉字、全角字符: 好 ANSI 100次 200 bytes あ ANSI 100次 200 bytes 好 UTF-8 100次 300 bytes ® UTF-8 100次 200 bytes 한 UTF-8 100次 300 bytes 好 UTF-8 1000次 3000 bytes 好 UTF-8 10000次 30000 bytes Unicode编码格式: a Unicode 100次 200 bytes 好 Unicode 100次 200 bytes ® Unicode 100次 200 bytes 한 Unicode 100次 200 bytes 한 Unicode 1000次 2000 bytes
2、中文字符,ANSI和UTF-8文件的体积比是1:2,UTF-8格式多出3个byte。
3、©、®这2个字符,在UTF-8格式下,与中文字符的体积一样。
4、韩文字符不能使用ANSI格式。韩文在UTF-8格式下,一个字符占用3个byte;韩文在Unicode格式下,一个字符占用2个byte;
5、Unicode码则比较折中,所有字符都占用2个byte。
UTF-8的Trackback: http://www.auiou.com/capable/trackbacksw.jsp?kskv00001188
» 直接发送Trackback到此文章 » GB2312及其它语言的Trackback地址
本Blog开通了近5个月,网页一直使用gb2312语言、文本使用标准ANSI编码。中文Blog在2005年、2006年这两年,呈现出了极其壮观的场面,Blog在网络中,几乎可以最大程度地促进和改善一个人的理性思考能力。中文Blog,UTF-8语言编码占多数,我估计约占70%,gb2312语言编码约占30%。
说明:本评论系统不支持HTML代码。
最新的评论 Comments:
» 近期的论坛开发日记
» QQ群需要黑名单功能
» 有可能是这样
» 严肃地了解2012
» 祝大家五一快乐
» QQ2010的年龄资料
» ANSI和UTF-8文
» 日记:2010-01-
近期的主题:
有可能是这样
QQ2010的年龄资料很不方便
QQ群需要黑名单功能
祝大家五一快乐
严肃地了解2012
日记:2010-01-17
祈祷website存活
获知真相
日记:2010-01-04
制作了新的博客风格
感受30岁的第1天
日记:2009-12-30
“蛇娃”的病是有希望治愈的
悲剧的原因
为他们的贝岸工作说句公道话
年底的感言
金山词霸与美式英语
有关斜视治疗的研究讨论
感动,回味中……
2个网站挂了
恭喜新博客开通!
快完成了
显卡与显示器“不兼容”偏色解决一例
寻1987年出生,我的被拐走的弟弟王志生(左手通观手,即断掌)
最近
网页中的路径/
循环程序的写法与速度对比
博客防spam/陌生人恶意留言另一方案
二级域名的博客在本地建立虚拟主机
重新编写了Trackback程序
Apache实现多域名解析同一空间简法
Apache在本地建立泛域名虚拟主机简法
使用Apache作为本地虚拟主机预览博客
ixwebhosting更换了服务器
博客+论坛的方式
如何关闭ixwebhosting的访问日志
一张原理图的绘制过程
祝我29周岁生日快乐
Photoshop,CorelDRAW,Word的选用
|