GBK和UTF 8编码有什么区别?GBK有什么好处?
UTF-8是国际标准字符编码。我们知道Windows系统程序把UTF-8变成了Unicode,GBK是为中国国情而创造的,但是GBK也会随着汉字一起传承下去。
GBK和UTF-8文字编码的特点:
GBK的字符编码用双字节表示,即中英文字符都用双字节表示,但为了区分汉字,最高位设置为1。
至于UTF-8编码,它是国际字符的多字节编码。英语使用8位(即一个字节),汉语使用24位(三个字节)。对于英文字符较多的论坛,使用UTF-8节省空间。
GBK和UTF-8文字编码的区别:
GBK包含所有汉字;
UTF-8包含了世界上所有国家都需要的字符。
GBK是在国标GB2312的基础上扩展后兼容GB2312的标准。(好像不是国家标准)
UTF8编码文本可以在不同国家支持UTF8字符集的不同浏览器上显示。
比如如果是UTF8编码,可以在外国人的英文IE上显示中文,不需要下载IE的中文语言支持包。
因此,对于英语较多的论坛,GBK每个字符占用2个字节,而UTF-8英语只占用1个字节。
注意:
UTF-8版本具有良好的国际兼容性,但中文需要比GBK/BIG5版本多占用50%的数据库存储空间,因此不建议使用,只针对对国际兼容性有特殊要求的用户。
总结:
GBK的意思是,当你保存你的帖子时,一个汉字会占用两个字节。外国人会看到乱码,这是汉字自己编码形成的解决方案。
UTF8表示保存帖子时,一个汉字占用3个字节。但是外国人看不懂乱码,这是西方人为了解决多字节字符而形成的解决方案。
ASCII(ISO-8859-1)是鼻祖,最简单的方式,高位字节是0。
GB2312,GBK,GB18030,这些都是中文编码方式,并且向后兼容。GB2312包含7000多个汉字和字符,GBK包含21000多个,GB18030更强大,达到27000多个。它们都用2个字节来表示一个汉字。它与ascii有什么区别?如果高字节的高位为1(即高字节大于127),则表示是汉字,低字节没有明显特征。
Unicode是一个统一的代码,它在全世界建立了一个统一的码表。在这个代码表中,世界上所有的字符都是唯一的。
UTF-8是一种Unicode的存储和传输方法。它将整个Unicode代码表分为三个部分。
0000-007F是原ascii部分,按照原存储方式,即0
版权声明:GBK和UTF 8编码有什么区别?GBK有什么好处?是由宝哥软件园云端程序自动收集整理而来。如果本文侵犯了你的权益,请联系本站底部QQ或者邮箱删除。