啊嘞?! 怎么回事 这个角色怎么没有头的样子…… | |
基本资料 | |
本名 | UTF-8娘 |
---|---|
萌点 | 精通多国文字,可以为世界各地所有欧尼酱提供杀~必~死~哟~ |
UTF8娘是字符编码UTF-8的拟人化萌娘。
UTF8娘出生在一个叫Unicode的国度,自小就致力于学习多个国家的文字,因为性格随和聪慧,全世界几乎所有电脑设备都能看到她的身影,在人们看不到的地方,默默地按照自己的标准为他们将文字和二进制编码间互相转换,比如欧尼酱你现在看到的萌娘百科页面就是UTF8娘为你编码的哦!
UTF8娘有特别的记忆技巧,在尽可能多地精通各国语言文字的前提下,最大限度节约存储空间,采用了可变长字符编码方式,原128个ASCII字符(主要是英文字符)只需要一个字节,拉丁文、阿拉伯文和希伯来文等需要两个字节,而中文、日文和韩文等则需要三个字节,所以某些怪叔叔觉得UTF8娘是在歧视东亚人(实际上很多本土字符编码也是可变长的,例如GBK娘存储汉字需要两个字节,而单字节区间和ASCII也是一样的,算不算本土人自己歧视自己呢?),以至于目前绝大部分中文web站点宁可牺牲设备兼容性,都使用GBK娘(其实是一种强迫症)通常原因不外乎于节约数据库容量和迁移问题,主要以传统行业、政府、银行和老牌大型门户为主。
但可喜的是目前越来越多人意识到采用UTF8娘无论对于开发者,或者使用者都有莫大的好处,哪怕是淘宝买回来根本不支持中文的洋垃圾设备通常都可以很好地浏览UTF8娘编码的中文站点,至于GBK娘的就只能刷出满屏锟斤拷锟斤拷锟斤拷锟斤拷(即UTF-8的��������)。另外UTF8娘在丢失字节的情况下乱码不会扩散,而GB2312娘在丢失字节的情况下会导致后续字符都是乱码[1][2]。所以目前不少新网站,尤其是针对年轻人和IT从业人员的站点都采用了UTF8娘。