基本资料 | |
用语名称 | 锟斤拷 |
---|---|
其他表述 | 锟届瀿锟斤拷雮傡锟斤拷直锟斤拷锟 |
用语出处 | 字符集转换BUG |
相关条目 | 俸俸伲购美病 |
锟斤拷是一个著名的由字符集转换bug而衍生出的用语,是乱码梗的典型代表之一。
“锟斤拷”是GBK字符集与Unicode字符集之间转换过程中出现的一种乱码现象。当Unicode字符集中某些字符无法被正确表示时,会使用一个特殊的占位符字符U+FFFD(REPLACEMENT CHARACTER)来代替。这个占位符在UTF-8编码中对应的字节是0xEFBFBD。当这个字节序列重复出现并被错误地按照GBK编码解读时,就会显示出“
这个梗的流行也与编程和计算机技术的发展有关,因为很多程序员在开发过程中经常遇到编码问题。“锟斤拷”成为了对编码错误的一种幽默和自嘲的表达方式,也反映了数字时代信息交流中可能出现的障碍。此外,与之相似的乱码现象还有“烫烫烫”和“屯屯屯”,这些也是由于不同的编码转换问题导致的。
“锟斤拷”不仅是技术应用的黑历史,也成为了网络文化中的一个有趣现象,经常出现在各种网络论坛、社交媒体和编程社区中,用来戏谑那些因编码错误导致的奇怪字符显示问题。
这类乱码现象也在一些游戏中出现过,比如RPG游戏《英雄传说 空之轨迹SC》的中文版中,“嘿嘿嘿,还好啦”因为乱码而显示成了“俸俸伲 购美病”。虽然原理和“锟斤拷”不一样,但因为同样都是乱码,同样导致了一波网络流行。亦被网友归纳为“乱码梗”,经常作为趣谈一并提起。
同样属于编码转换bug的还有“烫烫烫”、“屯屯屯”和“锘*”,因为辨识度不如锟斤拷高,所以通常很少单独被拿出来玩梗,但是和锟斤拷一起拿出来玩的概率很高:
“烫烫烫”和“屯屯屯”乱码的形成原因主要与Visual Studio的内存初始化方式有关。在Debug模式下,Visual Studio会将未初始化的栈内存填充为0xCC,而未初始化的堆内存填充为0xCD。重复出现就会在GB2312编码中对应中文字符“
“锘”开头乱码的形成和锟斤拷很像。这类错误与语言无关,错误的原因是UTF-8的BOM。BOM(Byte Order Mark)是UTF-8文档的Unicode签名,即0xEFBBBF这三个字节,当把文件编码选为UTF-8时,系统会自动在文件头部添加上这三个字节,而选为UTF-8 NO BOM时会自动去掉这三个字节。一般平台通常不会自动去加BOM,但微软会搞这些小动作,就导致了“锘”开头乱码的现象。(例1:【锘縣】开头的文本是h,http被显示为锘縣ttp;例2:【锘缝】开头的文本是p,public被显示为锘缝ulic)
|