1.ASCII字符
ASCII码的全称是AmericanStandardCodeforInformationInterchange(美国信息互换标准代码),使用指定的7位或8位二进制数组合来表示128或256种可能的字符。
标准ASCII码也叫基础ASCII码,使用7位二进制数来表示所有的数字、大小写字母、英文标点符号,以及一些特殊的控制字符。
后128个称为扩展ASCII码。扩展ASCII码允许将每个字符的第8位用于确定附加的128个特殊符号字符、外来语字母和图形符号。
ASCII字符可用通过Word的菜单命令[插入]/[符号]中,来自“ASCII(十进制)”/“ASCII(十六进制)”。
注:在Word的查找替换中,一个ASCII字符可用^nnn来表示,范围是1~128,比如:字母X,可表示为^88。
另外,某些ASCII控制字符(即不能显示的字符,如:制表符、回车符),被赋予了特殊的含义,而不再代表一个字符。
标准ASCII字符集
该文章内容来源于网络,由强国说-WPS之家(wps.qiangguoshuo.com)收集,希望能为广大朋友提供帮助。
2.ANSI字符
为使计算机支持更多语言,通常使用0x800xFF范围的2个字节来表示1个字符。比如:汉字“中”在中文操作系统中,使用[0xD6,0xD0]这两个字节存储。
不同的国家和地区制定了不同的标准,由此产生了GBK(简体中文),BIG5(繁体中文),JIS(日语)等各自的编码标准。这些使用2个字节来代表一个字符的各种汉字延伸编码方式,称为ANSI编码。在简体中文操作系统下,ANSI编码代表GBK编码。扩展ASCII码可视为英文系统下的ANSI字符集。
注:在Word的查找替换中,一个ANSI字符可用^0nnn来表示,范围是1~255。比如:字母X,可表示为^088。另外,ANSICharacter并不代表GBK字符,而似乎和扩展ASCII码相同。
3.Unicode字符
Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换和处理的要求。
Unicode字符可用通过Word的菜单命令[插入]/[符号]中,选择“Unicode(十六进制)”即可。常用汉字(CJK统一汉字)的范围是4E00~9FA5(一~龥),因此,通配符“[一-龥]”可以表示一个汉字。
注:在Word的查找替换中,一个Unicode字符可用^Unnnn来表示(关闭“使用通配符”选项),比如:中国,可表示为^u20013^u22269。不支持16进制表达。
转载声明:本站发布文章及版权归原作者所有,转载本站文章请注明文章来源!