国家标准强制标准冠以“GB”。推荐标准冠以“GB/T”。与很多ISO国际标准相比,很多国家标准等同采用(IDT,identical to 其他标准)、修改采用(MOD,modified in relation to 其他标准;2000年以前称作“等效采用,EQV, equivalent to 其他标准)或非等效采用(NEQ,not equivalent to 其他标准)。
现时中华人民共和国官方强制使用GB 18030标准,但较旧的计算机仍然使用GB 2312。
“GB”在计算机领域中常常表示GB 2312-80或GB 18030-2005。两者是汉语编码系统的标准,在中国大陆和新加坡用于简体中文。
GB 2312 - 80
信息交换用汉字编码字符集 基本集(又称为GB0)
GB 13000 - 93
信息技术 通用多八位编码字符集(UCS)第一部分
GB 18030 - 2000
信息技术 信息交换用汉字编码字符集 基本集的扩充
其他中华人民共和国发布有关汉字标准代码列表:
GB/T 12345 - 90
信息交换用汉字编码字符集 第一辅助集(又称为GB1)
GB/T 7589 - 87
信息交换用汉字编码字符集 第二辅助集(又称为GB2)
GB 13131 - 91
信息交换用汉字编码字符集 第三辅助集(又称为GB3)
GB/T 7590 - 87
信息交换用汉字编码字符集 第四辅助集(又称为GB4)
GB 13132 - 91
信息交换用汉字编码字符集 第五辅助集(又称为GB5)
GB/T 16500 - 1998
信息交换用汉字编码字符集 第七辅助集
国家推荐标准以 "/T" 来表示并非强制执行。
由于GB 2312-80只收录了6763个汉字,未能覆盖繁体中文字、部分人名、方言、古汉语等方面出现的罕用字,所以发布了以上的辅助集。
其中,GB/T 12345-90辅助集是GB 2312-80基本集的繁体字版本;GB 13131-91是GB/T 7589-87的繁体字版本;GB 13132-91是GB/T 7590-87的繁体字版本。而GB/T 16500-1998是繁体字版本,它并无对应的简体字版本。
鉴于第二辅助集及第四辅助集,有不少汉字均是“类推简化汉字”,实用性不高,因而较少人采用。
中华人民共和国国家标准总局于2000年推出强制性的GB 18030-2000标准。于2001年8月31日后发布或出厂的产品,必须符合GB 18030-2000的相关要求。
标准号 | 名称 | 别名 | 汉字数 | 备注 |
GB 2312-80 | 信息交换用汉字编码字符集 基本集 | GB /GB0 | 6763 | GB 6345.1-86 等字模集有附录对 GB 2312-80 之修订,但 GB 2312 本身一直未有更新,详见 GB 2312 条目 |
GB/T 7589-87 | 信息交换用汉字编码字符集 第二辅助集 | GB2 | 7237 | 向 ISO 10646 提交时使用繁体字版本 |
GB/T 7590-87 | 信息交换用汉字编码字符集 第四辅助集 | GB4 | 7039 | 向 ISO 10646 提交时使用繁体字版本 |
GB 8565.2-88 | 信息处理文本通讯用编码字符集 第二部分 | 无 | 636 | 主要用于电讯;GB2汉字520个、GB4汉字92个、来自《第一批异体字整理表》之异体字23个及“啰”字。此字符集补充了 GB 2312,使之能包括整个《现代汉语通用字表》 |
GB/T 12345-90 | 信息交换用汉字编码字符集 第一辅助集 | GB1 | 6866 | GB 2312 繁体版,增补103字 |
GB 13131-91 | 信息交换用汉字编码字符集 第三辅助集 | GB3 | 7237 | GB/T 7589 繁体版 |
GB 13132-91 | 信息交换用汉字编码字符集 第五辅助集 | GB5 | 7039 | GB/T 7590 繁体版 |
ISO-IR-165 | 通讯用中文多字节字符集 | 8464 | 集合 GB 2312-80(包括 GB 6345.1-86 新增之字符及调整)及 GB 8565.2-88 | |
GB 13000.1-93 | 信息技术 通用多八位编码字符集(UCS)第一部分 | 20902 | 另有302个兼容汉字(当中十二个:U+FA0E, U+FA0F, U+FA11, U+FA13, U+FA14, U+FA1F, U+FA21, U+FA23, U+FA24, U+FA27, U+FA28 及 U+FA29 有独立形音义,统一码联盟建议不要视之为兼容汉字 | |
GBK | 汉字扩展内码规范 | 21003 | 除了来自 ISO 10646-1 / GB 13000.1 之20902字,另有 ISO 10646-1 / GB 13000.1 中21个兼容汉字(包括上述十二个有独立形音义兼容字),以方便和 Big5、CNS11643、JIS 及 IBM 文件双向转换、未收入 ISO 10646 的《简化字总表》汉字52个、《康熙字典》及《辞海》汉字部件28个;后80字暂时对应 Unicode 编码之私人使用区(Private Use Area),新版 Unicode 已全部收纳。Microsoft Code Page 936 收入21个兼容汉字,未收后80字 | |
GB/T 15564-1995 | 图文电视广播用汉字编码字符集 香港子集 | 111 | 所有字皆来自 GB 13000.1 | |
GB/T 16500-1998 | 信息交换用汉字编码字符集 第七辅助集 | 3778 | 其他 GB 未收录之 GB13000.1 汉字 | |
GB 18030-2005 | 信息技术 中文编码字符集 | 70244 | 首版本 GB 18030-2000 |
标准号 | 名称 | 别名 | 汉字数 | 备注 |
GB 2312-80 | 信息交换用汉字编码字符集 基本集 | GB /GB0 | 6763 | GB 6345.1-86 等字模集有附录对 GB 2312-80 之修订,但 GB 2312 本身一直未有更新,详见 GB 2312 条目 |
GB/T 7589-87 | 信息交换用汉字编码字符集 第二辅助集 | GB2 | 7237 | 向 ISO 10646 提交时使用繁体字版本 |
GB/T 7590-87 | 信息交换用汉字编码字符集 第四辅助集 | GB4 | 7039 | 向 ISO 10646 提交时使用繁体字版本 |
GB 8565.2-88 | 信息处理文本通讯用编码字符集 第二部分 | 无 | 636 | 主要用于电讯;GB2汉字520个、GB4汉字92个、来自《第一批异体字整理表》之异体字23个及“啰”字。此字符集补充了 GB 2312,使之能包括整个《现代汉语通用字表》 |
GB/T 12345-90 | 信息交换用汉字编码字符集 第一辅助集 | GB1 | 6866 | GB 2312 繁体版,增补103字 |
GB 13131-91 | 信息交换用汉字编码字符集 第三辅助集 | GB3 | 7237 | GB/T 7589 繁体版 |
GB 13132-91 | 信息交换用汉字编码字符集 第五辅助集 | GB5 | 7039 | GB/T 7590 繁体版 |
ISO-IR-165 | 通讯用中文多字节字符集 | 8464 | 集合 GB 2312-80(包括 GB 6345.1-86 新增之字符及调整)及 GB 8565.2-88 | |
GB 13000.1-93 | 信息技术 通用多八位编码字符集(UCS)第一部分 | 20902 | 另有302个兼容汉字(当中十二个:U+FA0E, U+FA0F, U+FA11, U+FA13, U+FA14, U+FA1F, U+FA21, U+FA23, U+FA24, U+FA27, U+FA28 及 U+FA29 有独立形音义,统一码联盟建议不要视之为兼容汉字 | |
GBK | 汉字扩展内码规范 | 21003 | 除了来自 ISO 10646-1 / GB 13000.1 之20902字,另有 ISO 10646-1 / GB 13000.1 中21个兼容汉字(包括上述十二个有独立形音义兼容字),以方便和 Big5、CNS11643、JIS 及 IBM 文件双向转换、未收入 ISO 10646 的《简化字总表》汉字52个、《康熙字典》及《辞海》汉字部件28个;后80字暂时对应 Unicode 编码之私人使用区(Private Use Area),新版 Unicode 已全部收纳。Microsoft Code Page 936 收入21个兼容汉字,未收后80字 | |
GB/T 15564-1995 | 图文电视广播用汉字编码字符集 香港子集 | 111 | 所有字皆来自 GB 13000.1 | |
GB/T 16500-1998 | 信息交换用汉字编码字符集 第七辅助集 | 3778 | 其他 GB 未收录之 GB13000.1 汉字 | |
GB 18030-2005 | 信息技术 中文编码字符集 | 70244 | 首版本 GB 18030-2000 |
中华人民共和国国家标准
ISO/IEC 2022
^ ISO 10646 收录的是其非简化形式(unsimplified forms),见中日韩统一表意文字#字源
^ 向 ISO 10646 提交汉字时称为 G8
^ 一说8443(Ken Lunde, CJKV Information Processing, 1999, O'Reilly & Associates, Inc., P.82)
^ 4.0 4.1 简体中文版 Windows 95 “GBK 内码输入法”帮助文件,1995年
^ 在 ISO 10646 文件中称为 GE;本应称为“GB7”,但中国向 ISO 10646 提交汉字时将《现代汉语通用字表》称为 G7
^ 在 ISO 10646 文件中称为 G9