BCP47 tag
BCP47 的语言标签包含了以下几个部分,每个部分以 -
分隔:
macrolang - extlang - script - region - variant - extennsion - privateuse
宏语言 扩展语言 文字 区域 变体 扩展 私有
语言
扩展语言一般是宏语言的细化,比如一般用 zh
、zho
或是 chi
表示汉语的宏语言,
cmn
表示普通话,cdo
表示闽东语,当两者结合时,宏语言就不是必要项了。
zh-cmn
会被直接解释为 cmn
。https://iso639-3.sil.org/code_tables/639/data 列出当前使用的所有标签。
主要与汉语相关的有以下几个:
-
zh / zho / chi 表示汉字的宏语言
-
cdo 闽东语
-
cmn 普通话
-
cjy 晋语
-
cnp 桂北平话
-
cpi 洋泾浜英语
-
cpx 莆仙话
-
csl 中国手语
-
csp 桂南平话
-
czh 徽州话
-
czo 闽中话
-
gan 赣语
-
hak 客家话
-
hsn 湘语
-
mnp 闽北话
-
nan 闽南话
-
wuu 吴语
-
yue 粤语
-
lzh 文言文
-
ltc 中古汉语
-
och 上古汉语
文字
文字表示的文字形式,中文主要有以下两种:
- hans 简体汉字
- hant 繁体汉字
区域
表示使用的区域,往往是没有必要指定的。
- CN 中国
- TW 台湾
- HK 香港
- MO 澳门
- SG 新加坡
变体
变体是对之前内容的进一步细分,比如 zh-latn-pinyin
表示用拼音书写的现代汉语。
扩展
这是对标签的扩展,格式是以单字符线加减号开头,直至下一个单字符加减号的字符出现,每个扩展可以带一系列以减号开头的字符串,比如:
cmn-hans-CN-u-arg1-arg2-x-arg1
,带了两个扩展:
- u 参数是 arg1 和 arg2
- x 参数是 arg1