BCP47 tag

作者: caixw
标签:BCP47CLDR
修改时间:

BCP47 的语言标签包含了以下几个部分,每个部分以 - 分隔:

macrolang - extlang - script - region - variant - extennsion - privateuse
宏语言      扩展语言   文字      区域     变体       扩展          私有

语言

扩展语言一般是宏语言的细化,比如一般用 zhzho 或是 chi 表示汉语的宏语言, cmn 表示普通话,cdo 表示闽东语,当两者结合时,宏语言就不是必要项了。 zh-cmn 会被直接解释为 cmnhttps://iso639-3.sil.org/code_tables/639/data 列出当前使用的所有标签。 主要与汉语相关的有以下几个:

  • zh / zho / chi 表示汉字的宏语言

  • cdo 闽东语

  • cmn 普通话

  • cjy 晋语

  • cnp 桂北平话

  • cpi 洋泾浜英语

  • cpx 莆仙话

  • csl 中国手语

  • csp 桂南平话

  • czh 徽州话

  • czo 闽中话

  • gan 赣语

  • hak 客家话

  • hsn 湘语

  • mnp 闽北话

  • nan 闽南话

  • wuu 吴语

  • yue 粤语

  • lzh 文言文

  • ltc 中古汉语

  • och 上古汉语

文字

文字表示的文字形式,中文主要有以下两种:

  • hans 简体汉字
  • hant 繁体汉字

区域

表示使用的区域,往往是没有必要指定的。

  • CN 中国
  • TW 台湾
  • HK 香港
  • MO 澳门
  • SG 新加坡

变体

变体是对之前内容的进一步细分,比如 zh-latn-pinyin 表示用拼音书写的现代汉语。

扩展

这是对标签的扩展,格式是以单字符线加减号开头,直至下一个单字符加减号的字符出现,每个扩展可以带一系列以减号开头的字符串,比如: cmn-hans-CN-u-arg1-arg2-x-arg1,带了两个扩展:

  • u 参数是 arg1 和 arg2
  • x 参数是 arg1

CLDR 通过 RFC6067 定义了以 u 开头的扩展, 浏览器的 Intl 实现该扩展功能。

本作品采用署名 4.0 国际 (CC BY 4.0)进行许可。

唯一链接:https://caixw.io/posts/2024/bcp47.html