支持的字符編碼

當前 mbstring 模塊支持以下的字符編碼。這些字符編碼中的任意一個都能指定到 mbstring 函數(shù)中的 encoding 參數(shù)。

該 PHP 擴展支持的字符編碼有以下幾種:

  • UCS-4*
  • UCS-4BE
  • UCS-4LE*
  • UCS-2
  • UCS-2BE
  • UCS-2LE
  • UTF-32*
  • UTF-32BE*
  • UTF-32LE*
  • UTF-16*
  • UTF-16BE*
  • UTF-16LE*
  • UTF-7
  • UTF7-IMAP
  • UTF-8*
  • ASCII*
  • EUC-JP*
  • SJIS*
  • eucJP-win*
  • SJIS-win*
  • ISO-2022-JP
  • ISO-2022-JP-MS
  • CP932
  • CP51932
  • SJIS-mac** (別名: MacJapanese)
  • SJIS-Mobile#DOCOMO** (別名: SJIS-DOCOMO)
  • SJIS-Mobile#KDDI** (別名: SJIS-KDDI)
  • SJIS-Mobile#SOFTBANK** (別名: SJIS-SOFTBANK)
  • UTF-8-Mobile#DOCOMO** (別名: UTF-8-DOCOMO)
  • UTF-8-Mobile#KDDI-A**
  • UTF-8-Mobile#KDDI-B** (別名: UTF-8-KDDI)
  • UTF-8-Mobile#SOFTBANK** (別名: UTF-8-SOFTBANK)
  • ISO-2022-JP-MOBILE#KDDI** (別名: ISO-2022-JP-KDDI)
  • JIS
  • JIS-ms
  • CP50220
  • CP50220raw
  • CP50221
  • CP50222
  • ISO-8859-1*
  • ISO-8859-2*
  • ISO-8859-3*
  • ISO-8859-4*
  • ISO-8859-5*
  • ISO-8859-6*
  • ISO-8859-7*
  • ISO-8859-8*
  • ISO-8859-9*
  • ISO-8859-10*
  • ISO-8859-13*
  • ISO-8859-14*
  • ISO-8859-15*
  • ISO-8859-16*
  • byte2be
  • byte2le
  • byte4be
  • byte4le
  • BASE64
  • HTML-ENTITIES
  • 7bit
  • 8bit
  • EUC-CN*
  • CP936
  • GB18030**
  • HZ
  • EUC-TW*
  • CP950
  • BIG-5*
  • EUC-KR*
  • UHC (CP949)
  • ISO-2022-KR
  • Windows-1251 (CP1251)
  • Windows-1252 (CP1252)
  • CP866 (IBM866)
  • KOI8-R*
  • KOI8-U*
  • ArmSCII-8 (ArmSCII8)

* 表示該編碼也可以在正則表達式中使用。

** 表示該編碼自 PHP 5.4.0 始可用。

任何接受編碼名稱的 php.ini 條目同樣也可以使用 "auto" 和 "pass" 的值。 接受編碼名的 mbstring 函數(shù)同樣也可以使用值 "auto"。

如果設置了 "pass",將不會對字符的編碼進行轉(zhuǎn)化。

如果設置了 "auto",它將擴展成 NLS 中定義的每個字符編碼列表。 比如,假設 NLS 設置為 Japanese,值將會認為是 "ASCII,JIS,UTF-8,EUC-JP,SJIS"。

參見 mb_detect_order()