Chaînes de caractères multi-octets
PHP Manual

Jeux de caractères supportés

Jeux de caractères supportés
Nom dans le registre IANA:ISO-10646-UCS-4
Jeux de caractères:ISO 10646
Description: Le jeu de caractères universel (Universal Character Set), avec 31 bits par caractère, au standard UCS-4 par ISO/IEC 10646. Il est synchronisé avec la dernière version d'Unicode.
Notes: Si ce nom est utilisé dans l'outil de conversion, le convertisseur essaie de reconnaître le texte à partir du dernier BOM (byte order mark), pour connaître l'ordre des bits.
Nom dans le registre IANA:ISO-10646-UCS-4
Jeux de caractères:UCS-4
Description: Voir ci-dessus.
Notes: Contrairement à UCS-4, les chaînes sont supposées être au format big endian.
Nom dans le registre IANA:ISO-10646-UCS-4
Jeux de caractères:UCS-4
Description: Voir ci-dessus.
Notes: Contrairement à UCS-2, les chaînes sont supposées être au format little endian.
Nom dans le registre IANA:ISO-10646-UCS-2
Jeux de caractères:UCS-2
Description: Le jeu de caractères universel (Universal Character Set), avec 16 bits par caractère, au standard UCS-2 par ISO/IEC 10646. Il est synchronisé avec la dernière version d'Unicode.
Notes: Si ce nom est utilisé dans l'outil de conversion, le convertisseur essaie de reconnaître le texte à partir du dernier BOM (byte order mark), pour connaître l'ordre des bits.
Nom dans le registre IANA:ISO-10646-UCS-2
Jeux de caractères:UCS-2
Description: Voir ci-dessus.
Notes: Contrairement à UCS-4, les chaînes sont supposées être au format big endian.
Nom dans le registre IANA:UTF-32
Jeux de caractères:Unicode
Description: Format de transformation d'Unicode, de 32 bits, dont les cartes correspondent au jeu stantder Unicode. Ce jeu n'est pas identique à UCS-4 car les caractères Unicode étaient limités à des valeurs de 21 bits.
Notes: Si ce nom est utilisé dans l'outil de conversion, le convertisseur essaie de reconnaître le texte à partir du dernier BOM (byte order mark), pour connaître l'ordre des bits.
Nom dans le registre IANA:UTF-32BE
Jeux de caractères:Unicode
Description: Voir ci-dessus.
Notes: Contrairement à UTF-32, les chaînes sont supposées être au format big endian.
Nom dans le registre IANA:UTF-32LE
Jeux de caractères:Unicode
Description: Voir ci-dessus.
Notes: Contrairement à UTF-32, les chaînes sont supposées être au format little endian.
Nom dans le registre IANA:UTF-16
Jeux de caractères:Unicode
Description: Format de transformation d'Unicode sur 16 bits. Il faut noter que UTF-16 n'est plus identique à UCS-2 car un mécanisme a été introduit en Unicode 2.0 et UTF-16 fait maintenant référence à un codage de 21 bits.
Notes: Si ce nom est utilisé dans l'outil de conversion, le convertisseur essaie de reconnaître le texte à partir du dernier BOM (byte order mark), pour connaître l'ordre des bits.
Nom dans le registre IANA:UTF-16BE
Jeux de caractères:Unicode
Description: Voir ci-dessus.
Notes: Contrairement à UTF-16, les chaînes sont supposées être au format little endian.
Nom dans le registre IANA:UTF-16LE
Jeux de caractères:Unicode
Description: Voir ci-dessus.
Notes: Contrairement à UTF-16, les chaînes sont supposées être au format big endian.
Nom dans le registre IANA:UTF-8
Jeux de caractères:Unicode / UCS
Description: Format de transformation Unicode de 8 bits.
Notes:none
Nom dans le registre IANA:UTF-7
Jeux de caractères:Unicode
Description: Un format compatible avec le courrier électronique d'Unicode, spécifié dans » RFC2152.
Notes:none
Nom dans le registre IANA:aucun
Jeux de caractères:Unicode
Description: Une variante d'UTF-7 qui est spécialement utilisée dans le » protocole IMAP.
Notes:none
Nom dans le registre IANA: US-ASCII (recommandé) / iso-ir-6 / ANSI_X3.4-1986 / ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII
Jeux de caractères:ASCII / ISO 646
Description: ASCII, American Standard Code for Information Interchange est un format classique de 7 bits. Il est aussi normalisé internationalement, sous le nom ISO 646.
Notes:(none)
Nom dans le registre IANA: EUC-JP (recommandé) / Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese
Jeux de caractères: Composé de US-ASCII / JIS X0201:1997 (hankaku kana) / JIS X0208:1990 / JIS X0212:1990
Description: Comme vous le voyez, le nom est dérivé de l'abréviation de Extended UNIX Code Packed Format for Japanese, ce jeu est essentiellement utilisé sur les plates-formes Unix. Le jeu original, Extended UNIX Code, est conçu sur la base de ISO 2022.
Notes: Le jeu identifié par EUC-JP est différent de IBM932 / CP932, qui est utilisé par OS/2® et Microsoft® Windows®. Pour échanger des informations avec ces plates-formes, utilisez EUCJP-WIN.
Nom dans le registre IANA:Shift_JIS (recommandé) / MS_Kanji / csShift_JIS
Jeux de caractères:Composé de JIS X0201:1997 / JIS X0208:1997
Description: Shift_JIS a été développé au début des années 80, et, au même moment, les premiers traitements de textes étaient mis sur le marché. Il a été fait pour conserver la compatibilité avec le jeu JIS X 0201:1976. Selon la définition de l'IANA, le jeu de caractères Shift_JIS est légèrement différent de IBM932 / CP932. Cependant, les noms "SJIS" et "Shift_JIS" sont souvent utilisés à tort, pour ces jeux.
Notes:Pour CP932, utilisez SJIS-WIN.
Nom dans le registre IANA:(none)
Jeux de caractères: Composé de JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions
Description: Même si ce "jeu de caractères" utilise le même jeu que EUC-JP, il est en fait différent. Il a juste quelques caractères de différence.
Notes:none
Nom dans le registre IANA:Windows-31J / csWindows31J
Jeux de caractères: Composé de JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions
Description: Même si ce "jeu de caractères" utilise le même jeu que Shift_JIS, il est en fait différent. Il a juste quelques caractères de différence.
Notes:(none)
Nom dans le registre IANA:ISO-2022-JP (recommandé) / csISO2022JP
Jeux de caractères: US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983
Description:» RFC1468
Notes:aucun
Nom dans le registre IANA:JIS
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:ISO-8859-1
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:ISO-8859-2
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:ISO-8859-3
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:ISO-8859-4
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:ISO-8859-5
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:ISO-8859-6
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:ISO-8859-7
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:ISO-8859-8
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:ISO-8859-9
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:ISO-8859-10
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:ISO-8859-13
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:ISO-8859-14
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:ISO-8859-15
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:byte2be
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:byte2le
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:byte4be
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:byte4le
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:BASE64
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:HTML-ENTITIES
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:7bit
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:8bit
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:EUC-CN
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:CP936
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:HZ
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:EUC-TW
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:CP950
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:BIG-5
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:EUC-KR
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:UHC (CP949)
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:ISO-2022-KR
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:Windows-1251 (CP1251)
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:Windows-1252 (CP1252)
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:CP866 (IBM866)
Jeux de caractères:
Description:
Notes:
Nom dans le registre IANA:KOI8-R
Jeux de caractères:
Description:
Notes: