La classe Normalizer
(PHP 5 >= 5.3.0, PECL intl >= 1.0.0)
Introduction
La normalisation est un processus qui implique la transformation de caractères et de séquences de caractères dans une représentation formelle. Ce processus est important quand des textes doivent être comparés à des fins de tri et de recherche, mais il est aussi important pour le stockage des données, afin que les documents soient cohérents.
Le consortium Unicode Consortium a défini un nombre de formes de normalisations pour refléter les différents besoins des applications :
- Normalization Form D (NFD) : décomposition canonique
- Normalization Form C (NFC) : décomposition canonique, suivie d'une composition canonique
- Normalization Form KD (NFKD) : décomposition compatible
- Normalization Form KC (NFKC) : décomposition compatible suivi d'une composition canonique
Synopsis de la classe
Normalizer
{
/* Méthodes */
}Constantes pré-définies
Les constantes suivantes définissent les formes de normalisation à appliquer par le normalizer :
-
Normalizer::FORM_C
(chaîne de caractères) - Normalization Form C (NFC) : décomposition canonique suivie d'une composition canonique
-
Normalizer::FORM_D
(chaîne de caractères) - Normalization Form D (NFD) : décomposition canonique
-
Normalizer::FORM_KC
(chaîne de caractères) - Normalization Form KC (NFKC) : décomposition compatible, suivie d'une composition canonique
-
Normalizer::FORM_KD
(chaîne de caractères) - Normalization Form KD (NFKD) : décomposition compatible
-
Normalizer::NONE
(chaîne de caractères) - Pas de décomposition/composition
-
Normalizer::OPTION_DEFAULT
(chaîne de caractères) - Options par défaut de normalisation
Sommaire
- Normalizer::isNormalized — Vérifie si une chaîne est normalisée
- Normalizer::normalize — Normalise une chaîne en entrée