Saltar la navegación

Planos

El gran número de caracteres codificados obliga a los desarrolladores de Unicode a agruparlos según sus características comunes, generando lo que se denominan “planos”. Cada plano consta de 65.535 caracteres y son:

  1. Plano básico o BMP. Contiene las codificaciones de los alfabetos más utilizados.
  2. Plano suplementario multilingüe o SMP. Dedicado a los alfabetos de lenguajes históricos menos utilizados y lenguajes técnicos.
  3. Plano suplementario ideográfico o SIP. Para caracteres muy raros.
  4. Plano de propósitos especial o SSP. Para caracteres de control no incluidos en el plano básico.
  5. Planos de uso privado para ser utilizados por fabricantes de software.

De una forma gráfica ésta es la representación de los planos:


Planos

Fuente: https://r12a.github.io/scripts/tutorial/part2

Para el uso de estos caracteres por un ordenador los datos han de ser transformados en unidades de 8, 16 y 32 bits según el contenido de los códigos asignados a cada carácter. El resultado de esta transformación se presenta bajo las siglas UTF (Unicode Transformation Format).

UTF

Lógicamente no todos los idiomas tienen el mismo número de codificaciones en Unicode, unos comparten caracteres; otros, como el cirílico quedan codificados con 256 valores, y otros, como chino, japonés y koreano (CJK) requieren de miles de codificaciones.

Veamos algunos ejemplos de las diferentes codificaciones de caracteres de un alfabeto no latino y cercano a nosotros, el caso del árabe.
La configuración de algunos caracteres básicos es:


Configuración caracteres


Que se va completando con la codificación para caracteres suplementarios


Caracteres suplementarios

Creado con eXeLearning (Ventana nueva)