Saltar la navegación

Elementos del estándar Unicode

El estándar fue diseñado con los siguientes objetivos:

  • Universalidad: Un repertorio suficientemente amplio que albergue a todos los caracteres probables en el intercambio de texto multilingüe.
  • Eficiencia: Las secuencias generadas deben ser fáciles de tratar.
  • No ambigüedad: Un código dado siempre representa el mismo carácter.

En una cadena de datos codificada en Unicode podemos encontrar subdivisiones que articulan el contenido para hacerlo legible por otros sistemas. Los elementos que pueden componer un texto codificado con este sistema son:

  1. Caracteres gráficos: son las letras, diacríticos, símbolos, cifras, etc.
  2. Códigos de control: Unicode interacciona con otros estándares, y estos códigos son necesarios para realizar esa conexión.
  3. Caracteres necesarios para ser utilizados por fabricantes de software que permiten a los diferentes programas leer el código.
  4. Caracteres de formato entre los que se incluyen el espacio, el salto de línea, el salto de página, etc.
  5. Caracteres reservados por Unicode para su uso interno.
  6. Caracteres descartados. En este apartado se encuentran codificaciones utilizadas en versiones anteriores de Unicode, que han sido descartadas en las nuevas, pero que siguen siendo compatibles con estas aunque se debe evitar su uso.

Unicode es un estándar de desarrollo infinito, el Consorcio Unicode ha previsto la evolución de  escrituras en continua creación, como los ideogramas chinos, la combinación de signos en otros idiomas, la aparición de nuevas disciplinas con necesidades de comunicación de conocimientos con signos propios, etc. Unicode ha contemplado en su desarrollo la descomposición de signos ya reconocidos y la combinación de otros, lo que hace más ágil la creación de nuevos ideogramas en escrituras que utilizan esta grafía, como el caso del término japonés “chuugoku” que  se puede referir a China o a un distrito de Honshuu, y que es la combinación de dos términos ya existentes y codificados, como “medio” y “país” o la codificación de símbolos que son la combinación de otros dos, como el caso de la ñ española.


Grafías

Creado con eXeLearning (Ventana nueva)