La página de código del es el término tradicional de IBM usado para una tabla específica de la codificación del carácter: un trazado en cuál se asocia una secuencia de los pedacitos generalmente un solo octeto que representa los valores de número entero 0 a 255, a un carácter específico . El IBM y el Microsoft asignan a menudo una página de código a un juego de caracteres incluso si ese charset del es más conocido por otro nombre.

¡Mientras que la página de código del del término originó de EBCDIC - sistemas basados de IBM de la unidad central, el término es lo más comúnmente posible asociado con las páginas de código de la PC de IBM. El Microsoft, un fabricante de los sistemas operativos de la PC refiere a estas páginas de código como las páginas de código del OEM del, y las complementa con su propio " " del ANSI ; páginas de código.

¡La mayoría de las páginas de código bien conocidas, excepto ésos para las idiomas y el vietnamita CJK, representar los juegos de caracteres que caben en 8 pedacitos y no implicar cualquier cosa que no puede ser representada trazando cada código a una BITMAP simple, tal como combinar carácteres, las escrituras complejas, el etc.

El modo de texto (VGA compatible) de hardware estándar de los gráficos de la PC se construye alrededor de usar una página de código de pedacito 8, aunque es posible utilizar dos inmediatamente con un cierto sacrificio de la intensidad del color, y hasta el 8 de mayo se almacene en el adaptador de exhibición para la conmutación fácil. ¡Había una selección de pages< del código! --¿cualquier persona sabe si éstos vinieron de IBM o del ms? --> que se podría cargar en tal hardware. Sin embargo, ahora es trivialidad para que los vendedores del sistema operativo proporcionen sus propios sistemas de la codificación y de la representación del carácter que funcionen en un modo de gráficos y puenteen este sistema enteramente. Las codificaciones del carácter usadas por estos sistemas gráficos (particularmente Windows) a veces se llaman las páginas de código también.

Relación al ASCII

La base de las páginas de código de la PC de IBM es el ASCII, un código de pedacito 7 que representa 128 carácteres y códigos de control. En el pasado, las extensiones de 8 bits al ASCII cifran a menudo el sistema el pedacito superior a cero, o utilizado le como pedacito de paridad en transmisiones de datos de la red. Cuando este pedacito en lugar de otro fue hecho disponible para representar datos de carácter, otros 128 carácteres y códigos de control podrían ser representados. IBM utilizó esta gama extendida para codificar los carácteres usados por varias idiomas. Ningún estándar formal existió para estos juegos de caracteres extendidos del `'; IBM refirió simplemente a las variantes como páginas de código, como había hecho siempre para las variantes de las codificaciones del EBCDIC .

Páginas de código de la PC de IBM (OEM)

Estas páginas de código son el MS-DOS inferior más de uso frecuente - como sistemas operativos; incluyen muchos carácteres del dibujo de la caja. Puesto que la página de código original de la PC de IBM (número 437 ) no fue diseñada realmente para el uso internacional, varias variantes incompatibles emergieron. Microsoft refiere a éstos como las páginas de código del OEM. Los ejemplos incluyen:

437 — La página de código original de la PC de IBM
737 — griego
850 — " " multilingüe (Latin-1); (Idiomas de Europa occidental)
852 — " " eslavo (Latin-2); (Del este - idiomas europeas)
855 — cirílico
857 — turco
858 — " Multilingual" con símbolo euro
860 — portugués
861 — islandés
863 — francés canadiense
865 — Nordic
862 — hebreo
866 — cirílico
869 — griego

Otras páginas de código de la nota

10000 — Codificación romana de Macintosh (seguida por varios otros juegos de caracteres del mac)
10007 — Codificación cirílica de Macintosh
10029 — Codificación centroeuropea de Macintosh
932 — Ayudas japonesas
936 — Chino simplificado de las ayudas GBK
949 — Ayudas coreanas
950 — Chino tradicional de las ayudas
1200 — Pequeño-endian de Unicode de UCS-2LE
1201 — Grande-endian de Unicode de UCS-2BE
65000 — UTF-7 Unicode
65001 — UTF-8 Unicode
ASMO449+ — Ayudas árabes
MIK — Ayudas búlgaras y ruso también

En los usos modernos, sistemas operativos y lenguajes de programación, las páginas de código de IBM han sido dejadas obsoletas por más nuevos y mejores estándares internacionales, tales como ISO 8859-1 y Unicode .

Páginas de código de Windows (ANSI)

definido de Microsoft un número de páginas de código conocidas como las páginas de código del ANSI (como primera, 1252 fue basado en un bosquejo apócrifo del ANSI de qué se convirtió en ISO 8859-1 ). La página de código 1252 se emplea ISO 8859-1 pero las aplicaciones que la gama 0x80-0x9F para los carácteres imprimibles adicionales algo que los códigos de control C1 utilizó en el ISO-8859-1 . Algunos de los otros se basan en parte en otras partes de ISO 8859 pero se cambian a menudo para hacerlas más cercano a 1252.

1250 — Latín de Europa del Este
1251 — cirílico
1252 — Latín de Europa occidental
1253 — griego
1254 — turco
1255 — hebreo
1256 — árabe
1257 — báltico
1258 — vietnamita

Críticas

Muchos productos de Microsoft y de otras compañías utilizan las páginas de código de Microsoft para codificar su texto. Esto significa que el otro software tiene que elegir entre el
el trabajo con los documentos produjo con esos usos
mis-representación el texto en la pregunta
agregando la ayuda para las páginas de código de Microsoft, en efecto haciendo puesta en práctica de Microsoft un estándar de hecho de .

Que éstos y otras razones es preferible codifiquen datos en Unicode en vez de usar las páginas de código de la herencia.

Observar que el advenimiento Unicode y XML ha dejado la mayor parte de estos problemas obsoletos, porque proporciona y hace cumplir hasta cierto punto claramente las etiquetas para la codificación del carácter.

Los usos pueden también mislabel el texto en el Windows-1252 como ISO-8859-1, el juego de caracteres del defecto para el HTML. La única diferencia entre estas páginas de código es afortunadamente que las reservas de la gama ISO-8859-1 para los caracteres de control, aplicaciones Windows-1252 para los carácteres imprimibles adicionales. Puesto que los caracteres de control no tienen ninguna función en el HTML, los hojeadores de la tela tienden a utilizar Windows-1252 algo que ISO-8859-1.

Páginas de código privado

Cuando, temprano en la historia de ordenadores personales, los usuarios no encontraron sus requisitos de la codificación del carácter cumplidos, las páginas de código privado o local fueron creadas usar terminan y permanecen las utilidades residentes de o reprogramando el EPROMs del BIOS en algunos casos, las páginas oficiosas de código fueron inventadas ( e.

Cuando una ayuda más diversa del juego de caracteres estaba disponible la mayor parte de esas páginas de código cayeron en dejar de usar, con algunas excepciones tales como el la codificación o KEYBCS2 de Kamenický para el los alfabetos eslovacos checos de y . Otro juego de caracteres es sistema de Irán que codifica estándar que fue creado por la corporación del sistema de Irán para la ayuda persa de la lengua. Este estándar era funcionando en Irán en programas DOS-basados y después de que la introducción de la página de código de Microsoft 1256 este estándar llegó a ser obsoleta. Programas sin embargo algunos de Windows y del DOS usar esta codificación son todavía funcionando y algunas fuentes de Windows con esta codificación existen.

Ver también

Codificación del carácter

.

  • Zenithic
  • Sinjong of Goryeo
    Random links:Tensor simétrico | Universidad católica pontifical de Valparaíso | Arma de la llamarada | Ashburn, Virginia | Salford (distrito electoral BRITÁNICO del parlamento)

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">