¡ Código ASCII del ( ASCII ), pedir-EE generalmente pronunciada ˈæski (), es una codificación del carácter basada en el alfabeto inglés . Los códigos del ASCII representan el texto en el equipo de las comunicaciones de las computadoras, y otros dispositivos que funcionen con el texto. La mayoría de las codificaciones modernas - que del carácter apoyan muchos más carácteres que la original - tener una base histórica en el ASCII.

El trabajo sobre el ASCII comenzó en 1960. La primera edición del estándar fue publicada en 1963, una revisión importante en 1967, y la actualización más reciente de 1986. Define actual los códigos para 128 carácteres: 33 son los caracteres de control sin impresión, sobre todo obsoletos que afectan a cómo se procesa el texto, y 95 son carácteres imprimibles.

¡gobierno federal, entonces el comprador más grande del material informático, era probablemente la sola razón más importante de la adopción amplia subsecuente de ASCII." - Gris de Martha M. ¿/*?? * --> El el el 11 de marzo, el 1968, Lyndon B. Johnson del presidente de los E. asignó que por mandato todas las computadoras compradas por el apoyo gubernamental federal ASCII de Estados Unidos, indicando: el

I también han aprobado las recomendaciones de la secretaria del comercio con respecto a los estándares para registrar el código estándar para el intercambio de información en cintas magnéticas y las cintas de papel cuando se utilizan en la computadora operations.

las computadoras del

All y las configuraciones de equipo relacionadas traídas en el inventario del gobierno federal el y después del 1 de julio, 1969, deben tener la capacidad para utilizar el código estándar para el intercambio de información y los formatos prescritos por la cinta magnética y los estándares de cinta de papel cuando estos medios son used.

Descripción

Como otros códigos de la computadora de la representación de carácter el ASCII especifica una correspondencia entre las configuraciones de bits digitales y los Glyphs (es decir, símbolos) de una lengua escrita. Esto permite que los dispositivos de Digitaces comuniquen con uno a y procesen, almacenen, y comuniquen la información character-oriented. La codificación del carácter de ASCII - o una extensión compatible (véase abajo) - se utiliza en casi todas las computadoras comunes, especialmente los ordenadores personales y los sitios de trabajo que El MIME preferred nombra para esta codificación es " Nosotros-ASCII".

A excepción de algunos de los caracteres de control ASCII que prescriben un cierto formato line-oriented elemental, el ASCII no define ningún mecanismo para describir la estructura o el aspecto del texto dentro de un documento. Otros esquemas, tales como página de la dirección de las idiomas de margen de beneficio y disposición y formato del documento.

Historia

El ASCII es, terminantemente, siete un código del pedacito, significando que utiliza los patrones de siete dígitos binarios (una gama del decimal 0 a 127) para representar cada carácter. Cuando el ASCII fue introducido, muchas computadoras utilizaron los octetos de ocho bites (grupos de pedacitos), llamados octetos, como el tipo de datos nativo. En la codificación del siete-pedacito ASCII, el octavo pedacito era de uso general como pedacito de paridad para el repaso de las faltas en líneas de comunicación o para otras funciones device-specific. Las máquinas que no utilizaron la comprobación de paridad típicamente fijaron el octavo pedacito al 0 .

El American National Standards Institute (entonces llamado los estándares de los Estados Unidos de América instituir o USASI) desarrolló el ASCII basado en sistemas anteriores de la codificación del teleimpresor . Circa 1956, Ivan Idelson, en el Ferranti en el Reino Unido, había propuesto que Cluff-Fomentar-Idelson la codificación de carácteres en la pista 7 de cinta de papel a un comité de los estándares británicos . Éste se convierte en eventual ASCII. El ASCII sí mismo primero incorporó uso comercial a 1963 como código del teleimpresor del siete-pedacito para red TWX (intercambio de s americano del teléfono y del telégrafo 'de la área extendida del teletipo). TWX utilizó original el código five-bit anterior de Baudot, que también fue utilizado por el sistema competente del teleimpresor Telex . El sistema de Bell había planeado aumentar a un código de seis bits derivado del proyecto de Fieldata, que agregó la puntuación y letras minúsculas al código de Baudot, pero fue persuadido en lugar de otro para ensamblar al subcomité americano de la asociación de los estándares (parte de ANSI ) que había comenzado a desarrollar el ASCII. Comparado con códigos de telégrafo anteriores, el código de Bell y el ASCII propuestos ambos experimentaron reordenar para una clasificación más conveniente (especialmente alfabetización) de listas, y las características agregadas para los dispositivos con excepción de los teleimpresores. El Bob Bemer introdujo características tales como la semencia de escape. Su británico Hugh McGregor Ross del colega ayudó a popularizar este trabajo - según Bemer, " tanto de modo que el código que era convertirse en ASCII primero fuera llamado el código de Bemer-Ross en Europe".

El ASCII fue puesto al día y publicó posteriormente como USASI X3.4-1977, y finalmente, ANSI X3.

Otros cuerpos de estándares internacionales han ratificado las codificaciones del carácter tales como ISO/IEC 646 que son idénticas o casi idénticas al ASCII, con las extensiones para los carácteres fuera del alfabeto inglés y de los símbolos usados fuera de los Estados Unidos, tales como el símbolo para libra esterlina de s de Reino Unido el la ' (£). Casi cada país necesitó una versión adaptada del ASCII puesto que el ASCII se adaptó solamente a las necesidades de los E. y de algunos otros países. Por ejemplo, Canadá tenía su propia versión que apoyó francés. Aunque estas codificaciones se refieran a veces como ASCII, el ASCII verdadero es definido terminantemente solamente por estándar del ANSI.

El ASCII se ha incorporado en el juego de caracteres de Unicode como los primeros 128 símbolos, así que los carácteres de ASCII tienen los mismos códigos numéricos en ambos sistemas. Esto permite que el UTF-8 sea el al revés - compatible con ASCII, una ventaja significativa.

Caracteres de control del ASCII

El ASCII reserva los primeros 32 códigos (decimal de los números 0-31) para los códigos de los caracteres de control previstos original para no llevar la información imprimible, pero algo a los dispositivos de control (tales como impresoras que hacen uso del ASCII, o proporcionar la meta-información sobre secuencias de datos tales como ésos almacenó en cinta magnética. Por ejemplo, el carácter 10 representa el " línea feed" la función (que hace a impresora avanzar su papel), y el carácter 8 representa el " backspace".

Caracteres de control de Non-whitespace

El RFC 2822 refiere a NO-WS-CTL, caracteres de control del non-whitespace. Éstos son los caracteres de control que no incluyen retorno del carro, avance de línea, y los carácteres de espacio blancos (véase aquí), es decir: decimal 1-8, 11-12, 14-31, y 127.

Carácteres imprimibles del ASCII

Código 32, el " space" el carácter, denota el espacio entre las palabras, según lo producido por la barra espaciadora de un teclado. Los códigos 33 a 126, conocido como los carácteres imprimibles, representan letras, dígitos, signos de puntuación, y algunos símbolos misceláneos.

el Siete-pedacito ASCII proporcionó el " siete; national" los carácteres y, si el soporte físico y el software combinados permiten, pueden utilizar superposiciones para simular algunos carácteres internacionales adicionales: en tal panorama una tecla de retroceso puede preceder un acento grave (que los estándares americanos y británicos, pero solamente esos estándares, también llamen " solo mark" de apertura de la cita;), un backtick, o una marca de la respiración (vel invertido).

Características estructurales

Los dígitos 0-9 se representan con sus valores en binario prefijados con 0011 (éste significa que eso convertir BCD al ASCII es simplemente una cuestión de tomar a cada uno el mordisco del BCD por separado y de prefijar 0011 a él).
Las letras minúsculas y mayúsculas diferencian solamente en configuración de bits por un de un solo bit, simplificando la conversión del caso a una prueba de la gama (evitar convertir los carácteres que no son letras) y una sola operación Bitwise. La conversión rápida del caso es importante porque es de uso frecuente en algoritmos de búsqueda de caso-negligencia.
Al contrario de EBCDIC, las letras minúsculas y mayúsculas cada uno ocupan 26 posiciones consecutivas.

Alias

El RFC 1345 (publicado en junio de 1992) y el registro del IANA de los juegos de caracteres (en curso), ambos reconocen los alias sin diferenciación entre mayúsculas y minúsculas siguientes para el ASCII como conveniente para el uso en el Internet: class=" del
ANSI_X3.4-1968 (nombre canónico)
ANSI_X3.4-1986
ASCII (con las variantes ASCII-7 y ASCII-8)
US-ASCII (nombre preferred del MIME)
nosotros
ISO646-US
ISO_646.irv: 1991
iso-ir-6
IBM367
cp367
csASCII

De éstos, solamente el " de los alias; Nosotros-ASCII" y " ASCII" han alcanzado uso extenso. Uno los encuentra a menudo en el " opcional; charset" parámetro en el Contenido-Tipo jefe de algunos mensajes del MIME, en el " equivalente; meta" elemento de algunos documentos del HTML, y en la pieza de la declaración de la codificación del prólogo de algunos documentos XML .

Variantes

Pues la informática separada en el mundo entero, los diversos cuerpos de estándares y corporaciones desarrollaron muchas variaciones del ASCII para facilitar la expresión de las idiomas no-Inglesas que utilizaron alfabetos Romano-basados. Uno podía clasificar algunas de estas variaciones como " " de las extensiones del ASCII;, aunque un cierto uso erróneo que llamen para cubrir todas las variantes, incluyendo los que no preservan el character-map del ASCII en la gama de 7 pedacitos.

El código PETSCII usado por el comodoro internacional para sus sistemas de 8 bits es probablemente único entre los códigos post-1970 en ser basado en ASCII-1963 en vez del ASCII-1967 lejos más común.

Incompatibilidad contra interoperabilidad

ISO/IEC 646 (1972), la primera tentativa de remediar el diagonal de la lengua inglesa del ASCII, problemas creados de la compatibilidad, puesto que seguía siendo un juego de caracteres de 7 pedacitos. No hizo ningún código adicional disponible, así que reasignó alguno en variantes específicas a una lengua.

Un alemán, un francés, o sueco, etc., programador tuvieron que acostumbrarse aÄiÜ='Ön'; ü del
ä
or similar, en vez de
{n';} del a='\

Eventual, la tecnología mejorada trajo a medios fuera de banda de de representar la información codificada antes en el octavo pedacito de cada octeto, liberando este pedacito para agregar otros 128 carácter-códigos adicionales para las nuevas asignaciones.

Por ejemplo, el IBM desarrolló las páginas de código de 8 bits tal como página de código 437, que substituyó los control-carácteres por símbolos gráficos tales como caras sonrientes, y trazó caracteres gráficos adicionales a las 128 posiciones superiores. Los sistemas operativos tales como DOS apoyaron estos code-pages, y los fabricantes de las PC de IBM las apoyaron en hardware. El Digital Equipment Corporation desarrolló el juego de caracteres multinacional (DEC-MCS) para el uso en el terminal popular VT220 .

Estándares de ocho bites tales como ISO/IEC 8859 (derivado del DEC-MCS) y OS romano del mac desarrollado como extensiones verdaderas del ASCII, saliendo de la original character-mapping intacto, pero agregando definiciones adicionales del carácter después de los primeros 128 carácteres (es decir, del pedacito 7). Esto permitió la representación de los carácteres usados en una gama más amplia de idiomas. Pero estos estándares continuaron sufriendo de incompatibilidades y de limitaciones. No obstante, ISO-8859-1 (el latín 1), su variable Windows-1252 (a menudo mislabeled como ISO-8859-1), y el pedacito ASCII de la original 7 sigue siendo las codificaciones mas comunes del carácter funcionando hoy.

Unicode

Unicode y el ISO/IEC que 10646 el juego de caracteres universal (UCS) tienen una gama mucho más amplia de carácteres, y sus varias formas de la codificación han comenzado a suplantar ISO/IEC 8859 y el ASCII rápido en muchos ambientes. Mientras que el ASCII es limitado a 128 carácteres, Unicode y los carácteres ilimitados de la ayuda del UCS separando los conceptos de identificación única (usar los números naturales llamados los puntos de código del ) y codificación (por ejemplo a 7 - o los formatos binarios de 8 bits).

Para permitir la compatibilidad hacia atrás, los 128 ASCII y 256 ISO-8859-1 (carácteres del latín 1) se asigna los puntos de código de Unicode/UCS que son iguales que sus códigos en los estándares anteriores. Por lo tanto, el ASCII se puede considerar un esquema de la codificación de 7 pedacitos para un subconjunto muy pequeño de Unicode/UCS, y, inversamente, las formas de la codificación UTF-7 y UTF-8 son binario-compatibles con el ASCII para los puntos de código debajo de 128, el significado cada archivo de ASCII correctamente codificado es también un archivo válido UTF-8 y UTF-7. Otras formas de la codificación tales como UTF-16 se asemejan al ASCII en cómo representan los primeros 128 carácteres de Unicode, pero tienden a utilizar 16 o 32 pedacitos por carácter, así que requieren la conversión para la compatibilidad.

Orden

La colación de datos se hace a veces en orden del ASCII-código algo que " standard" orden alfabético. Las desviaciones principales son:
los capitales vienen antes de las letras minúsculas, es decir " Z" antes de " a"
carácteres en juegos de caracteres extendidos tales como " é" venido después de " z" El ASCIIbetical de la palabra de la mezcla se utiliza a veces para esta orden. En la programación, alfanumérico que clasifica medios de clasificar por valor numérico, sin respeto de cualquie juego de caracteres. Un arsenal alfanumérico clasificado de octetos aparecerá ASCIIbetically cuando está visto en un juego de caracteres ASCII-compatible.

Una versión refinada de esta orden convierte letras mayúsculas a la minúscula antes de comparar valores del ASCII.

Cultura

El asteroide 3568 ASCII se nombra después de la codificación del carácter.

Ver también

style=" del
American National Standards Institute (ANSI)
Arte ASCII
Campaña de la cinta ASCII
binario
Bob Bemer
Carácter de control
Carácteres latinos en Unicode
Archivo de texto
Juegos del texto * Unicode

Extensiones del ASCII

(donde están idénticos todos los carácteres imprimibles del ASCII al ASCII)
ASCII extendido
Código indio de la escritura para el intercambio de información (ISCII)
Estándar de varias partes ISO/IEC 8859
ISO/IEC 8859-1 la pieza de Europa occidental de las idiomas
OS romano del mac
UTF-8
Código estándar vietnamita para el intercambio de información (VISCII)
Páginas de código de Windows

Variantes del ASCII

(donde se han substituido algunos carácteres imprimibles del ASCII)
ATASCII - código estándar de Atari para el intercambio de información
Juego de caracteres - juego de caracteres de Galaksija de la computadora del kit de Galaksija
ISO/IEC 646
PETSCII - código estándar del ANIMAL DOMÉSTICO de intercambio de información, también conocido como CBM ASCII
YUSCII - código estándar yugoslavo para el intercambio de información
Juego de caracteres del espectro ZX

Lectura adicional

.

  • Zenithic
  • ASCII
    Random links:Laca (venda) | La Plata Partido | Código N del ATC | Ciudad F.C. de Newry. | Edward Edwards (almirante)

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">