Un archivo de texto del es una descripción genérica de una clase del fichero electrónico en un sistema del fichero electrónico. En este nivel genérico de descripción, hay dos clases de ficheros informáticos: 1) archivos de texto; y 2) archivos binarios. Esta distinción de dos niveles amplia se reconoce y se aplica extensamente en la computación, aunque puede ser engañoso, y conforme a la interpretación de diferenciación.

La base más común para distinguir archivos de texto de los archivos binarios depende de cómo la información almacenada subyacente es interpretada y procesada en última instancia por el sistema operativo y los programas asociados. Los archivos de texto se interpretan generalmente como consistiendo solamente en los carácteres de un juego de caracteres reconocido . Los juegos de caracteres bien conocidos incluyen el juego de caracteres ASCII y el juego de caracteres de Unicode .

Componentes

Los archivos de texto son los archivos donde la mayoría de los octetos (o las secuencias cortas de octetos) representan carácteres legibles ordinarios tales como letras, dígitos, y puntuación (espacios incluyendo), e incluyen algunos caracteres de control tal como avances de línea el de las lengüetas y simplicidad de las vueltas de carro esta permite que una gran variedad de programas exhiba su contenido.

Criptografía

El Plaintext del término similar es el más de uso general de un contexto criptográfico y refiere a datos unencrypted; sin embargo, estos datos unencrypted no tienen que necesario ser un archivo de texto. La semejanza entre el " de los términos; plaintext" y " file" del texto; causa a veces la confusión, especialmente entre ésos nuevos a las computadoras, a la criptografía, o a las comunicaciones de datos.

Codificación

considera también:

la codificación del carácter Generalmente, un archivo de texto contiene carácteres en un ASCII - codificación basada, o mucho menos comúnmente un EBCDIC - codificación basada, sin ninguna información encajada tal como información de la fuente, los enlaces hipertexto o los archivos de texto en línea de las imágenes se codifican a menudo en una extensión del ASCII; éstos incluyen ISO 8859, EUC, una codificación especial para el Windows, una codificación Mac-Romana especial para OS del mac, y esquemas de la codificación de Unicode (comunes en muchas plataformas) por ejemplo el UTF-8 o el UTF-16 .

Uso del software

Aunque los archivos de texto se signifiquen a menudo para que a los seres humanos lean, son también de uso general para el almacenaje de datos por programas de computadora. Los archivos de texto tienen algunas ventajas incluso para el almacenaje de datos porque evitan ciertos problemas con los archivos binarios, tales como Endianness, octetos de acolchado, o diferencias en el número de octetos en una palabra de máquina . Además, cuando la corrupción de datos ocurre en un archivo usado para el almacenaje de datos, es lejos más fácil que un ser humano fije si es un archivo de texto. Como prima, puede ser más fácil que el programa se recupere del error, porque los archivos de texto son bastante prolijos, mientras que los archivos binarios son generalmente compactos (ha dicho que los archivos de texto tienen una tarifa baja de la entropía ). El daño de una cantidad de un archivo de texto destruye poca información; el daño de la misma cantidad de un archivo binario destruye más información.

Una desventaja grande de los archivos de texto llano es que no hay manera para que un programa determine confiablemente se utiliza qué codificación. Un editor de textos puede salvar su archivo de texto en UTF-8, pero un recopilador pudo esperar su entrar en ISO 8859. El intentar compilar el archivo de texto UTF-8 causaría la confusión y errores. Algunos formatos de texto (tales como XML ) tienen un mecanismo In-band para especificar la codificación del documento, pero la mayoría de archivos de texto no tienen ningún tal mecanismo. Algunos programas hacen grandes esfuerzos al " guess" la codificación buscando patrones en el archivo de texto, pero este procedimiento que conjetura es muy difíciles de especificar correctamente para todos los casos (véase el AI-completo).

Formatos

MIME

Los archivos de texto tienen generalmente el tipo " del MIME ; texto/plain", generalmente con la información adicional que indica una codificación. Antes del advenimiento del mac el OS x, el sistema del OS del mac miraron el contenido de un archivo (la bifurcación de datos) para ser un archivo de texto cuando su bifurcación de recurso indicó que el tipo del archivo era " TEXT". Bajo sistema operativo de Windows, un archivo se mira como archivo de texto si el sufijo del nombre del archivo (el " " de la extensión ;) es el " txt". Sin embargo, muchos otros sufijos se utilizan para los archivos de texto con propósitos específicos. Por ejemplo, el código fuente para los programas de computadora se mantiene generalmente los archivos de texto que tienen sufijos del nombre de fichero el indicar del lenguaje de programación en el cual se escribe la fuente.

ASCII

El estándar ASCII permite que a ASCII-solamente los archivos de texto llano (desemejante de la mayoría de los otros tipos de archivo) sean intercambiados libremente y legibles en el Unix, el Macintosh, el Microsoft Windows, DOS, y otros sistemas. Éstos diferencian en su línea preferred convención de la conclusión (véase el Newline ) y su interpretación de valores fuera de la gama del ASCII (su codificación del carácter).

Otros formatos

El texto llano es de uso frecuente como representación legible de otros datos que no sean sí mismo puramente textuales: por ejemplo, un Web page formatado no es texto llano, pero su fuente del HTML es. Semejantemente, el código fuente para los programas de computadora se almacena generalmente en archivos de texto, pero es compilado en una forma binaria para la ejecución.txt es una extensión de nombre de fichero para los archivos que consisten en el texto con el formato muy pequeño (ex: ningún ''' en negrita del ''' o '' it3alicos '' ). Esta clase de formato de texto también se llama un archivo del texto llano para distinguirlos de otras clases de archivos binarios que, cuando la distinción fue hecha, no fueron supuestos para tener texto legible. La definición exacta del formato de .txt no se especifica, sino empareja típicamente el formato aceptado por el terminal del sistema o el editor de textos simple . Los archivos con la extensión de .txt pueden ser leídos fácilmente o abierto por cualquier programa que lea el texto y, por esa razón, se consideran la independiente universal (o de la plataforma).

Texto llano contra .txt

Debe ser observado que no todos los sistemas utilizan la extensión de .txt al crear archivos de texto llano. Particularmente, en los sistemas de Unix, donde están enteramente opcionales las extensiones, es común ver archivos de texto sin la extensión en absoluto, el ejemplo más prominente que es el archivo README del , presente en muchos paquetes de programas informáticos. Sin embargo, no hay diferencia entre un archivo de texto llano sin la extensión y un archivo de . El " del término; text" llano; se atribuye al contenido del archivo, mientras que el " del término; .txt" se atribuye a los meta datos (es decir la extensión) del archivo.

Variaciones del texto llano

Puesto que el texto llano no es un estándar formalmente definido, la definición del formato de un archivo de texto llano es algo floja. Las diferencias del principio están en los juegos de caracteres y las codificaciones del carácter y las convenciones sobre la semántica de los carácteres del formato.

El juego de caracteres de ASCII es el formato más común para los archivos de texto de lengua inglesa, y se asume generalmente para ser el formato de archivo del defecto en muchas situaciones. Que los carácteres acentuados y otros no-ASCII, es necesario elijan una codificación del carácter. En muchos sistemas, esto se elige en base del ajuste de la escena del defecto en la computadora que se sigue leyendo. Las codificaciones comunes del carácter incluyen ISO 8859-1 para muchas idiomas europeas.

Porque muchas codificaciones tienen solamente un repertorio limitado de carácteres, son a menudo solamente usables representar el texto en un subconjunto limitado de idiomas humanas. El Unicode es una tentativa de crear un estándar común para representar todas las idiomas sabidas, y la mayoría de los juegos de caracteres sabidos son subconjuntos del juego de caracteres muy grande de Unicode. Aunque haya codificaciones múltiples del carácter disponibles para Unicode, el más común es el UTF-8, que tiene la ventaja de ser al revés-compatible con el ASCII: es decir, cada archivo de texto de ASCII es también un archivo de texto UTF-8 con el significado idéntico.

Carácteres de formato

Si uno está utilizando un viejo Macintosh, después el comando del Newline se asocia al carácter número 13 de ASCII. Si uno está utilizando Unix, después el carácter de ASCII es el número 10. Si, en lugar, la persona está utilizando una unidad central de IBM, después él o ella utilizara el formato del EBCDIC y la línea siguiente serían el número 15.

Archivos estándar de Windows .txt

El MS-DOS y Windows de Microsoft utilizan un formato de archivo común del texto, con cada línea de texto separada por una combinación de dos carácteres: CR y LF, que tienen códigos 13 y 10. Es común para la línea pasada del no del texto que se terminará con un marcador de CR-LF, y muchos editores de textos (libreta incluyendo) no insertan automáticamente uno en la línea pasada.

La mayoría de los archivos de texto de Windows utilizan una forma de ANSI, de OEM o de codificación de Unicode. Qué terminología de Windows llama el " Encodings" del ANSI; están generalmente las codificaciones del solo-octeto ISO-8859, a excepción en de las escenas tales como chinos, japoneses y coreano que requieran juegos de caracteres del doble-octeto. Las codificaciones del ANSI fueron utilizadas tradicionalmente como escenas de sistema del defecto dentro de Windows, antes de la transición a Unicode. Por el contrario, las codificaciones del OEM, también conocidas como páginas de código del MS-DOS, fueron definidas por IBM para el uso en el sistema de visualización original del modo de texto de la PC de IBM. Incluyen típicamente gráfico y los caracteres de trazado de líneas comunes en usos de plena pantalla del MS-DOS. Archivos de texto más nuevos de Windows pueden utilizar una codificación de Unicode tal como UTF-16LE o UTF-8.

Notas y referencias

Ver también

Lista de los formatos de archivo
Extensiones de archivo
ASCII
EBCDIC
Newline
Editor de textos
Unicode
Texto llano
Archivo binario

.

  • Zenithic
  • AlliedBarton
    Random links:Galileo Galilei | Coopertown, Tennessee | Kingsport, Tennessee | Spring Hill, Nueva Escocia | Regicidio: El asesinato oficial de John F. Kennedy

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">