Un formato de archivo es una manera particular de codificar la información para el almacenaje en un fichero electrónico .

Desde un accionamiento de disco, o de hecho cualquier memoria interna, puede almacenar solamente los pedacitos que la computadora debe tener cierta manera de convertir la información a 0s y a 1s y viceversa. Hay diversas clases de formatos para diversas clases de información. Dentro de cualquier tipo del formato, e., documentos del procesador de textos, habrá típicamente varios diversos formatos. Estos formatos compiten a veces entre sí.

Generalidad

Algunos formatos de archivo se diseñan para almacenar clases muy particulares de datos: el formato del JPEG, por ejemplo, se diseña para almacenar solamente las imágenes fotográficas estáticas otros formatos de archivo, sin embargo, se diseñan para el almacenaje de varios diversos tipos de datos: el almacenaje de las ayudas del formato del GIF todavía de ambos las imágenes y las animaciones simples, y el formato de QuickTime pueden actuar como envase para muchos diversos tipos de las multimedias . Un archivo de texto es simplemente uno que almacena cualquier texto, en un formato tal como ASCII o el UTF-8, con pocos eventualmente los caracteres de control algunos formatos de archivo, tales como HTML, o el código fuente de un cierto lenguaje de programación particular, es de hecho también archivos de texto, pero se adhiere a reglas más específicas que permitan que sean utilizadas para los propósitos específicos.

Es a veces posible hacer un programa leer un archivo codificado en un formato como si fuera codificado en otro formato. Por ejemplo, uno puede jugar un documento de Microsoft Word como si fuera una canción usando un programa música-que jugaba que reparte en " headerless" archivos audios. El resultado no suena muy musical, sin embargo. Esto está tan porque un arreglo sensible de los pedacitos en un formato es casi siempre absurdo en otro.

Especificaciones

Muchos formatos de archivo, incluyendo algunos de los formatos de archivo más bien conocidos, tienen un documento publicado de la especificación (a menudo con una puesta en práctica de la referencia) que describa exactamente cómo los datos deben ser codificados, y que se puede utilizar para determinar independientemente de si un programa particular trata un formato de archivo particular correctamente. Hay, sin embargo, dos razones por las que éste no es siempre el caso. Primero, algunos reveladores del formato de archivo ven sus documentos de la especificación pues los secretos comerciales y por lo tanto no los lanzan al público. En segundo lugar, algunos reveladores del formato de archivo nunca pasan el tiempo que escribe un documento separado de la especificación; algo, el formato se define solamente implícito, con los programas que manipulan datos en el formato.

Usar formatos de archivo sin a público - la especificación disponible puede ser costosa. Aprendiendo cómo los trabajos del formato requerirán la ingeniería reversa él de una puesta en práctica de la referencia o la adquisición del documento de la especificación para un honorario de los reveladores del formato. Este segundo acercamiento es posible solamente cuando allí el es al documento de la especificación, y requiere típicamente la firma de un acuerdo de Non-disclosure . Ambas estrategias requieren tiempo significativo, el dinero, o ambos. Por lo tanto, como regla general, formatos de archivo con público - las especificaciones disponibles son apoyadas por una gran cantidad de programas, mientras que los formatos privados son apoyados por solamente algunos programas.

La ley de la patente, algo que los derechos reservados, es más de uso frecuente proteger un formato de archivo. Aunque las patentes para los formatos de archivo no se permitan directo bajo ley de los E., algunos formatos requieren la codificación de datos con los algoritmos patentados . Por ejemplo, el formato de archivo del GIF requiere el uso de un algoritmo patentado, y aunque el dueño de la patente no lo hiciera cumplir inicialmente, comenzaron más adelante a recoger los honorarios para el uso del algoritmo. Esto ha dado lugar a una disminución significativa del uso GIFs y es en parte responsable del desarrollo del formato alternativo del png . Sin embargo, la patente expiró en los E. en el mid- 2003, y mundial en el mid- 2004 . Los algoritmos se llevan a cabo generalmente para no ser patentables bajo ley europea actual, que también incluye una disposición ese " de los miembros; se asegurará de que, el uso de una técnica patentada sea dondequiera que necesario para un propósito significativo tal como asegurar la conversión de las convenciones usadas en dos diversos sistemas informáticos o redes para permitir la comunicación y el intercambio de contenido de datos entre ellos, tal uso no se considera para ser un infringement" de la patente;, que permitiría al parecer la puesta en práctica de un sistema de ficheros patentado en caso necesario permitiera que dos diversas computadoras interoperen.

Identificación del tipo de un archivo

Puesto que los archivos son vistos por programas como corrientes de datos, un método se requiere determinar el formato de un archivo particular dentro del &mdash del sistema de ficheros ; un ejemplo de los meta datos . Los sistemas operativos de diverso han llevado tradicionalmente diversos acercamientos este problema, con cada acercamiento teniendo sus propias ventajas y desventajas.

Por supuesto, la mayoría de los sistemas operativos modernos, y usos individuales, necesidad de utilizar todos estos acercamientos para procesar varios archivos, por lo menos para poder leer formatos de archivo “extranjeros”, si no el trabajo con ellos totalmente.

Extensión de nombre de fichero

Un método popular funcionando por varios sistemas operativos, incluyendo el mac OS x, el CP/M, DOS, el VMS, el VM/CMS, y Windows, es determinar el formato de un archivo basado en la sección de su nombre después del período final. Esta porción del nombre de fichero se conoce como la extensión de nombre de fichero . Por ejemplo, los documentos del HTML son identificados por los nombres que terminan con .htm), y las imágenes del GIF por . En el sistema de ficheros original del FAT, los nombres de fichero fueron limitados a un identificador del ocho-carácter y a una extensión de tres caracteres, que se conoce como nombre de fichero 8. Muchos formatos todavía utilizan así extensiones de tres caracteres, aunque los sistemas operativos y los programas de aplicación modernos tienen no más esta limitación. Puesto que no hay lista estándar de extensiones, más de un formato puede utilizar la misma extensión, que puede confundir al sistema operativo y por lo tanto a los usuarios.

Una característica de este acercamiento es que el sistema se puede trampear fácilmente en tratar un archivo como diverso formato simplemente retitulando el it— un archivo de HTML se puede, por ejemplo, tratar fácilmente como texto llano retitulándolo de filename.html a filename. Aunque esta estrategia fuera útil a los usuarios expertos que podrían entender fácilmente y manipulan esta información, confundía con frecuencia a los usuarios menos técnicos, que pudieron accidentalmente hacer un archivo inutilizable (o “perderlo”) retitulándolo incorrectamente. Esto llevó cáscaras más recientes del sistema operativo tal como Windows 95 y mac OS x, para ocultar la extensión al exhibir las listas de archivos reconocidos. Esto separa a usuario del nombre de fichero completo, previniendo el cambio accidental de un tipo de archivo, mientras que permite que los usuarios expertos todavía conserven la funcionalidad original con la permisión de la exhibición de las extensiones de archivo.

Número mágico

considera también:

l número mágico (programación) Un método alternativo, asociado a menudo al Unix y a sus derivados, es almacenar un " number" mágico; dentro del archivo sí mismo. Original, este término fue utilizado para un sistema específico de 2 - los identificadores del octeto al principio de un archivo, pero puesto que cualquier secuencia binaria undecoded se puede mirar como número, cualquier característica de un formato de archivo que la distinga únicamente se pueden utilizar para la identificación. Las imágenes del GIF, por ejemplo, comienzan siempre con la representación ASCII de GIF87a o de GIF89a, dependiendo del estándar a los cuales se adhieren. Muchos tipos de archivo, lo más especialmente posible plain-text archivan, son más duros de manchar con este método. Los archivos de HTML, por ejemplo, pudieron comenzar con el < de la secuencia; html> ¡ (que no es con diferenciación entre mayúsculas y minúsculas), o un Document type definition apropiado que comienza con el <! ¿DOCTYPE, o, para el XHTML, el identificador XML, que comienza con el <? xml. Los archivos podían también comenzar con cualquier texto al azar o varias líneas vacías, pero todavía sean HTML usable.

Este acercamiento ofrece mejores garantías que el formato será identificado correctamente, y puede determinar a menudo una información más exacta sobre el archivo. Desde " confiable; number" mágico; las pruebas pueden ser bastante complejas, y cada archivo se debe probar con eficacia contra cada posibilidad en la base de datos mágica, este acercamiento es también relativamente ineficaz, especialmente para exhibir listas grandes de archivos (en cambio, el nombre de fichero y los métodos meta dato-basados necesitan la una sola pieza del cheque solamente de datos, y la emparejan contra un índice clasificado). También, los datos se deben leer en el archivo sí mismo, aumentando estado latente en comparación con los meta datos almacenados en el directorio. Donde los tipos de archivo no se prestan al reconocimiento de esta manera, el sistema debe recurrir a meta datos. Es, sin embargo, la mejor manera para que un programa compruebe si un archivo que se ha dicho para procesar está del formato correcto: mientras que el nombre o los meta datos del archivo se puede alterar independiente de su contento, el fall una prueba bien diseñada del número mágico es una muestra bastante segura que es el archivo o corrompe o del tipo incorrecto.

Las líneas supuestas del shebang en los archivos de la escritura son un caso especial de números mágicos. Aquí, el número mágico es el texto legible que identifica un intérprete de comando específico y las opciones que se pasarán al intérprete de comando.

Meta datos explícitos

Una manera final de almacenar el formato de un archivo es almacenar explícitamente la información sobre el formato en el sistema de ficheros.

Este acercamiento guarda los meta datos a parte de los datos principales y del nombre, pero es también menos portable que extensiones de archivo o " numbers" mágico;, puesto que el formato tiene que ser convertido de sistema de ficheros al sistema de ficheros. Mientras que esto es también verdad a un grado con el &mdash de las extensiones de nombre de fichero; por ejemplo, para la compatibilidad con el &mdash de tres caracteres del límite del MS-DOS; la mayoría de las formas de almacenaje tienen una definición áspero equivalente de los datos y del nombre de un archivo, pero pueden tener la variación o ninguna representación de otros meta datos.

Observar que los archivos de cierre relámpago o los ficheros de archivo solucionan el problema de manejar meta datos. Un programa utilitario recoge archivos múltiples juntos junto con meta datos sobre cada archivo y las carpetas/los directorios que vinieron de todos dentro de un nuevo archivo (e. un archivo de cierre relámpago con la extensión . El nuevo archivo también se comprime y se cifra posiblemente, pero es transmisible ahora como solo archivo a través de los sistemas operativos por los sistemas del ftp o atados al email. En la destinación, debe ser desabrochado por una utilidad compatible para ser útil, pero los problemas de la transmisión se solucionan esta manera.

Tipo-códigos del OS del mac

Sistema de ficheros jerárquico del OS del mac el ' almacena los códigos para el creador y el tipo como parte de la entrada en la guía para cada archivo. Estos códigos se refieren como el OSTypes y por ejemplo " de HyperCard ; stack" el archivo tiene un creador del de WILD (del nombre anterior de Hypercard, " WildCard") y un tipo del de STAK. el OS del RISC utiliza un sistema similar, consistiendo en 12 - el número del pedacito que se puede mirar para arriba en una tabla de descripciones - e. el número hexadecimal FF5 es " aliased" a PoScript, representando un archivo de la posdata .

Tipo uniforme identificadores del OS X del mac (UTIs)

considera también: Tipo uniforme

l del identificador Un tipo uniforme identificador (UTI) es un método usado en mac OS x para únicamente identificar el " typed" clases de entidad, tales como formatos de archivo. Fue desarrollada por el Apple como reemplazo para el OSType (tipo y códigos del creador.

El UTI es una secuencia de la fundación de la base, que utiliza una secuencia del Reverso-DNS . Los tipos comunes o estándar utilizan el dominio de public (e.png para una imagen portable de los gráficos de la red), mientras que otros dominios se pueden utilizar para los tipos de tercera persona (e.pdf para el formato de documento portable ). UTIs se puede definir dentro de una estructura jerárquica, conocida como jerarquía de la conformidad.png se ajusta a un supertype de public.image, que sí mismo se ajusta a un supertype de public. Un UTI puede existir en jerarquías múltiples, que proporciona gran flexibilidad.

Además de formatos de archivo, UTIs se puede también utilizar para otras entidades que puedan existir en el sistema de ficheros del OS X, incluyendo:
Datos del cartón del


Carpetas (directorios)
Tipos traducibles (según lo dirigido por el encargado de la traducción)
Paquetes
Armazones
Fluir datos
Alias y symlinks

El de OS/2 extendido atribuye

El HPFS, el FAT12 y los sistemas de ficheros de FAT16 (pero no FAT32) permiten el almacenaje del " attributes" extendido; con los archivos. Éstos abarcan un sistema arbitrario de tríos con un nombre, un tipo cifrado para el valor y un valor, donde están únicos los nombres y los valores pueden tener hasta 64 KB de largo. Hay significados estandardizados para los ciertos tipos y nombres (debajo de OS/2). Uno tales es que el " .TYPE" la cualidad extendida se utiliza para determinar el tipo de archivo. Su valor abarca una lista de uno o más tipos de archivo asociados al archivo, que es una secuencia, tal como " Text" llano; o " Document" del HTML;. Así un archivo puede tener varios tipos.

El sistema de ficheros NTFS también permite almacenar cualidades ampliadas OS/2, pues una de las bifurcaciones archivo, pero esta característica está simplemente presentes apoyar el subsistema de OS/2 (no presente en XP), así que el subsistema Win32 trata esta información como bloque opaco de datos y no la utiliza. En lugar, confía en otras bifurcaciones del archivo para almacenar la meta-información en formatos de Win32-specific. OS/2 amplió cualidades se puede todavía leer y escribir por los programas Win32, pero los datos se deben analizar enteramente por usos.

Cualidades ampliadas POSIX

En el Unix y Unix-como sistemas de, el Ext2, el Ext3, los sistemas de ficheros de la versión 3 de ReiserFS, XFS, JFS, FFS, y HFS+ permitir el almacenaje de cualidades extendidas con los archivos. Éstos incluyen una lista arbitraria de " name=value" secuencias, donde están únicos los nombres, que se pueden alcanzar por su " name" piezas.

Identificadores únicos de PRONOM (PUIDs)

El identificador único persistente (PUID) PRONOM es un esquema extensible de los identificadores persistentes, únicos e inequívocos para los formatos de archivo, que ha sido desarrollada por el los archivos nacionales del Reino Unido como parte de su servicio técnico del registro PRONOM. PUIDs se puede expresar como identificadores de recurso uniforme usar el info: namespace de pronom/. Aunque no todavía sea ampliamente utilizado el exterior del gobierno BRITÁNICO y de algunos programas de la preservación de Digitaces, el esquema de PUID proporcione mayor granulosidad que la mayoría de los esquemas alternativos.

Tipos del MIME

Los tipos del MIME son ampliamente utilizados en muchos el Internet - usos relacionados, y cada vez más a otra parte, aunque su uso para el tipo información del en-disco sea raro. Éstos consisten en un sistema estandardizado de identificadores (manejados por IANA ) que consisten en un tipo del y un subtipo del, separado por un &mdash de la raya vertical ; por ejemplo, text/html o image/gif. Éstos fueron pensados original como manera de identificar qué tipo de archivo fue atado a un email, a la independiente de la fuente y a los sistemas operativos de la blanco. Los tipos del MIME identifican archivos en el BeOS, así como las firmas únicas del uso del almacén para el lanzamiento del uso.

Hay problemas con los tipos del MIME sin embargo; varias organizaciones y personas han creado sus propios tipos del MIME sin el registro de ellos correctamente con el IANA, que hace el uso de este torpe estándar en algunos casos.

Identificadores del formato de archivo (FFIDs)

Los identificadores del formato de archivo son otros, manera no ampliamente utilizada identificar formatos de archivo según su origen y su categoría del archivo. Fue creado para la habitación del explorador de la descripción del software. Se compone de varios dígitos de la forma NNNNNNNNN-XX-YYYYYYY. La primera parte indica al origen de la organización/a sostén (este número representa un valor en una compañía/una base de datos de la organización de estándares), los 2 dígitos siguientes categoriza el tipo de archivo en hexadecimal. La parte final se compone de la extensión de archivo generalmente del archivo o del número del estándar internacional del archivo, rellenado a la izquierda con ceros. Por ejemplo, la especificación de archivo del png tiene el FFID de 000000001-31-0015948 donde 31 indica un archivo de imagen, 0015948 es el número estándar y 000000001 indica la organización de la ISO.

Estructura de archivo

Hay varios tipos de maneras de estructurar datos en un archivo. Los más generalmente son descritos más abajo.

Descargas de memoria crudas/formatos no estructurados

Formatos de archivo anteriores utilizaron los formatos de las informaciones en bruto que consistieron en directo el descargar de las imágenes de memoria de uno o más estructuras en el archivo.

Esto tiene varias desventajas. A menos que las imágenes de memoria también hayan reservado los espacios para las extensiones futuras, extendiendo y mejorando este tipo de archivo estructurado es muy difícil. También crea los archivos que pudieron ser específicos a una plataforma o al lenguaje de programación (por ejemplo una estructura que contiene una secuencia de Pascal no se reconoce como tal en el C ). Por una parte, el convertirse filetea para la lectura y la escritura estos tipos de archivos es muy simple.

Las limitaciones de los formatos no estructurados llevaron al desarrollo de otros tipos de formatos de archivo que podrían fácilmente ser ampliados y ser posteriores - compatible al mismo tiempo.

El pedazo basó formatos

Electronic Arts y Comodoro-Amiga iniciaron este formato de archivo en 1985, con su formato de archivo del IFF (formato de archivo del intercambio). En esta clase de estructura de archivo, cada pedazo de datos se encaja en un envase que contenga una firma que identifica los datos, también la longitud de los datos (para los archivos codificados binarios). Este tipo de envase se llama un pedazo. La firma generalmente se llama una identificación del pedazo, un identificador del pedazo, o un identificador de la etiqueta.

Con este tipo de estructura de archivo, las herramientas que no saben ciertos identificadores del pedazo saltan simplemente los que no entiendan.

Este concepto ha sido tomado repetidas veces por RIFF (equivalente de Microsoft-IBM del IFF), png, almacenaje del JPEG, las corrientes codificadas y los archivos de DER (la codificación distinguida gobierna ), y el formato de intercambio de datos estructurado (SDXF) . Incluso el XML se puede considerar una clase de formato basado pedazo, puesto que cada elemento de datos es rodeado por las etiquetas que son relacionadas con los identificadores del pedazo.

El directorio basó formatos

Éste es otro formato extensible, ése se asemeja de cerca a un sistema de ficheros (documentos VIEJOS son sistemas de ficheros reales), donde el archivo se compone de las “entradas en la guía” que contienen la localización de los datos dentro del archivo sí mismo así como sus firmas (y en ciertos casos su tipo). Los buenos ejemplos de estos tipos de estructuras de archivo son documentos VIEJOS de las imágenes del disco e imágenes del tiff .
  • Zenithic
  • Allie Reese
    Random links:Magas | Lista de gobernadores coloniales en 1952 | Órbita lunar 2 | Papaflessas | Idiomas Malayo-Polinesias del este

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">