Un formato de archivo es una manera particular de codificar la información para el almacenaje en un fichero electrónico .
Desde un accionamiento de disco, o de hecho cualquier memoria interna, puede almacenar solamente los pedacitos que la computadora debe tener cierta manera de convertir la información a 0s y a 1s y viceversa. Hay diversas clases de formatos para diversas clases de información. Dentro de cualquier tipo del formato, e., documentos del procesador de textos, habrá típicamente varios diversos formatos. Estos formatos compiten a veces entre sí.
Es a veces posible hacer un programa leer un archivo codificado en un formato como si fuera codificado en otro formato. Por ejemplo, uno puede jugar un documento de Microsoft Word como si fuera una canción usando un programa música-que jugaba que reparte en " headerless" archivos audios. El resultado no suena muy musical, sin embargo. Esto está tan porque un arreglo sensible de los pedacitos en un formato es casi siempre absurdo en otro.
Usar formatos de archivo sin a público - la especificación disponible puede ser costosa. Aprendiendo cómo los trabajos del formato requerirán la ingeniería reversa él de una puesta en práctica de la referencia o la adquisición del documento de la especificación para un honorario de los reveladores del formato. Este segundo acercamiento es posible solamente cuando allí el es al documento de la especificación, y requiere típicamente la firma de un acuerdo de Non-disclosure . Ambas estrategias requieren tiempo significativo, el dinero, o ambos. Por lo tanto, como regla general, formatos de archivo con público - las especificaciones disponibles son apoyadas por una gran cantidad de programas, mientras que los formatos privados son apoyados por solamente algunos programas.
La ley de la patente, algo que los derechos reservados, es más de uso frecuente proteger un formato de archivo. Aunque las patentes para los formatos de archivo no se permitan directo bajo ley de los E., algunos formatos requieren la codificación de datos con los algoritmos patentados . Por ejemplo, el formato de archivo del GIF requiere el uso de un algoritmo patentado, y aunque el dueño de la patente no lo hiciera cumplir inicialmente, comenzaron más adelante a recoger los honorarios para el uso del algoritmo. Esto ha dado lugar a una disminución significativa del uso GIFs y es en parte responsable del desarrollo del formato alternativo del png . Sin embargo, la patente expiró en los E. en el mid- 2003, y mundial en el mid- 2004 . Los algoritmos se llevan a cabo generalmente para no ser patentables bajo ley europea actual, que también incluye una disposición ese " de los miembros; se asegurará de que, el uso de una técnica patentada sea dondequiera que necesario para un propósito significativo tal como asegurar la conversión de las convenciones usadas en dos diversos sistemas informáticos o redes para permitir la comunicación y el intercambio de contenido de datos entre ellos, tal uso no se considera para ser un infringement" de la patente;, que permitiría al parecer la puesta en práctica de un sistema de ficheros patentado en caso necesario permitiera que dos diversas computadoras interoperen.
Por supuesto, la mayoría de los sistemas operativos modernos, y usos individuales, necesidad de utilizar todos estos acercamientos para procesar varios archivos, por lo menos para poder leer formatos de archivo “extranjeros”, si no el trabajo con ellos totalmente.
Una característica de este acercamiento es que el sistema se puede trampear fácilmente en tratar un archivo como diverso formato simplemente retitulando el it— un archivo de HTML se puede, por ejemplo, tratar fácilmente como texto llano retitulándolo de filename.html a filename. Aunque esta estrategia fuera útil a los usuarios expertos que podrían entender fácilmente y manipulan esta información, confundía con frecuencia a los usuarios menos técnicos, que pudieron accidentalmente hacer un archivo inutilizable (o “perderlo”) retitulándolo incorrectamente. Esto llevó cáscaras más recientes del sistema operativo tal como Windows 95 y mac OS x, para ocultar la extensión al exhibir las listas de archivos reconocidos. Esto separa a usuario del nombre de fichero completo, previniendo el cambio accidental de un tipo de archivo, mientras que permite que los usuarios expertos todavía conserven la funcionalidad original con la permisión de la exhibición de las extensiones de archivo.
considera también:
l número mágico (programación) Un método alternativo, asociado a menudo al Unix y a sus derivados, es almacenar un " number" mágico; dentro del archivo sí mismo. Original, este término fue utilizado para un sistema específico de 2 - los identificadores del octeto al principio de un archivo, pero puesto que cualquier secuencia binaria undecoded se puede mirar como número, cualquier característica de un formato de archivo que la distinga únicamente se pueden utilizar para la identificación. Las imágenes del GIF, por ejemplo, comienzan siempre con la representación ASCII de GIF87a o de GIF89a, dependiendo del estándar a los cuales se adhieren. Muchos tipos de archivo, lo más especialmente posible plain-text archivan, son más duros de manchar con este método. Los archivos de HTML, por ejemplo, pudieron comenzar con el < de la secuencia; html> ¡ (que no es con diferenciación entre mayúsculas y minúsculas), o un Document type definition apropiado que comienza con el <! ¿DOCTYPE, o, para el XHTML, el identificador XML, que comienza con el <? xml. Los archivos podían también comenzar con cualquier texto al azar o varias líneas vacías, pero todavía sean HTML usable.
Este acercamiento ofrece mejores garantías que el formato será identificado correctamente, y puede determinar a menudo una información más exacta sobre el archivo. Desde " confiable; number" mágico; las pruebas pueden ser bastante complejas, y cada archivo se debe probar con eficacia contra cada posibilidad en la base de datos mágica, este acercamiento es también relativamente ineficaz, especialmente para exhibir listas grandes de archivos (en cambio, el nombre de fichero y los métodos meta dato-basados necesitan la una sola pieza del cheque solamente de datos, y la emparejan contra un índice clasificado). También, los datos se deben leer en el archivo sí mismo, aumentando estado latente en comparación con los meta datos almacenados en el directorio. Donde los tipos de archivo no se prestan al reconocimiento de esta manera, el sistema debe recurrir a meta datos. Es, sin embargo, la mejor manera para que un programa compruebe si un archivo que se ha dicho para procesar está del formato correcto: mientras que el nombre o los meta datos del archivo se puede alterar independiente de su contento, el fall una prueba bien diseñada del número mágico es una muestra bastante segura que es el archivo o corrompe o del tipo incorrecto.
Las líneas supuestas del shebang en los archivos de la escritura son un caso especial de números mágicos. Aquí, el número mágico es el texto legible que identifica un intérprete de comando específico y las opciones que se pasarán al intérprete de comando.
Este acercamiento guarda los meta datos a parte de los datos principales y del nombre, pero es también menos portable que extensiones de archivo o " numbers" mágico;, puesto que el formato tiene que ser convertido de sistema de ficheros al sistema de ficheros. Mientras que esto es también verdad a un grado con el &mdash de las extensiones de nombre de fichero; por ejemplo, para la compatibilidad con el &mdash de tres caracteres del límite del MS-DOS; la mayoría de las formas de almacenaje tienen una definición áspero equivalente de los datos y del nombre de un archivo, pero pueden tener la variación o ninguna representación de otros meta datos.
Observar que los archivos de cierre relámpago o los ficheros de archivo solucionan el problema de manejar meta datos. Un programa utilitario recoge archivos múltiples juntos junto con meta datos sobre cada archivo y las carpetas/los directorios que vinieron de todos dentro de un nuevo archivo (e. un archivo de cierre relámpago con la extensión . El nuevo archivo también se comprime y se cifra posiblemente, pero es transmisible ahora como solo archivo a través de los sistemas operativos por los sistemas del ftp o atados al email. En la destinación, debe ser desabrochado por una utilidad compatible para ser útil, pero los problemas de la transmisión se solucionan esta manera.
considera también: Tipo uniforme
l del identificador Un tipo uniforme identificador (UTI) es un método usado en mac OS x para únicamente identificar el " typed" clases de entidad, tales como formatos de archivo. Fue desarrollada por el Apple como reemplazo para el OSType (tipo y códigos del creador.
El UTI es una secuencia de la fundación de la base, que utiliza una secuencia del Reverso-DNS . Los tipos comunes o estándar utilizan el dominio de public (e.png para una imagen portable de los gráficos de la red), mientras que otros dominios se pueden utilizar para los tipos de tercera persona (e.pdf para el formato de documento portable ). UTIs se puede definir dentro de una estructura jerárquica, conocida como jerarquía de la conformidad.png se ajusta a un supertype de public.image, que sí mismo se ajusta a un supertype de public. Un UTI puede existir en jerarquías múltiples, que proporciona gran flexibilidad.
Además de formatos de archivo, UTIs se puede también utilizar para otras entidades que puedan existir en el sistema de ficheros del OS X, incluyendo:
Datos del cartón del
Carpetas (directorios)
Tipos traducibles (según lo dirigido por el encargado de la traducción)
Paquetes
Armazones
Fluir datos
Alias y symlinks
El sistema de ficheros NTFS también permite almacenar cualidades ampliadas OS/2, pues una de las bifurcaciones archivo, pero esta característica está simplemente presentes apoyar el subsistema de OS/2 (no presente en XP), así que el subsistema Win32 trata esta información como bloque opaco de datos y no la utiliza. En lugar, confía en otras bifurcaciones del archivo para almacenar la meta-información en formatos de Win32-specific. OS/2 amplió cualidades se puede todavía leer y escribir por los programas Win32, pero los datos se deben analizar enteramente por usos.
Hay problemas con los tipos del MIME sin embargo; varias organizaciones y personas han creado sus propios tipos del MIME sin el registro de ellos correctamente con el IANA, que hace el uso de este torpe estándar en algunos casos.
Esto tiene varias desventajas. A menos que las imágenes de memoria también hayan reservado los espacios para las extensiones futuras, extendiendo y mejorando este tipo de archivo estructurado es muy difícil. También crea los archivos que pudieron ser específicos a una plataforma o al lenguaje de programación (por ejemplo una estructura que contiene una secuencia de Pascal no se reconoce como tal en el C ). Por una parte, el convertirse filetea para la lectura y la escritura estos tipos de archivos es muy simple.
Las limitaciones de los formatos no estructurados llevaron al desarrollo de otros tipos de formatos de archivo que podrían fácilmente ser ampliados y ser posteriores - compatible al mismo tiempo.
Con este tipo de estructura de archivo, las herramientas que no saben ciertos identificadores del pedazo saltan simplemente los que no entiendan.
Este concepto ha sido tomado repetidas veces por RIFF (equivalente de Microsoft-IBM del IFF), png, almacenaje del JPEG, las corrientes codificadas y los archivos de DER (la codificación distinguida gobierna ), y el formato de intercambio de datos estructurado (SDXF) . Incluso el XML se puede considerar una clase de formato basado pedazo, puesto que cada elemento de datos es rodeado por las etiquetas que son relacionadas con los identificadores del pedazo.
| Random links: | Magas | Lista de gobernadores coloniales en 1952 | Órbita lunar 2 | Papaflessas | Idiomas Malayo-Polinesias del este |