¡
La base de datos del término originó dentro de la disciplina computacional. Aunque su significado haya sido ensanchado por uso popular, incluso incluir bases de datos no electrónicas, este artículo está sobre bases de datos de computadora. Las características y el diseño de sistemas de base de datos se incluyen en el estudio de las ciencias de la información .
Una base de datos de la computadora es una colección estructurada de los expedientes o de datos que se almacena en un sistema informático de modo que un programa de computadora o la persona que usa un lenguaje de interrogación pueda consultarlo para contestar a preguntas. Los expedientes recuperados en contestación a preguntas son la información que se puede utilizar para tomar decisiones.
La base de datos término refiere a la colección de expedientes relacionados, y el software se debe referir como el sistema de gestión o DBMS de la base de datos. Cuando el contexto es ambiguo, sin embargo, muchos administradores de base de datos y programadores utilizan la base de datos término para cubrir ambos significados.
El concepto central de una base de datos es el de una colección de expedientes, o de fragmentos de información. Muchos profesionales consideran una recogida de datos constituir una base de datos solamente si tiene ciertas características: por ejemplo, si los datos se manejan para asegurar su integridad y calidad, si permiten el acceso compartido de una comunidad de usuarios, si tienen un esquema, o si apoyan un lenguaje de interrogación . Sin embargo, no hay definición de estas características que se conviene en universal.
Típicamente, para una base de datos dada, hay una descripción estructural del tipo de hechos llevados a cabo en esa base de datos: esta descripción se conoce como esquema . El esquema describe los objetos que se representan en la base de datos, y las relaciones entre ellas.
Hay un número de maneras diferentes de organizar un esquema, es decir, de modelar la estructura de base de datos: se saben éstos mientras que la base de datos modela (o modelos de datos). El modelo en el hoy más de uso común es el modelo emparentado, que en los términos del laico representa toda la información bajo la forma de tablas relacionadas múltiples cada las filas que consisten en y las columnas (la definición formal utiliza terminología matemática). Este modelo representa relaciones por el uso de los valores comunes a más de una tabla. Otros modelos tales como el modelo jerárquico y el modelo de red utilizan una representación más explícita de relaciones.
Los sistemas de gestión de la base de datos se categorizan generalmente según el modelo de datos que apoyan: emparentado, objeto-emparentado, red, y así sucesivamente. El modelo de datos tenderá a determinar los lenguajes de interrogación que están disponibles tener acceso a la base de datos. Mucha de la ingeniería interna de un DBMS, sin embargo, es independiente del modelo de datos, y se trata a factores de manejo tales como funcionamiento, concurrencia, integridad, y recuperación de faltas de hardware. En estas áreas hay diferencias grandes entre los productos.
Una pregunta típica podía ser una pregunta por ejemplo, " ¿Cuántas hamburguesas con dos o más empanadas de carne de vaca fueron vendidos en el mes de marcha en New Jersey? ". Para contestar a tal pregunta, la base de datos tendría que almacenar la información sobre las hamburguesas vendidas, incluyendo el número de empanadas, las ventas fecha, y la región.
Los primeros sistemas de gestión de la base de datos fueron desarrollados en los años 60. Un pionero en el campo era Charles Bachman . Los papeles tempranos de Bachman demuestran que su puntería era hacer un uso más eficaz de los nuevos dispositivos de almacenamiento de acceso directo que estaban disponibles: hasta entonces, la informática había sido basada en las tarjetas perforadas y la cinta magnética, de modo que el proceso serial fuera la actividad dominante. Dos modelos de datos dominantes se presentaron en este tiempo: la codasyl desarrolló el modelo de red basado en las ideas de Bachman, y (al parecer independiente) el modelo jerárquico fue utilizado en un sistema desarrollado por el Rockwell norteamericano adoptado más adelante por IBM como la piedra angular de su producto del IMS . Mientras que el IMS junto con el IDMS de la codasyl era las bases de datos grandes, altas de la visibilidad desarrolladas en los años 60, varios otros también fueron llevados en esa década, algo cuyo tener una base instalada significativa hoy. Dos dignos de mencionar son la SELECCIÓN y bases de datos de las PAPERAS, con el anterior desarrollado original como un sistema operativo con una base de datos encajada y estes 3ultimo como un lenguaje de programación y base de datos para el desarrollo de sistemas sanitarios.
El modelo emparentado fue propuesto por el E. Él criticó los modelos existentes para confundir la descripción abstracta de la estructura de información con descripciones de los mecanismos de acceso físico. Por un rato largo, sin embargo, seguía habiendo el modelo emparentado de interés académico solamente. Mientras que los productos de la codasyl (IDMS) y los productos del modelo de red (IMS) fueron concebidos como soluciones de ingeniería prácticas que tomaban cuenta de la tecnología mientras que existió en ese entonces, el modelo emparentado tomó una perspectiva mucho más teórica, discutiendo (correctamente) que alcanzaría la tecnología del soporte físico y de programación a tiempo. Entre las primeras puestas en práctica era Ingres de s de Stonebraker Michael el 'en el Berkeley, y el proyecto del sistema R en IBM. Ambos éstos eran prototipos de la investigación, anunciados durante 1976. Los primeros productos comerciales, Oracle y DB2, no aparecieron hasta el alrededor an o 80. El primer producto de éxito de la base de datos para los microordenadores era el DBASE para el CP/M y el PC-DOS /los sistemas operativos del MS-DOS .
Durante los años 80, la actividad de investigación centrada en sistemas de la base de datos distribuida y las máquinas de base de datos pero estos progresos tenía poco efecto en el mercado. Otra idea teórica importante era el modelo de datos funcional, pero aparte de algunos usos especializados en las genéticas, biología molecular, e investigación del fraude, el mundo tomó poco aviso.
En los años 90, la atención cambió de puesto a las bases de datos orientadas al objeto . Éstos tenían cierto éxito en campos donde estaba necesario manejar datos más complejos que los sistemas emparentados podrían hacer frente fácilmente a, por ejemplo bases de datos espaciales, dirigiendo datos (depósitos incluyendo de la ingeniería de programas informáticos), y datos de las multimedias. Algunas de estas ideas fueron adoptadas por los vendedores emparentados, que integraron nuevas características en sus productos consecuentemente. Los años 90 también consideraron la extensión de las bases de datos de Open Source, tales como PostgreSQL y MySQL .
En el 2000s, el área de moda para la innovación es la base de datos XML. Como con las bases de datos de objeto, esto ha frezado una nueva colección de compañías de lanzamiento, pero al mismo tiempo las ideas dominantes están siendo integradas en los productos emparentados establecidos. Las bases de datos de XML apuntan quitar la divisoria tradicional entre los documentos y los datos, permitiendo que todos los recursos de información de una organización sean sostenidos en un lugar, si están estructuradas alto o no.
considera también: La base de datos modela el
Las varias técnicas se utilizan para modelar la estructura de datos.
La mayoría de los sistemas de base de datos se construyen alrededor de un modelo de datos particular, aunque sea cada vez más común para los productos a la ayuda de la oferta para más de un modelo. Para cualquier un el modelo lógico varias las puestas en práctica físicas pueden ser posibles, y la mayoría de los productos ofrecerán a usuario un cierto nivel de control en la adaptación de la puesta en práctica física, puesto que las decisiones se toman que tienen un efecto significativo en funcionamiento. Un ejemplo es el modelo emparentado : todas las puestas en práctica serias del modelo emparentado permiten la creación de los índices que proporcionan de rápido acceso a las filas en una tabla si los valores de ciertas columnas se saben.
Los ejemplos de los motores de base de datos que tiene capacidades del modelo de red son el encajado RDM, y servidor de RDM.
La estructura de datos básicos del modelo emparentado es la tabla, donde la información sobre una entidad particular (decir, empleado) se representa en las columnas y las filas (también llamadas los Tuples . Así, el " relation" en " database" emparentado; refiere a las varias tablas en la base de datos; una relación es un sistema de tuples. Las columnas enumeran las varias cualidades de la entidad (el nombre del empleado, la dirección o el número de teléfono, por ejemplo), y una fila es un caso real de la entidad (empleado específico) que es representada por la relación. Consecuentemente, cada tuple de la tabla del empleado representa varias cualidades de un solo empleado.
Todas las relaciones (y, así, las tablas) en una base de datis relacional tienen que adherirse a algunas reglas básicas para calificar como relaciones. Primero, el ordenar de columnas es inmaterial en una tabla. En segundo lugar, no puede haber tuples o filas idénticos en una tabla. Y tercer, cada tuple contendrá un solo valor para cada uno de sus cualidades es decir que cada tuple tiene un valor atómico.
Una base de datis relacional contiene las tablas múltiples, cada uno similar a la que está en el " flat" modelo de la base de datos. Una de las fuerzas del modelo emparentado es que, en principio, cualquier valor que ocurre en dos diversos expedientes (perteneciendo a la misma tabla o a diversas tablas), implica una relación entre esos dos expedientes. Con todo, para hacer cumplir apremios de integridad explícitos, las relaciones entre los expedientes en tablas se pueden también definir explícitamente, por las relaciones de identificación o de no-identificación del padre-niño caracterizadas asignando la cardinalidad (1: 1, (0) 1: M, M: M). Las tablas pueden también tener una sola cualidad señalada o un sistema de las cualidades que pueden actuar como " key", que se puede utilizar para identificar únicamente cada tuple en la tabla.
Una llave que se puede utilizar para identificar únicamente una fila en una tabla se llama una llave primaria. Las llaves son de uso general ensamblar o combinar datos a partir de dos o más tablas. Por ejemplo, una tabla del empleado del puede contener una columna nombrada la localización del que contiene un valor que empareje la llave de una tabla de la localización del . Las llaves son también críticas en la creación de los índices, que facilitan la recuperación rápida de datos de las tablas grandes. Cualquier columna puede ser una llave, o las columnas múltiples se pueden agrupar juntas en una llave compuesta. No es necesario definir todas las llaves por adelantado; una columna se puede utilizar como llave incluso si no fue pensado original para ser una.
En respuesta a una pregunta, la base de datos vuelve un sistema del resultado, que es apenas una lista de filas que contienen las respuestas. La pregunta más simple es apenas volver todas las filas de una tabla, pero más a menudo, las filas se filtran de cierta manera para volver apenas la respuesta querida. A menudo, los datos de las tablas múltiples son combinados en una, haciendo un ensamblan . Hay un número de operaciones emparentadas además de ensambla.
considera también:
la normalización de la base de datos Se clasifican las relaciones basaron sobre los tipos de anomalías a las cuales sean vulnerables. Una base de datos que está en la primera forma normal es vulnerable a todos los tipos de anomalías, mientras que una base de datos que está en la forma normal del dominio/de la llave no tiene ninguna anomalía de la modificación. Las formas normales son jerárquicas en naturaleza. Es decir, el nivel más bajo es la primera forma normal, y la base de datos no puede cumplir los requisitos para las formas normales de alto nivel sin primero cumplir todos los requisitos de la poca forma normal.
Una variedad de estas maneras se han intentado para almacenar objetos en una base de datos. Algunos productos han abordado el problema del extremo del programa de aplicación, haciendo los objetos manipulados por el persistente del programa. Esto también requiere típicamente la adición de una cierta clase de lenguaje de interrogación, puesto que los lenguajes de programación convencionales no tienen la capacidad de encontrar objetos basados en su contenido de información. Otros han atacado el problema del extremo de la base de datos, definiendo un modelo de datos orientado al objeto para la base de datos, y definiendo un lenguaje de programación de la base de datos que permite por completo el programar de capacidades así como instalaciones tradicionales de la pregunta.
Los ejemplos de los modelos que se podrían clasificar como poste-emparentado son MultiValue del aka de la SELECCIÓN, y las PAPERAS .
considera también: El almacenaje de la base de datos estructura el
Las tablas de base de datos/los índices se almacenan típicamente en memoria o en disco duro en uno de muchos ficheros " planos " de las formas, pedida/desordenada, ISAM, de los montones, de los cubos del picadillo o de los árboles B+ éstas tienen varias ventajas y desventajas discutidas más lejos en el artículo principal sobre este asunto. El más de uso general son árboles de B+ e ISAM.
Otras opciones importantes del diseño se relacionan con el agrupamiento de datos por categoría (tal como datos que agrupan por mes, o localización), creando las visiónes pre-computadas conocidas como visiónes materializadas, repartiendo datos por la gama o el picadillo. También la gerencia de memoria y la topología del almacenaje pueden ser opciones importantes del diseño para los diseñadores de base de datos. Apenas mientras que la normalización se utiliza para reducir requisitos de almacenaje y para mejorar la extensibilidad de la base de datos, el denormalization es inversamente de uso frecuente reducir ensambla complejidad y reduce el tiempo de ejecución para las preguntas.
DBMSs emparentado tiene la ventaja que los índices se pueden crear o caer sin los usos existentes cambiantes que hacen uso de ella. La base de datos elige entre muchas diversas estrategias basadas en cuál estima funcionará el más rápido. Es decir los índices son transparentes al uso o al usuario final que pregunta la base de datos; mientras que afectan a funcionamiento, cualquier comando de SQL funcionará con o sin los índices que existen en la base de datos.
DBMSs emparentado utiliza muchos diversos algoritmos para computar el resultado de una declaración del SQL . El RDBMS producirá un plan de cómo ejecutar la pregunta, que es generada analizando los tiempos de pasada de los diversos algoritmos y seleccionando el más rápido. Algunos de los algoritmos dominantes que se ocupan ensamblan son lazo jerarquizado ensamblan, la clasificación/intercalación ensambla y el picadillo ensambla . Cuáles de éstos se eligen depende encendido si existe un índice, qué tipo es, y su cardinalidad .
Un índice acelera el acceso a los datos, pero tiene desventajas también. Primero, cada índice aumenta la cantidad de almacenaje en la impulsión dura necesaria para el archivo de base de datos, y en segundo lugar, el índice debe ser actualizado cada vez que se alteran los datos, y éste cuesta tiempo. (Así un índice ahorra tiempo en la lectura de datos, pero cuesta tiempo en incorporar y la alteración de datos. Depende así del uso a el cual los datos deben ser puestos si un índice es en general una red más o menos en la búsqueda para la eficacia.)
Un caso especial de un índice es un índice primario, o la llave primaria, que se distingue en que el índice primario debe asegurar una referencia única a un expediente. A menudo, con este fin uno utiliza simplemente un número de índice corriente (número de identificación). Los índices primarios desempeñan un papel significativo en bases de datis relacionales, y pueden acelerar el acceso a los datos considerablemente.
En la práctica, muchos DBMS permiten que la mayor parte de estas reglas sean relajadas selectivamente para un mejor funcionamiento.
El control de concurrencia es un método usado para asegurarse de que las transacciones están ejecutadas de una manera segura y para seguir las reglas del ÁCIDO. El DBMS debe poder asegurarse de que solamente el serializable, horario recuperables está permitido, y de que no se pierda ningunas acciones de transacciones confiadas mientras que deshagan transacciones abortadas.
La réplica síncrona paralela de bases de datos permite a transacciones ser replegada en los servidores múltiples simultáneamente, que proporciona un método para el respaldo y seguridad así como disponibilidad de datos.
En Reino Unido la legislación que protegía al público contra la divulgación desautorizada de información personal se sostuvo el caídas de las bases de datos debajo de la oficina de la comisión de la información. Reino Unido basó las organizaciones que llevaban a cabo datos personales en el formato electrónico (bases de datos por ejemplo) se requiere para colocarse con la comisión de los datos. (referencia: )
.
| Random links: | John Quincy Adams | Lanzar (álbum de los muchachos de la tienda de animales) | Explotación minera de la melaza | Día del aprecio del administrador de sistema | Chuckie Finster |