La bioinformática y la biología de cómputo implican el uso de técnicas incluyendo las matemáticas aplicadas, la informática, las estadísticas, el de informática, la inteligencia artificial, la química, y la bioquímica de solucionar problemas biológicos generalmente en el nivel molecular . La investigación en biología de cómputo se traslapa a menudo con la biología de sistemas . Esfuerzos de investigación importantes en el campo incluyen la alineación de la secuencia, el gene que encuentra, el montaje del genoma, la alineación de la estructura de la proteína, la predicción de la estructura de la proteína, la predicción de la expresión de gene y de las interacciones de la Proteína-proteína, y el modelado de la evolución .
La bioinformática del de los términos y la biología de cómputo del son de uso frecuente alternativamente. No obstante la bioinformática del refiere más correctamente a la creación y el adelanto de algoritmos, las técnicas de cómputo y estadísticas, y teoría para solucionar los problemas formales y prácticos que se presentan de la gerencia y del análisis de datos biológicos. La biología de cómputo del, por una parte, refiere a la investigación hipótesis-conducida de un problema biológico específico usar las computadoras, realizado con datos experimentales o simulados, con la meta fundamental del descubrimiento y del adelanto del conocimiento biológico. Poner más simplemente, bioinformática se trata a la información mientras que la biología de cómputo se refiere a las hipótesis. Una distinción similar es hecha por los institutos nacionales de la salud en sus definiciones de trabajo de la bioinformática y de la biología de cómputo, donde se acentúa más a fondo que hay un acoplador apretado de progresos y del conocimiento entre la investigación hipótesis-conducida en biología de cómputo y la investigación técnica-conducida en bioinformática. La bioinformática también se especifica a menudo como subcampo aplicado de la disciplina más general de la informática biomédica .
Un hilo de rosca común en proyectos en bioinformática y biología de cómputo es el uso de herramientas matemáticas de extraer la información útil de los datos presentados por técnicas biológicas del alto-rendimiento de procesamiento tales como genoma que ordena . Un problema representativo en bioinformática es el montaje de las secuencias de alta calidad del genoma del " fragmentario; shotgun" de la DNA que ordena . Otros problemas comunes incluyen el estudio de la regulación del gene para realizar la expresión que perfila usar datos de los microarrays o de la espectrometría total .
considera también: Alineación,
la secuencia de la base de datos de la secuencia
Desde el Φ-X174 bacteriófago era ordenado en 1977, las secuencias de la DNA de centenares de organismos se han descifrado y se han almacenado en bases de datos. La información se analiza para determinar los genes que codifican los polipéptidos, así como secuencias reguladoras. Una comparación de genes dentro de una especie o entre diversa especie puede demostrar semejanzas entre las funciones de la proteína, o relaciones entre las especies (el uso de la sistemática molecular de construir los árboles filogenéticos . Con la cantidad growing de datos, llegó a ser hace tiempo impráctico analizar secuencias de la DNA manualmente. Hoy, los programas de computadora se utilizan para buscar el genoma de los millares de organismos, conteniendo mil millones de los nucleótidos que estos programas compensarían mutaciones (las bases intercambiadas, suprimidas o insertadas) en la secuencia de la DNA, para identificar las secuencias que son relacionadas, pero no idéntico. Una variante de esta alineación de la secuencia se utiliza en el proceso de secuencia sí mismo. La escopeta supuesta que ordena la técnica de (que fue utilizado, por ejemplo, por el el instituto para la investigación de Genomic para ordenar el primer genoma, Hemophilus influenzae bacterianos del ) no da una lista secuencial de nucleótidos, sino que por el contrario las secuencias de millares de pequeños fragmentos de la DNA (cada uno cerca de 600-800 nucleótidos de largo). Los extremos de estos fragmentos traslapan y, cuando están alineados de la manera correcta, componen el genoma completo. La escopeta que ordena producciones ordena datos rápidamente, pero la tarea de montar los fragmentos puede ser absolutamente complicada para genomas más grandes. En el caso del proyecto de genoma humano, tardó varios meses del tiempo CPU (en una computadora alfa de la DEC de la vendimia circa-2000) para montar los fragmentos. La secuencia de la escopeta es el método de opción para virtualmente todos los genomas ordenados hoy, y los algoritmos del montaje del genoma son un área crítica de la investigación de la bioinformática.
Otro aspecto del análisis de la bioinformática en orden es la búsqueda automática para los genes y las secuencias reguladoras dentro de un genoma. No todos los nucleótidos dentro de un genoma son genes. Dentro del genoma de organismos más altos, las partes grandes de la DNA no responden a ninguÌn propósito obvio. Esta DNA supuesta de los desperdicios puede, sin embargo, contener elementos funcionales desconocidos. La bioinformática ayuda a llenar el vacío entre el genoma y los proyectos de Proteome --por ejemplo, en el uso de las secuencias de la DNA para la identificación de la proteína.
El considera también: análisis, secuencia de la secuencia de que perfila la herramienta, adorno de la secuencia.
considera también: Gene que encuentra el
En el contexto de la genómica, la anotación es el proceso de marcar los genes y otras características biológicas en una secuencia de la DNA. El primer sistema informático de la anotación del genoma fue diseñado en 1995 por el Dr. Owen White, que era parte del equipo que ordenó y analizaba el primer genoma de un organismo de libre-vida que se descifrará, el Hemophilus influenzae de la bacteria. White construyó un sistema informático para encontrar los genes (los lugares en la DNA ordenan que codifican una proteína), el ARN de la transferencia, y otras características, y para hacer asignaciones iniciales de la función a esos genes. La mayoría de los sistemas actuales de la anotación del genoma trabajan semejantemente, pero los programas disponibles para el análisis de la DNA genomic son constantemente cambiantes y de mejoras.
El campo de investigación dentro de informática que utiliza los algoritmos genéticos se confunde a veces con la biología evolutiva de cómputo, pero las dos áreas está sin relación.
Proyectos importantes del : Proyecto de la especie 2000 de ; proyecto del uBio.
¡Otro tipo de datos que requieran el desarrollo nuevo de la informática es el análisis de las lesiones encontradas para ser recurrente a través de muchos tumores .
considera también:
la predicción de la estructura de la proteína
La predicción de la estructura de la proteína es otro uso importante de la bioinformática. La secuencia del aminoácido de una proteína, la estructura primaria supuesto, se puede determinar fácilmente de la secuencia en el gene ese los códigos para ella. En la gran mayoría de casos, esta estructura primaria determina únicamente una estructura en su ambiente nativo. (Por supuesto, hay excepciones, tales como la encefalopatía espongiforme bovina - enfermedad de las vacas locas del aka - el prión .) El conocimiento de esta estructura es vital en la comprensión de la función de la proteína. A falta de mejores términos, la información estructural se clasifica generalmente como una secundario del, terciario del y de la estructura cuaternario del . Una solución general viable a tales predicciones sigue siendo un problema abierto. En fecha ahora, la mayoría de los esfuerzos se han dirigido hacia la heurística que trabajan la mayor parte del tiempo.
Una de las ideas dominantes en bioinformática es la noción de la homología . En la rama genomic de la bioinformática, la homología se utiliza para predecir la función de un gene: si la secuencia de A del gene, cuya se sabe función, es homóloga a la secuencia del B del gene, cuya función es desconocida, uno podría deducir que B puede compartir la función de la a. En la rama estructural de la bioinformática, la homología se utiliza para determinar qué partes de una proteína son importantes en la formación y la interacción de la estructura con otras proteínas. En una técnica llamada homología que modela, esta información se utiliza para predecir la estructura de una proteína una vez que la estructura de una proteína homóloga se sabe. Ésta sigue siendo actual la única manera de predecir las estructuras de la proteína confiablemente.
Un ejemplo de esto es la homología similar de la proteína entre la hemoglobina en seres humanos y la hemoglobina en las legumbres ( Leghemoglobin ). Ambos responden al mismo propósito de transportar el oxígeno en el organismo. Aunque ambas proteínas tienen secuencias de aminoácido totalmente diversas, sus estructuras de la proteína son virtualmente idénticas, que refleja sus propósitos idénticos cercanos.
Otras técnicas para predecir la estructura de la proteína incluyen la proteína que rosca y modelado física-basado de de novo (de rasguño).
Ver también el adorno estructural y el dominio estructural .
Muchos de estos estudios se basan en la detección de la homología y el cómputo de las familias de la proteína.
Ver también la genómica comparativa, la red Bayesian y la familia de la proteína.
considera también:
la biología de sistemas
La biología de sistemas implica el uso de las simulaciones de computadora de los subsistemas celulares (tales como las redes de metabilitos y de las enzimas que abarcan el metabolismo, los caminos y las redes reguladoras de la transducción de la señal del gene a analizan y visualizan las conexiones complejas de estos procesos celulares. La vida artificial o la evolución virtual intenta entender procesos evolutivos vía la simulación de computadora de las formas de vida (artificiales) simples.
considera también:
l muelle de la Proteína-proteína En las dos décadas pasadas, los diez de millares de estructuras tridimensionales de la proteína son determinados por la cristalografía de la radiografía y la espectroscopia de resonancia magnética nuclear (proteína RMN) de la proteína. Una pregunta central para el científico biológico es si es práctica predecir las interacciones posibles de la proteína-proteína basadas solamente en estas formas 3D, sin hacer la interacción de la Proteína-proteína experimenta. Una variedad de métodos se han desarrollado para abordar el problema del muelle de la Proteína-proteína, aunque parece que todavía hay mucho lugar a trabajar encendido en este campo.
¡los anuncios para las herramientas aquí. Las descripciones objetivas de herramientas significativas están muy bien, si no son la fuente original del avance -->
Las herramientas de software para la bioinformática se extienden de la comando-línea simple herramientas, a programas gráficos más complejos y a tela-servicios independientes. La herramienta de cómputo de la biología más conocida entre biólogos es probablemente la RÁFAGA, un algoritmo para determinar la semejanza de secuencias arbitrarias contra otras secuencias, posiblemente de bases de datos curated de la proteína o de las secuencias de la DNA. El NCBI proporciona una puesta en práctica en Internet popular que busque sus bases de datos.
JABÓN - los interfaces basados se han desarrollado para una gran variedad de usos de la bioinformática permitiendo un uso que funcionaba en una computadora en una porción del mundo para utilizar recursos de los algoritmos, de los datos y de computación en los servidores en otras partes del mundo. La disponibilidad de éstos Jabón-basó servicios de tela de la bioinformática a través de sistemas tales como el registro del servicio de BioMoby demuestra la aplicabilidad de las soluciones en Internet de la bioinformática. Estas herramientas se extienden de una colección de herramientas independientes con un formato de datos común bajo interfaz solo, independiente o en Internet, a los sistemas de gestión integrantes y extensibles del flujo de trabajo de la bioinformática.
.
| Random links: | 1472 | Infidelidad | Bergstrand (cráter) | Grady Sizemore | Spiro Nikolouzos |