La bioinformática y la biología de cómputo implican el uso de técnicas incluyendo las matemáticas aplicadas, la informática, las estadísticas, el de informática, la inteligencia artificial, la química, y la bioquímica de solucionar problemas biológicos generalmente en el nivel molecular . La investigación en biología de cómputo se traslapa a menudo con la biología de sistemas . Esfuerzos de investigación importantes en el campo incluyen la alineación de la secuencia, el gene que encuentra, el montaje del genoma, la alineación de la estructura de la proteína, la predicción de la estructura de la proteína, la predicción de la expresión de gene y de las interacciones de la Proteína-proteína, y el modelado de la evolución .

Introducción

La bioinformática del de los términos y la biología de cómputo del son de uso frecuente alternativamente. No obstante la bioinformática del refiere más correctamente a la creación y el adelanto de algoritmos, las técnicas de cómputo y estadísticas, y teoría para solucionar los problemas formales y prácticos que se presentan de la gerencia y del análisis de datos biológicos. La biología de cómputo del, por una parte, refiere a la investigación hipótesis-conducida de un problema biológico específico usar las computadoras, realizado con datos experimentales o simulados, con la meta fundamental del descubrimiento y del adelanto del conocimiento biológico. Poner más simplemente, bioinformática se trata a la información mientras que la biología de cómputo se refiere a las hipótesis. Una distinción similar es hecha por los institutos nacionales de la salud en sus definiciones de trabajo de la bioinformática y de la biología de cómputo, donde se acentúa más a fondo que hay un acoplador apretado de progresos y del conocimiento entre la investigación hipótesis-conducida en biología de cómputo y la investigación técnica-conducida en bioinformática. La bioinformática también se especifica a menudo como subcampo aplicado de la disciplina más general de la informática biomédica .

Un hilo de rosca común en proyectos en bioinformática y biología de cómputo es el uso de herramientas matemáticas de extraer la información útil de los datos presentados por técnicas biológicas del alto-rendimiento de procesamiento tales como genoma que ordena . Un problema representativo en bioinformática es el montaje de las secuencias de alta calidad del genoma del " fragmentario; shotgun" de la DNA que ordena . Otros problemas comunes incluyen el estudio de la regulación del gene para realizar la expresión que perfila usar datos de los microarrays o de la espectrometría total .

Áreas de investigación importantes

Análisis de la secuencia

considera también: Alineación,

la secuencia de la base de datos de la secuencia

Desde el Φ-X174 bacteriófago era ordenado en 1977, las secuencias de la DNA de centenares de organismos se han descifrado y se han almacenado en bases de datos. La información se analiza para determinar los genes que codifican los polipéptidos, así como secuencias reguladoras. Una comparación de genes dentro de una especie o entre diversa especie puede demostrar semejanzas entre las funciones de la proteína, o relaciones entre las especies (el uso de la sistemática molecular de construir los árboles filogenéticos . Con la cantidad growing de datos, llegó a ser hace tiempo impráctico analizar secuencias de la DNA manualmente. Hoy, los programas de computadora se utilizan para buscar el genoma de los millares de organismos, conteniendo mil millones de los nucleótidos que estos programas compensarían mutaciones (las bases intercambiadas, suprimidas o insertadas) en la secuencia de la DNA, para identificar las secuencias que son relacionadas, pero no idéntico. Una variante de esta alineación de la secuencia se utiliza en el proceso de secuencia sí mismo. La escopeta supuesta que ordena la técnica de (que fue utilizado, por ejemplo, por el el instituto para la investigación de Genomic para ordenar el primer genoma, Hemophilus influenzae bacterianos del ) no da una lista secuencial de nucleótidos, sino que por el contrario las secuencias de millares de pequeños fragmentos de la DNA (cada uno cerca de 600-800 nucleótidos de largo). Los extremos de estos fragmentos traslapan y, cuando están alineados de la manera correcta, componen el genoma completo. La escopeta que ordena producciones ordena datos rápidamente, pero la tarea de montar los fragmentos puede ser absolutamente complicada para genomas más grandes. En el caso del proyecto de genoma humano, tardó varios meses del tiempo CPU (en una computadora alfa de la DEC de la vendimia circa-2000) para montar los fragmentos. La secuencia de la escopeta es el método de opción para virtualmente todos los genomas ordenados hoy, y los algoritmos del montaje del genoma son un área crítica de la investigación de la bioinformática.

Otro aspecto del análisis de la bioinformática en orden es la búsqueda automática para los genes y las secuencias reguladoras dentro de un genoma. No todos los nucleótidos dentro de un genoma son genes. Dentro del genoma de organismos más altos, las partes grandes de la DNA no responden a ningún propósito obvio. Esta DNA supuesta de los desperdicios puede, sin embargo, contener elementos funcionales desconocidos. La bioinformática ayuda a llenar el vacío entre el genoma y los proyectos de Proteome --por ejemplo, en el uso de las secuencias de la DNA para la identificación de la proteína.

El considera también: análisis, secuencia de la secuencia de que perfila la herramienta, adorno de la secuencia.

Anotación del genoma

considera también: Gene que encuentra el

En el contexto de la genómica, la anotación es el proceso de marcar los genes y otras características biológicas en una secuencia de la DNA. El primer sistema informático de la anotación del genoma fue diseñado en 1995 por el Dr. Owen White, que era parte del equipo que ordenó y analizaba el primer genoma de un organismo de libre-vida que se descifrará, el Hemophilus influenzae de la bacteria. White construyó un sistema informático para encontrar los genes (los lugares en la DNA ordenan que codifican una proteína), el ARN de la transferencia, y otras características, y para hacer asignaciones iniciales de la función a esos genes. La mayoría de los sistemas actuales de la anotación del genoma trabajan semejantemente, pero los programas disponibles para el análisis de la DNA genomic son constantemente cambiantes y de mejoras.

Biología evolutiva de cómputo

La biología evolutiva es el estudio del origen y de la pendiente de la especie, así como su cambio en un cierto plazo. La informática ha asistido a biólogos evolutivos de varias maneras dominantes; ha permitido a investigadores:
remontar la evolución de una gran cantidad de organismos midiendo cambios en su DNA, algo que con la taxonomía física o las observaciones fisiológicas solamente,
más recientemente, comparar los genomas enteros, que permite el estudio de acontecimientos evolutivos más complejos, tales como duplicación del gene, transferencia lateral del gene, y la predicción de los factores importantes en el Speciation bacteriano,
construir los modelos de cómputo complejos de poblaciones para predecir el resultado del sistema en un cierto plazo
información de la pista y de la parte sobre un número cada vez más grande de especie y de organismos El trabajo futuro se esfuerza para reconstruir el árbol más complejo del now de la vida .

El campo de investigación dentro de informática que utiliza los algoritmos genéticos se confunde a veces con la biología evolutiva de cómputo, pero las dos áreas está sin relación.

Biodiversidad de medición

La biodiversidad de un ecosistema se pudo definir como el complemento genomic total de un ambiente particular, de todo el presente de la especie, si es un biofilm en una mina abandonada, una gota de la agua de mar, una cucharada del suelo, o la biosfera entera de la tierra del planeta. Las bases de datos se utilizan para recoger los nombres de la especie, las descripciones, las distribuciones, la información genética, el estado y el tamaño de las necesidades del habitat de las poblaciones, y cómo cada organismo obra recíprocamente con la otra especie. Los programas especializados del software se utilizan para encontrar, para visualizar, y para analizar la información, y más importante, comunicarla a la otra gente. Las simulaciones de la computadora modelan las cosas tales como dinámicas de la población, o calculan la salud genética acumulativa de una piscina breeding (en la agricultura ) o de la población en peligro (en la conservación ). Un potencial muy emocionante de este campo es que las secuencias enteras de la DNA, o los genomas de las especies en peligro se pueden preservar, permitiendo que los resultados del experimento genético de la naturaleza sean recordado del en el silico, y reutilizado posiblemente en el futuro, incluso si esa especie se pierde eventual.

Proyectos importantes del : Proyecto de la especie 2000 de ; proyecto del uBio.

Análisis de la expresión de gene

La expresión de muchos genes puede ser determinada midiendo niveles del MRNA con técnicas múltiples incluyendo los microarrays, la etiqueta expresada (EST) de la secuencia del cDNA secuencia, el análisis serial de la etiqueta de la expresión de gene (SABIO) que ordena, de la firma paralela masivo que ordena (MPSS), o de varios usos del hibridación "in-situ" multiplexado. Todas estas técnicas son extremadamente ruido-propensas y/o conforme a diagonal en la medida biológica, y un área de investigación importante en biología de cómputo implica el desarrollar de las herramientas estadísticas para separar la señal del ruido en estudios de la expresión de gene del alto-rendimiento de procesamiento. Tales estudios son de uso frecuente determinar los genes implicados en un desorden: uno pudo comparar datos del microarray de las células epiteliales canceroso a los datos de las células non-cancerous para determinar las transcripciones que para arriba-se regulan y abajo-se regulan en una población particular de células cancerosas.

Análisis de la regulación

La regulación es la orquestación compleja de los acontecimientos que comienzan con una señal extracelular tal como una hormona y llevando a un aumento o a una disminución de la actividad de uno o más técnicas de la bioinformática de las proteínas se han aplicado para explorar varios pasos en este proceso. Por ejemplo, el análisis del promotor implica la identificación y el estudio de los adornos de la secuencia en la DNA que rodea la región de la codificación de un gene. Estos adornos influencian el grado a el cual esa región se transcribe en el mRNA. Los datos de la expresión se pueden utilizar para deducir la regulación del gene: uno pudo comparar datos del Microarray de una gran variedad de estados de un organismo a las hipótesis de la forma sobre los genes implicados en cada estado. En un organismo unicelular, uno pudo comparar las etapas del ciclo celular, junto con la varia tensión condiciona (choque del calor, hambre, etc. Uno puede entonces aplicar los algoritmos de agrupamiento a esos datos de la expresión para determinar co-se expresan qué genes. Por ejemplo, las regiones por aguas arriba (promotores) de genes co-expresados se pueden buscar para los elementos reguladores sobrerepresentados .

Análisis de la expresión de la proteína

Los Microarrays de la proteína y la espectrometría total (HT) (ms) del alto del rendimiento de procesamiento pueden proporcionar una foto de las proteínas presentes en una muestra biológica. La bioinformática está mucho implicada en tener sentido del microarray de la proteína y de los datos del ms del HT; el acercamiento anterior hace frente a problemas similares como con los microarrays apuntados en el mRNA, este 3ultimo implica el problema de emparejar granes cantidades de datos totales contra masas previstas de bases de datos de la secuencia de la proteína, y el análisis estadístico complicado de las muestras donde el múltiplo, pero los péptidos incompletos de cada proteína se detecta.

Análisis de mutaciones en cáncer

En cáncer, los genomas de células afectadas se cambian de maneras complejas o aún imprevisibles. Se utilizan esfuerzos de secuencia masivos para identificar las mutaciones de punto previamente desconocidas en una variedad de genes en el cáncer . Bioinformaticians continúa a los sistemas automatizados especializados producto manejando el volumen escarpado de datos de la secuencia presentados, y crean nuevos algoritmos y software para comparar los resultados de secuencia a la colección growing de secuencias del genoma y de polimorfismos humanos de Germline . La nueva tecnología física de la detección se emplea, por ejemplo microarrays del oligonucleótido para identificar aumentos cromosómicos y las pérdidas (llamados el el hibridación genomic comparativo ), y solos órdenes del polimorfismo del nucleótido para detectar las mutaciones de punto sabidas del . Estos métodos de detección miden simultáneamente varios cientos de mil sitios a través del genoma, y cuando están utilizados en alto-rendimiento de procesamiento para medir millares de muestras, generan los Terabyte de datos por el experimento. Otra vez las cantidades masivas y los nuevos tipos de datos generan las nuevas oportunidades para los bioinformaticians. Los datos se encuentran a menudo para contener considerable variabilidad, o el ruido, y así el modelo de Markov ocultado y los métodos del análisis del Cambiar-punto se están desarrollando para deducir cambios verdaderos del número de copia .

¡Otro tipo de datos que requieran el desarrollo nuevo de la informática es el análisis de las lesiones encontradas para ser recurrente a través de muchos tumores .

Predicción de la estructura de la proteína

considera también:

la predicción de la estructura de la proteína

La predicción de la estructura de la proteína es otro uso importante de la bioinformática. La secuencia del aminoácido de una proteína, la estructura primaria supuesto, se puede determinar fácilmente de la secuencia en el gene ese los códigos para ella. En la gran mayoría de casos, esta estructura primaria determina únicamente una estructura en su ambiente nativo. (Por supuesto, hay excepciones, tales como la encefalopatía espongiforme bovina - enfermedad de las vacas locas del aka - el prión .) El conocimiento de esta estructura es vital en la comprensión de la función de la proteína. A falta de mejores términos, la información estructural se clasifica generalmente como una secundario del, terciario del y de la estructura cuaternario del . Una solución general viable a tales predicciones sigue siendo un problema abierto. En fecha ahora, la mayoría de los esfuerzos se han dirigido hacia la heurística que trabajan la mayor parte del tiempo.

Una de las ideas dominantes en bioinformática es la noción de la homología . En la rama genomic de la bioinformática, la homología se utiliza para predecir la función de un gene: si la secuencia de A del gene, cuya se sabe función, es homóloga a la secuencia del B del gene, cuya función es desconocida, uno podría deducir que B puede compartir la función de la a. En la rama estructural de la bioinformática, la homología se utiliza para determinar qué partes de una proteína son importantes en la formación y la interacción de la estructura con otras proteínas. En una técnica llamada homología que modela, esta información se utiliza para predecir la estructura de una proteína una vez que la estructura de una proteína homóloga se sabe. Ésta sigue siendo actual la única manera de predecir las estructuras de la proteína confiablemente.

Un ejemplo de esto es la homología similar de la proteína entre la hemoglobina en seres humanos y la hemoglobina en las legumbres ( Leghemoglobin ). Ambos responden al mismo propósito de transportar el oxígeno en el organismo. Aunque ambas proteínas tienen secuencias de aminoácido totalmente diversas, sus estructuras de la proteína son virtualmente idénticas, que refleja sus propósitos idénticos cercanos.

Otras técnicas para predecir la estructura de la proteína incluyen la proteína que rosca y modelado física-basado de de novo (de rasguño).

Ver también el adorno estructural y el dominio estructural .

Genómica comparativa

La base del análisis comparativo del genoma es el establecimiento de la correspondencia entre los genes (análisis del orthology) u otras características genomic en diversos organismos. Es estos mapas intergenomic que permiten remontar los procesos evolutivos responsables de la divergencia de dos genomas. Una multiplicidad de acontecimientos evolutivos que actúan en los varios niveles de organización forma la evolución del genoma. En el nivel más bajo, las mutaciones de punto afectan a los nucleótidos individuales. En segmentos cromosómicos de alto nivel, grandes experimentar la duplicación, la transferencia lateral, la inversión, la transposición, la canceladura y la inserción. En última instancia, los genomas enteros están implicados en procesos del hibridación, del polyploidization y Endosymbiosis, llevando a menudo al speciation rápido. La complejidad de la evolución del genoma plantea muchos desafíos emocionantes a los reveladores de los modelos matemáticos y de los algoritmos, que tienen recurso a los espectros de técnicas algorítmicas, estadísticas y matemáticas, extendiéndose de la heurística exacta,, del parámetro fijo y de los algoritmos de la aproximación para los problemas basados en modelos de la parsimonia a los algoritmos de Monte Carlo de la cadena de Markov para el análisis Bayesian de los problemas basados en modelos de probabilidad.

Muchos de estos estudios se basan en la detección de la homología y el cómputo de las familias de la proteína.

Ver también la genómica comparativa, la red Bayesian y la familia de la proteína.

Modelado de sistemas biológicos

considera también:

la biología de sistemas

La biología de sistemas implica el uso de las simulaciones de computadora de los subsistemas celulares (tales como las redes de metabilitos y de las enzimas que abarcan el metabolismo, los caminos y las redes reguladoras de la transducción de la señal del gene a analizan y visualizan las conexiones complejas de estos procesos celulares. La vida artificial o la evolución virtual intenta entender procesos evolutivos vía la simulación de computadora de las formas de vida (artificiales) simples.

análisis de imagen del Alto-rendimiento de procesamiento

Las tecnologías de cómputo se utilizan para acelerar o para automatizar completamente el proceso, la cuantificación y el análisis de granes cantidades de las imágenes biomédicas del alto-información-contenido. Los sistemas de análisis de imagen modernos aumentan la capacidad de un observador de hacer medidas de un sistema grande o complejo de imágenes, mejorando la exactitud, la objetividad, o la velocidad. Un sistema de análisis completamente desarrollado puede substituir totalmente al observador. Aunque estos sistemas no sean únicos a las imágenes biomédicas, la proyección de imagen biomédica está llegando a ser más importante para los diagnósticos y la investigación. Algunos ejemplos son:
alto-rendimiento de procesamiento y localización de alta fidelidad del cuantificación y subcelular (investigación del Alto-contenido, Cytohistopathology )
Morphometrics
análisis y visualización clínicos de imagen
determinación de los patrones de la circulación de aire del tiempo real en los pulmones de respiración de animales vivos
cuantificación de tamaño de la obstrucción en imágenes en tiempo real del desarrollo de y de la recuperación durante lesión arterial
fabricación de observaciones del comportamiento de grabaciones video extendidas de animales de laboratorio
medidas infrarrojas para la determinación metabólica de la actividad

muelle de la Proteína-proteína

considera también:

l muelle de la Proteína-proteína En las dos décadas pasadas, los diez de millares de estructuras tridimensionales de la proteína son determinados por la cristalografía de la radiografía y la espectroscopia de resonancia magnética nuclear (proteína RMN) de la proteína. Una pregunta central para el científico biológico es si es práctica predecir las interacciones posibles de la proteína-proteína basadas solamente en estas formas 3D, sin hacer la interacción de la Proteína-proteína experimenta. Una variedad de métodos se han desarrollado para abordar el problema del muelle de la Proteína-proteína, aunque parece que todavía hay mucho lugar a trabajar encendido en este campo.

Herramientas de software

¡los anuncios para las herramientas aquí. Las descripciones objetivas de herramientas significativas están muy bien, si no son la fuente original del avance -->

Las herramientas de software para la bioinformática se extienden de la comando-línea simple herramientas, a programas gráficos más complejos y a tela-servicios independientes. La herramienta de cómputo de la biología más conocida entre biólogos es probablemente la RÁFAGA, un algoritmo para determinar la semejanza de secuencias arbitrarias contra otras secuencias, posiblemente de bases de datos curated de la proteína o de las secuencias de la DNA. El NCBI proporciona una puesta en práctica en Internet popular que busque sus bases de datos.

JABÓN - los interfaces basados se han desarrollado para una gran variedad de usos de la bioinformática permitiendo un uso que funcionaba en una computadora en una porción del mundo para utilizar recursos de los algoritmos, de los datos y de computación en los servidores en otras partes del mundo. La disponibilidad de éstos Jabón-basó servicios de tela de la bioinformática a través de sistemas tales como el registro del servicio de BioMoby demuestra la aplicabilidad de las soluciones en Internet de la bioinformática. Estas herramientas se extienden de una colección de herramientas independientes con un formato de datos común bajo interfaz solo, independiente o en Internet, a los sistemas de gestión integrantes y extensibles del flujo de trabajo de la bioinformática.

Ver también

Asuntos relacionados

Campos relacionados

.

  • Zenithic
  • It's Not About You
    Random links:1472 | Infidelidad | Bergstrand (cráter) | Grady Sizemore | Spiro Nikolouzos

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">