Los proyectos del genoma del son los esfuerzos científicos que apuntan en última instancia determinar la secuencia completa del genoma de un organismo (sea un animal, una planta, un hongo, una bacteria, un arqueano, un Protist o un virus ). La secuencia del genoma para cualquier organismo requiere las secuencias de la DNA para cada uno de los cromosomas en un organismo ser determinada. Para las bacterias, que tienen generalmente apenas un cromosoma, un proyecto del genoma apuntará trazar la secuencia de ese cromosoma. Los seres humanos, con 22 pares de cromosomas y de 2 cromosomas de sexo, requerirán 24 secuencias separadas del cromosoma para representar el genoma terminado.
El proyecto de genoma humano era un proyecto del genoma de la señal y algo ha sostenido que la era de la genómica es uno de los avances más fundamentales en historia de la humanidad.
El montaje del genoma es un problema de cómputo muy difícil, hecho más difícil porque los genomas contienen una gran cantidad de secuencias idénticas, sabido pues el repite . Estas repeticiones pueden ser millares de nucleótidos de largo, y algunas ocurren en millares de diversas localizaciones, especialmente en los genomas grandes de las plantas y de los animales
Phred/Phrap de Phil Green
El AMOS (un ensamblador modular, de la Abrir-Fuente) es un esfuerzo bien conocido de la fuente abierta para reunir los esfuerzos de los reveladores principales del código del montaje del genoma. El hogar de los AMOS es actual http://amos. Los AMOS fueron iniciados en el el instituto para la investigación de Genomic por Steven Salzberg, el estallido de Mihai, y el arte Delcher.
El ensamblador de Celera del era el ensamblador desarrollado por el gene Myers, el Granger Sutton, el arte Delcher, y otros en la genómica de Celera a partir de 1998 hasta aproximadamente 2002. Fue movido al SourceForge y continúa siendo convertido por los científicos originales y otros, en http://sourceforge.net/projects/wgs-assembler.
El ensamblador del Arachne comenzó en 2000 como la tesis doctoral Serafim Batzoglou, ahora en la Universidad de Stanford . Desde entonces, ha sido desarrollado por un avance del equipo por el David B. Jaffe en el instituto amplio, antes parte del instituto de Whitehead. Está disponible para la transferencia directa en http://www.
El nivel básico de anotación está utilizando la RÁFAGA para encontrar semejanzas, y después anotar los genomas basados en ése. Sin embargo, la información cada vez más adicional se agrega hoy en día a la plataforma de la anotación. La información adicional permite a anotadores manuales a las discrepancias del deconvolute entre los genes que se dan la misma anotación.
Por ejemplo, la base de datos de la SEMILLA utiliza la información del contexto del genoma, cuentas de la semejanza, datos experimentales, y las integraciones de otros recursos para proporcionar las anotaciones más exactas del genoma con sus subsistemas se acercan.
La anotación estructural del consiste en la identificación de elementos genomic.
ORFs y su localización
estructura del gene
regiones de la codificación
localización de adornos reguladores
La anotación funcional del consiste en adjuntar la información biológica a los elementos genomic.
función bioquímica
función biológica
regulación e interacciones implicadas
expresión
Estos pasos pueden implicar experimentos biológicos y análisis del in silico.
Una variedad de herramientas de software se han desarrollado para permitir que los científicos vean y que compartan anotaciones del genoma.
Cuando el que ordena un genoma, allí es generalmente las regiones que son difíciles de ordenar (a menudo las regiones con alto la DNA repetidor ). Así, las secuencias “terminadas” del genoma son raramente siempre completas, y los términos tales como “bosquejo de funcionamiento” o “esencialmente completo” se han utilizado a describen más exactamente el estado de tales proyectos del genoma. Incluso cuando cada par de la base de una secuencia del genoma se ha determinado, hay todavía probable ser presente de los errores porque la secuencia de la DNA no es un proceso totalmente exacto. Podría también ser discutido que un proyecto completo del genoma debe incluir las secuencias de las mitocondrias y (para las plantas) de los cloroplastos pues estos organelos tienen sus propios genomas.
Se divulga a menudo que la meta de ordenar un genoma es obtener la información sobre el sistema completo de los genes en esa secuencia particular del genoma. La proporción de un genoma que codifique para los genes puede ser muy pequeña (particularmente en los eucariotas tal como seres humanos, donde la DNA de la codificación puede explicar solamente el alguno por ciento de la secuencia entera). Sin embargo, no es siempre posible (o deseable) ordenar solamente las regiones de la codificación por separado. También, como los científicos entienden más sobre el papel de este noncoding la DNA (designado a menudo la DNA de los desperdicios), llegará a ser más importante tener una secuencia completa del genoma como fondo a entender la genética y la biología de cualquier organismo dado.
Los proyectos del genoma no se confinan en gran medida solamente a determinar una secuencia de la DNA de un organismo. Tales proyectos pueden también incluir la predicción del gene para descubrir donde están los genes en un genoma, y lo que lo hacen esos genes. Puede también haber proyectos relacionados al ESTs de la secuencia o al MRNAs a ayudar a descubrir donde están los genes realmente.
Históricamente, al ordenar los genomas eucarióticos (tales como los elegans de Caenorhabditis del gusano) era común al primer mapa el genoma para proporcionar una serie de señales a través del genoma. Algo que un cromosoma en uno van, él sería pedazo ordenado al lado de pedazo (con el conocimiento anterior de aproximadamente donde ese pedazo se establece en el cromosoma más grande). Los cambios en tecnología y particularmente las mejoras a la capacidad de cálculo de computadoras, significan que van los genomas pueden ahora ser el “ ordenado escopeta” en uno (hay advertencias a este acercamiento sin embargo cuando está comparado al acercamiento tradicional).
Las mejoras en la DNA que ordenaba tecnología de han significado que el coste de ordenar una nueva secuencia del genoma ha caído constantemente (en términos de coste por los pares de la base) y una más nueva tecnología también ha significado que los genomas se pueden ordenar lejos más rápidamente. Cuando las agencias de la investigación deciden a qué nuevos genomas a la secuencia, el énfasis han estado en las especies que tienen cualquier una importancia a la salud humana (e. bacterias patógenas o vectores de la enfermedad tales como mosquitos o especies que tienen importancia comercial (e. ganado y las plantas cultivadas). El énfasis secundario se pone en la especie cuyos genomas ayudarán a contestar a preguntas importantes en la evolución molecular (e. el chimpancé común ).
En el futuro, es probable que llegue a ser incluso más barato y más rápido ordenar un genoma. Esto permitirá para que las secuencias completas del genoma sean determinadas de muchos diversos individuos de la misma especie. Para los seres humanos, esto permitirá que entendamos mejor aspectos de la diversidad genética humana .
.
| Random links: | Lista de anunciadores de deportes | Francisco Stewart, 1r conde de Bothwell | Irené Novaczek | Glenn De Baeremaeker | Hal Greer |