Los puntos clave no están disponibles para este artículo en este momento.
Los proyectos de secuenciación de ADN de próxima generación (NGS), como el Proyecto 1000 Genomas, ya están revolucionando nuestra comprensión de la variación genética entre individuos. Sin embargo, los enormes conjuntos de datos generados por NGS—solo el piloto del Proyecto 1000 Genomas incluye casi cinco terabases—hacen que escribir herramientas de análisis ricas en funciones, eficientes y robustas sea difícil incluso para individuos con sofisticación computacional. De hecho, muchos profesionales están limitados en el alcance y la facilidad con la que pueden responder preguntas científicas debido a la complejidad de acceder y manipular los datos producidos por estas máquinas. Aquí, discutimos nuestro Genome Analysis Toolkit (GATK), un framework de programación estructurado diseñado para facilitar el desarrollo de herramientas de análisis eficientes y robustas para secuenciadores de ADN de próxima generación usando la filosofía de programación funcional MapReduce. El GATK proporciona un conjunto pequeño pero completo de patrones de acceso a datos que abarcan la mayoría de las necesidades de herramientas de análisis. Separar cálculos específicos de análisis de la infraestructura común de gestión de datos nos permite optimizar el framework GATK para exactitud, estabilidad, y eficiencia en CPU y memoria, además de habilitar paralelización distribuida y en memoria compartida. Destacamos las capacidades del GATK describiendo la implementación y aplicación de herramientas robustas y tolerantes a escala como calculadoras de cobertura y llamada de polimorfismos de nucleótido único (SNP). Concluimos que el framework de programación GATK permite a desarrolladores y analistas escribir rápida y fácilmente herramientas NGS eficientes y robustas, muchas de las cuales ya se han incorporado a proyectos de secuenciación a gran escala como el Proyecto 1000 Genomas y The Cancer Genome Atlas.
Building similarity graph...
Analyzing shared references across papers
Loading...
Aaron McKenna
Matthew G. Hanna
Eric Banks
Genome Research
Massachusetts General Hospital
Broad Institute
Building similarity graph...
Analyzing shared references across papers
Loading...
McKenna et al. (Mon,) estudiaron esta cuestión.
www.synapsesocial.com/papers/69c26cf95e3c202f27ed8db8 — DOI: https://doi.org/10.1101/gr.107524.110
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: