Ítem
Acceso Abierto

Genomic Treasure Troves: Complete Genome Sequencing of Herbarium and Insect Museum Specimens

Título de la revista
Autores
Staats, Martijn
HJ Erkens, Roy HJ
van de Vossenberg, Bart
Wieringa, Jan J.
Wieringa, Jan J.
Kraaijeveld, Ken
Stielow, Benjamin
Geml, József
Richardson, James-Edward
Bakke, Freek T.

Archivos
Fecha
2013-01-01

Directores

ISSN de la revista
Título del volumen
Editor
Plosone.org

Buscar en:

Métricas alternativas

Resumen
Desbloquear la vasta diversidad genómica almacenada en las colecciones de historia natural crearía oportunidades sin precedentes para estudios evolutivos, filogenéticos, de domesticación y genómicos de poblaciones a escala genómica. Se ha desalentado a muchos investigadores de utilizar muestras históricas en estudios moleculares debido tanto al éxito generalmente limitado de la extracción de ADN como a los desafíos asociados con la amplificación por PCR de ADN altamente degradado. En el mundo actual de la secuenciación de próxima generación (NGS), las oportunidades y las perspectivas del ADN histórico han cambiado drásticamente, ya que la mayoría de los métodos NGS están diseñados para tomar moléculas de ADN fragmentadas cortas como plantillas. Aquí mostramos que utilizando un enfoque de secuenciación de Illumina multiplex estándar y de extremo emparejado, los datos de secuencia a escala del genoma se pueden generar de manera confiable a partir de una planta preservada en seco, especímenes de hongos e insectos recolectados hasta hace 115 años, y con un mínimo de muestreo destructivo. Usando un enfoque de ensamblaje basado en referencias, pudimos producir el genoma nuclear completo de una persona de 43 añosEspécimen de herbario de Arabidopsis thaliana (Brassicaceae) con cobertura de secuencia alta y uniforme. Se generaron secuencias del genoma nuclear de tres especímenes de hongos de 22 a 82 años de edad ( Agaricus bisporus , Laccaria bicolor , Pleurotus ostreatus ) con una cobertura del exoma del 81,4 al 97,9%. Se ensamblaron secuencias genómicas orgánicas completas para todas las muestras. Utilizando el ensamblaje de novo , recuperamos entre el 16,2% y el 71,0% de las regiones de secuencia de codificación y, por tanto, permanecemos algo cautelosos sobre las perspectivas de de novoensamblaje del genoma a partir de especímenes históricos. Se observaron contaminaciones de secuencias no objetivo en 2 de nuestras muestras de insectos del museo. Anticipamos que los proyectos futuros de genómica de museos quizás no generarán secuencias genómicas completas en todos los casos (nuestros especímenes contenían genomas relativamente pequeños y de baja complejidad), pero al menos generarán datos genómicos comparativos vitales para probar (filo) hipótesis genéticas, demográficas y genéticas, que se vuelven cada vez más horizontales. Además, la NGS de ADN histórico permite recuperar información genética crucial de especímenes de tipo antiguo que hasta la fecha no se han utilizado en su mayoría y, por lo tanto, también abre una nueva frontera para la investigación taxonómica.
Abstract
Unlocking the vast genomic diversity stored in natural history collections would create unprecedented opportunities for genome-scale evolutionary, phylogenetic, domestication and population genomic studies. Many researchers have been discouraged from using historical specimens in molecular studies because of both generally limited success of DNA extraction and the challenges associated with PCR-amplifying highly degraded DNA. In today’s next-generation sequencing (NGS) world, opportunities and prospects for historical DNA have changed dramatically, as most NGS methods are actually designed for taking short fragmented DNA molecules as templates. Here we show that using a standard multiplex and paired-end Illumina sequencing approach, genome-scale sequence data can be generated reliably from dry-preserved plant, fungal and insect specimens collected up to 115 years ago, and with minimal destructive sampling. Using a reference-based assembly approach, we were able to produce the entire nuclear genome of a 43-year-old Arabidopsis thaliana (Brassicaceae) herbarium specimen with high and uniform sequence coverage. Nuclear genome sequences of three fungal specimens of 22–82 years of age (Agaricus bisporus, Laccaria bicolor, Pleurotus ostreatus) were generated with 81.4–97.9% exome coverage. Complete organellar genome sequences were assembled for all specimens. Using de novo assembly we retrieved between 16.2–71.0% of coding sequence regions, and hence remain somewhat cautious about prospects for de novo genome assembly from historical specimens. Non-target sequence contaminations were observed in 2 of our insect museum specimens. We anticipate that future museum genomics projects will perhaps not generate entire genome sequences in all cases (our specimens contained relatively small and low-complexity genomes), but at least generating vital comparative genomic data for testing (phylo)genetic, demographic and genetic hypotheses, that become increasingly more horizontal. Furthermore, NGS of historical DNA enables recovering crucial genetic information from old type specimens that to date have remained mostly unutilized and, thus, opens up a new frontier for taxonomic research as well.
Palabras clave
Genoma De Especímenes De Herbario , Filogenéticos , Métodos NGS , Extracción De ADN Y Secuenciación De Illumina
Keywords
Herbarium Specimen Genome , Phylogenetics , NGS methods , Illumina DNA Extraction and Sequencing
Buscar en:
Colecciones