Single-Molecule Real-Time-sekvensering

Från Wikipedia
Single-Molecule Real-Time-sekvensering
SpråkfamiljSingle-Molecule Real-Time-sekvensering
Språkkoder
ISO 639‐3

Single-molecule real-time-sekvensering (SMRT-sekvensering) är en DNA-sekvenseringsmetod för parallelliserad enkelmolekyl. SMRT-sekvensering använder zero-mode waveguide (ZMW).[1] Ett enda DNA polymeras-enzym är fäst vid botten av en ZMW med en enda DNA-molekyl som mall. ZMW är en struktur som skapar en upplyst observationsvolym som är tillräckligt liten för att endast observera en enda DNA-nukleotid som inkorporeras av DNA polymeras. Var och en av de fyra DNA-baserna är fäst vid en av fyra olika fluorescerande färgämnen. När en nukleotid införlivas av DNA-polymeraset klyvs den fluorescerande taggen och diffunderar ut från observationsområdet för ZMW där dess fluorescens inte längre kan observeras. En detektor detekterar den fluorescerande signalen från nukleotidinkorporeringen och base call görs enligt färgämnets motsvarande fluorescens.[2]

Teknologi[redigera | redigera wikitext]

DNA-sekvenseringen görs på ett chipp som innehåller många ZMW. Inuti varje ZMW immobiliseras ett enda aktivt DNA-polymeras med en enda molekyl med enkelsträngad DNA-mall till botten genom vilken ljus kan tränga igenom och skapa en visualiseringskammare som möjliggör övervakning av aktiviteten hos DNA-polymeras på en enda molekylnivå. Signalen från en fosfobunden nukleotid inkorporerad av DNA-polymeras detekteras när DNA-syntesen fortskrider, vilket resulterar i sekvensering i realtid.

Fosfolinkad nukleotid[redigera | redigera wikitext]

Zero-Mode Waveguide[redigera | redigera wikitext]

Zero-mode waveguide (ZMW) är en nanofotonik inneslutningsstruktur som består av ett cirkulärt hål i en aluminiumbeklädnadsfilm avsatt på ett klart kiselsubstrat.[3]

ZMW-hålen är ~70 nm i diameter och ~100 nm i djupet. På grund av ljusets beteende när det färdas genom en liten bländare sönderfaller det optiska fältet exponentiellt inuti kammaren.[4]

Observationsvolymen i ett upplyst ZMW är ~20 zeptoliter (20 X 10−21 liter). Inom denna volym kan aktiviteten hos DNA-polymeras som innehåller en enda nukleotid lätt detekteras.[5]

Sekvenseringsprestanda[redigera | redigera wikitext]

Sekvenseringsprestanda kan mätas i läs längd, noggrannhet och total genomströmning per experiment. Pacific Biosciences (PacBio) sekvenseringssystem som använder ZMW har fördelen med långa läslängder, även om felfrekvensen är i storleksordningen 5-15 procent och provgenomströmningen är lägre än Illumina-sekvenseringsplattformar.[6]

Den 19 september 2018 släppte PacBio kemin Sequel 6.0 och synkroniserade kemiversionen med programvaruversionen. Prestanda kontrasteras för stora insatsbibliotek med hög molekylärt DNA (känd som high molecular weight (HMW)) jämfört med kortare insatsbibliotek under ~15 000 baser i längd. För större mallar är den genomsnittliga läslängden upp till 30 000 baser. För kortare infogade bibliotek är den genomsnittliga läslängden upp till 100 000 baser medan man läser samma molekyl i en cirkel. De senare kortare insatsbiblioteken ger sedan upp till 50 miljarder baser från en enda SMRT Cell.[7]

Historia[redigera | redigera wikitext]

PacBio kommersialiserade SMRT-sekvensering 2011,[8] efter att ha släppt en betaversion av sitt RS-instrument i slutet av 2010.[9]

RS och RS II[redigera | redigera wikitext]

SMRT-cell för en RS eller RS II sekvenseringsinstrument

Vid kommersialisering hade läslängden en normalfördelning med ett medelvärde på cirka 1100 baser. Ett nytt kemikit som släpptes i början av 2012 ökade läslängden; en tidig kund av den citerade kemin hade genomsnittliga läslängder på 2500 till 2900 baser.[10]

XL kemikittet som släpptes i slutet av 2012 ökade den genomsnittliga läslängden till mer än 4300 baser.[11][12]

Den 21 augusti 2013 släppte PacBio nytt Binding Kit P4. Detta P4-enzym har en genomsnittlig läslängd på mer än 4300 baser när det är parat med C2 sekvenseringskemi och mer än 5000 baser när det är parat med XL-kemin.[13] Enzymets noggrannhet liknar C2 och når QV50 mellan 30 och 40 gångers täckning. De resulterande P4-attributen gav sammansättningar av högre kvalitet med färre SMRT-celler och med förbättrad variant calling. I kombination med inmatad DNA-storleksval (med hjälp av ett elektroforesinstrument som BluePippin) ger den genomsnittliga läslängden över 7kb.[14]

Den 3 oktober 2013 släppte PacBio en ny reagenskombination för PacBio RS II, P5 DNA polymeras med C3 kemi (P5-C3). Tillsammans utökar de sekvenseringsläslängder till i genomsnitt cirka 8500 baser, med de längsta avläsningarna som överstiger 30 000 baser.[15] Genomströmningen per SMRT-cell är cirka 500 miljoner baser som visas genom sekvenseringsresultat från CHM1-cellinjen.[16]

Den 15 oktober 2014 tillkännagav PacBio lanseringen av ny kemi P6-C4 för RS II-systemet, som representerar företagets sjätte generation av polymeras och fjärde generationens kemi, förlänger ytterligare den genomsnittliga läslängden till 10 000–15 000 baser, med den längsta läslängden på mer än 40 000 baser. Genomströmningen med den nya kemin förväntades vara mellan 500 miljoner till 1 miljard baser per SMRT-cell, beroende på vilket prov som sekvenserades.[17][18] Detta var den slutliga versionen av kemi som släpptes för RS-instrumentet.

Genomströmning per experiment för tekniken påverkas både av den lästa längden på DNA molekyler som sekvenserats och av den totala multiplexen för en SMRT Cell. Prototypen av SMRT Cellen innehöll cirka 3000 ZMW-hål som möjliggjorde parallelliserad DNA-sekvensering. Vid kommersialisering mönstrades SMRT Cellerna var och en med 150 000 ZMW hål som lästes i två uppsättningar om 75,000 [19].

I april 2013 släppte PacBio en ny version av sekvenseringsinstrument som heter "PacBio RS II" som använder alla 150 000 ZMW hål samtidigt, vilket fördubblar genomströmningen per experiment.[20][21] Det högsta genomströmningsläget i november 2013 använde P5-bindning, C3 kemi, BluePippin storleksval och en PacBio RS II. Det gav officiellt 350 miljoner baser per SMRT-cell, även om en datamängd från Human de novo släpptes med kemin i genomsnitt 500 miljoner baser per SMRT-cell. Genomströmningen varierar beroende på vilken typ av prov som sekvenseras.  Med introduktionen av P6-C4 kemi ökade den typiska genomströmningen per SMRT-cell till 500 miljoner–1 miljard baser.[22]

RS-prestanda
C1 C2 P4-XL P5-C3 P6-C4
Genomsnittlig läslängd (base pairs) 1100 2500 - 2900 4300 - 5000 8500 10 000 - 15 000
Genomströmning per SMRT-cell 30M - 40M 60M - 100M 250M - 300M 350M - 500M 500M - 1B

Sequel[redigera | redigera wikitext]

SMRT-cell för Sequel sekvenseringsinstrument

I september 2015 tillkännagav PacBio lanseringen av ett nytt sekvenseringsinstrument, Sequel System, som ökade kapaciteten till 1 miljon ZMW hål. [23] [24] Med Sequel-instrumentet var de initiala läslängderna jämförbara med RS, sedan ökade kemiska utsläpp ökad läslängd.

Den 23 januari 2017 släpptes V2-kemin som ökade genomsnittliga läslängder till mellan 10 000-18 000 baser. [25]

Den 8 mars 2018 släpptes 2.1-kemin. Den ökade den genomsnittliga läslängden till 20 000 baser och hälften av alla läsningar över 30 000 baser i längd. Utbytet per SMRT-cell ökade till 10 eller 20 miljarder baser, för antingen stora eller respektive kortare insättningsbiblioteken (till exempel amplikon).[26]

Pipetterar spets i en 8M SMRT-cell

Den 19 september 2018 tillkännagav PacBio Sequel 6.0 kemin med genomsnittliga läslängder ökade till 100 000 baser för kortare infogbiblioteken och 30 000 för biblioteken med längre infog. SMRT-cellavkastningen ökade upp till 50 miljarder baser för kortare infogbiblioteken.[27]

Sequel Prestanda
V2 2.1 6.0
Genomsnittlig läslängd (base pairs) 10,000 - 18,000 20,000 - 30,000 30,000 - 100,000
Genomströmning per SMRT-cell 5B - 8B 10B - 20B 20B - 50B

8M-chipp[redigera | redigera wikitext]

I April 2019 släppte företaget en ny SMRT-cell med åtta miljoner ZMW,[28] vilket ökade den förväntade genomströmningen per SMRT-cell med en faktor åtta.[29] Tidiga åtkomstkunder i mars 2019 rapporterade genomströmning över 250 GB råavkastning per cell med mallar cirka 15 kB långa och 67,4 GB utbyte per cell med mallar i HMW.[30] Systemprestanda rapporteras nu i antingen HMW kontinuerliga långa läslängder eller i förkorrigerad HiFi (även känd som Circular Consensus Sequence (CCS)). För HMW-läsningar är ungefär hälften av alla läsningar längre än 50 kB i längd.

Sequel II High-Molecular-Weight Prestanda
Tidig tillgång 1.0 2.0
Genomströmning per SMRT-cell ~67.4 GB Upp till 160 GB Upp till 200 GB
Sequel II HiFi Corrected Read Prestanda
Tidig tillgång 1.0 2.0
Råa läsningar per SMRT-cell ~250 GB Upp till 360 GB Upp till 500 GB
Korrigerade läsningar per SMRT-cell (>Q20) ~25 GB Upp till 36 GB Upp till 50 GB

Ansökan[redigera | redigera wikitext]

SMRT-sekvensering kan vara tillämplig för ett brett spektrum av genomforskning.

Referenser[redigera | redigera wikitext]

  1. ^ ”Zero-Mode Waveguides for Single-Molecule Analysis at High Concentrations”. Science 299 (5607): sid. 682–6. 2003. doi:10.1126/science.1079700. PMID 12560545. Bibcode2003Sci...299..682L. 
  2. ^ ”Real-Time DNA Sequencing from Single Polymerase Molecules”. Science 323 (5910): sid. 133–8. 2009. doi:10.1126/science.1162986. PMID 19023044. Bibcode2009Sci...323..133E. 
  3. ^ ”Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nanostructures”. PNAS 105 (4): sid. 1176–81. 2008. doi:10.1073/pnas.0710982105. PMID 18216253. Bibcode2008PNAS..105.1176K. 
  4. ^ ”Improved fabrication of zero-mode waveguides for single-molecule detection”. J. Appl. Phys. 103 (3): sid. 034301–034301–9. 2008. doi:10.1063/1.2831366. Bibcode2008JAP...103c4301F. https://semanticscholar.org/paper/21118902c86e9f275a6c65da43824acfeb9a63dd. 
  5. ^ ”Pacific Biosciences Develops Transformative DNA Sequencing Technology”. Pacific Biosciences Technology Backgrounder. 2008. https://www.ndsu.edu/pubweb/~mcclean/plsc411/Pacific%20Biosciences-technology_backgrounder.pdf. 
  6. ^ Pollock, Jolinda; Glendinning, Laura; Wisedchanwet, Trong; Watson, Mick (2018). ”The Madness of Microbiome: Attempting To Find Consensus "Best Practice" for 16S Microbiome Studies”. Applied and Environmental Microbiology 84 (7): sid. e02627-17. doi:10.1128/AEM.02627-17. PMID 29427429. 
  7. ^ ”PacBio Announcement”. Twitter. 19 September 2018. https://twitter.com/PacBio/status/1042417439441645570. 
  8. ^ Karow J (3 May 2011). ”PacBio Ships First Two Commercial Systems; Order Backlog Grows to 44”. GenomeWeb. http://www.genomeweb.com/sequencing/pacbio-ships-first-two-commercial-systems-order-backlog-grows-44. 
  9. ^ Karow J (7 Dec 2010). ”PacBio Reveals Beta System Specs for RS; Says Commercial Release is on Track for First Half of 2011”. GenomeWeb. http://www.genomeweb.com/sequencing/pacbio-reveals-beta-system-specs-rs-says-commercial-release-track-first-half-201. 
  10. ^ Karow J (10 Jan 2012). ”After a Year of Testing, Two Early PacBio Customers Expect More Routine Use of RS Sequencer in 2012”. GenomeWeb. http://www.genomeweb.com/sequencing/after-year-testing-two-early-pacbio-customers-expect-more-routine-use-rs-sequenc. 
  11. ^ Heger M (13 Nov 2012). ”PacBio's XL Chemistry Increases Read Lengths and Throughput; CSHL Tests the Tech on Rice Genome”. GenomeWeb. http://www.genomeweb.com/sequencing/pacbios-xl-chemistry-increases-read-lengths-and-throughput-cshl-tests-tech-rice. 
  12. ^ Heger M (5 Mar 2013). ”PacBio Users Report Progress in Long Reads for Plant Genome Assembly, Tricky Regions of Human Genome”. GenomeWeb. http://www.genomeweb.com/sequencing/pacbio-users-report-progress-long-reads-plant-genome-assembly-tricky-regions-hum. 
  13. ^ ”New DNA Polymerase P4 Delivers Higher-Quality Assemblies Using Fewer SMRT Cells”. PacBio Blog. 21 Aug 2013. https://www.pacb.com/uncategorized/new-dna-polymerase-p4-delivers-higher/. 
  14. ^ ”Longing for the longest reads: PacBio and BluePippin”. In between lines of code. 19 Jun 2013. http://flxlexblog.wordpress.com/2013/06/19/longing-for-the-longest-reads-pacbio-and-bluepippin/. 
  15. ^ ”New Chemistry for PacBio RS II Provides Average 8.5 kb Read Lengths for Complex Genome Studies”. PacBio Blog. 3 Oct 2013. https://www.pacb.com/uncategorized/new-chemistry-for-pacbio-rs-ii-provides/. 
  16. ^ Resolving the complexity of the human genome using single-molecule sequencing. 2014. 
  17. ^ ”Pacific Biosciences Releases New DNA Sequencing Chemistry to Enhance Read Length and Accuracy for the Study of Human and Other Complex Genomes”. Pacific Biosciences. 15 Oct 2014. http://investor.pacificbiosciences.com/news-releases/news-release-details/pacific-biosciences-releases-new-dna-sequencing-chemistry. 
  18. ^ ”New Chemistry Boosts Average Read Length to 10 kb – 15 kb for PacBio® RS II”. PacBio Blog. 15 Oct 2014. https://www.pacb.com/blog/new-chemistry-boosts-average-read/. 
  19. ^ ”SMRT Cells, sequencing reagent kits, and accessories for the PacBio RS II”. Pacific Biosciences. 2020. http://www.pacificbiosciences.com/products/consumables/SMRT-cells/.  Arkiverad 21 april 2013 hämtat från the Wayback Machine. ”Arkiverade kopian”. Arkiverad från originalet den 21 april 2013. https://web.archive.org/web/20130421130113/http://www.pacificbiosciences.com/products/consumables/SMRT-cells/. Läst 17 september 2020. 
  20. ^ ”PacBio Launches PacBio RS II Sequencer”. Next Gen Seek. 11 Apr 2013. http://nextgenseek.com/2013/04/pacbio-launches-pacbio-rs-ii-sequencer/.  Arkiverad 19 december 2019 hämtat från the Wayback Machine. ”Arkiverade kopian”. Arkiverad från originalet den 19 december 2019. https://web.archive.org/web/20191219185400/http://nextgenseek.com/2013/04/pacbio-launches-pacbio-rs-ii-sequencer/. Läst 17 september 2020. 
  21. ^ ”New Products: PacBio's RS II; Cufflinks”. GenomeWeb. 16 Apr 2013. http://www.genomeweb.com/sequencing/new-products-pacbios-rs-ii-cufflinks. 
  22. ^ ”Duke Sequencing Post”. Twitter. 30 Aug 2013. https://twitter.com/DukeSequencing/status/373427511272538112. 
  23. ^ ”PacBio Announces Sequel Sequencing System”. Bio-IT World. 30 Sep 2015. http://www.bio-itworld.com/2015/9/30/pacbio-announces-sequel-sequencing-system.aspx.  Arkiverad 29 juli 2020 hämtat från the Wayback Machine. ”Arkiverade kopian”. Arkiverad från originalet den 29 juli 2020. https://web.archive.org/web/20200729220749/http://www.bio-itworld.com/2015/9/30/pacbio-announces-sequel-sequencing-system.aspx. Läst 17 september 2020. 
  24. ^ ”PacBio Launches Higher-Throughput, Lower-Cost Single-Molecule Sequencing System”. GenomeWeb. 1 Oct 2015. https://www.genomeweb.com/business-news/pacbio-launches-higher-throughput-lower-cost-single-molecule-sequencing-system. 
  25. ^ ”New Chemistry and Software for Sequel System Improve Read Length, Lower Project Costs”. PacBio Blog. 9 Jan 2017. https://www.pacb.com/blog/new-chemistry-software-sequel-system-improve-read-length-lower-project-costs/. 
  26. ^ ”New Software, Polymerase for Sequel System Boost Throughput and Affordability”. PacBio Blog. 7 Mar 2018. https://www.pacb.com/blog/new-software-polymerase-sequel-system-boost-throughput-affordability/. 
  27. ^ ”PacBio Post”. Twitter. 19 Sep 2018. https://twitter.com/PacBio/status/1042417439441645570. 
  28. ^ ”PacBio Launches Sequel II System”. Bio-IT World. 26 Apr 2019. https://www.bio-itworld.com/2019/04/26/pacbio-launches-sequel-ii-system.aspx. 
  29. ^ ”Arkiverade kopian”. Arkiverad från originalet den 24 september 2018. https://web.archive.org/web/20180924070931/http://investor.pacificbiosciences.com/static-files/e53d5ef9-02cd-42ab-9d86-3037ad9deaec. Läst 17 september 2020. 
  30. ^ ”PacBio Shares Early-Access Customer Experiences, New Applications for Sequel II”. GenomeWeb. 7 Mar 2019. https://www.genomeweb.com/sequencing/pacbio-shares-early-access-customer-experiences-new-applications-sequel-ii.