Sekvenovanie novej generácie - popis metódy

Obrovským potenciálom v analýze genómov a tým aj v možnostiach detekcie genetickej variability disponujú najnovšie vysokovýkonné technológie sekvenovania, ktoré umožňujú paralelizovať sekvenačný proces a získať rádovo tisíce až milióny sekvencií naraz. Tieto metódy, súhrnne nazývané „sekvenovanie novej generácie“ (Next Generation Seguencing, NGS), zahŕňajú rôzne technologické riešenia, reprezentované niekoľkými firmami. V rámci techník sekvenovania „druhej“ generácie sa analyzovaná DNA vo väčšine prípadov najskôr fragmentuje (vytvorí sa tzv. DNA knižnica), na fragmenty sa pripoja krátke sekvencie – adaptéry a následne sa rôznymi prístupmi tieto fragmenty amplifikujú a stanovuje sa ich sekvencia. Napokon sa sekvencia všetkých fragmentov vďaka čiastočnému prekrývaniu zoradí do plynulej sekvencie, ktorá zodpovedá pôvodnej nefragmentovanej DNA. 

Jednou z využívaných technológií je pyrosekvenovanie, založené na princípe syntézy komplementárneho vlákna DNA (podobne ako pri „klasickom“ Sangerovom sekvenovaní „prvej“ generácie), avšak využíva iný spôsob tvorby signálu v priebehu reakcie. Pri zabudovaní nukleotidu počas syntézy komplementárneho vlákna prebehne niekoľko chemických reakcií, pričom sa emituje svetelný signál. Postupne sa cyklicky pridávajú jednotlivé nukleotidy (deoxyribonukleozidtrifosfáty, dNTP) a detektorom sa sleduje svetelný signál po inkorporácii každého nukleotidu. Výrazné zvýšenie výkonu pyrosekvenovania priniesla modifikácia s emulznou PCR a „PicoTiterPlate“, kde amplifikácia DNA (PCR) prebieha v emulznej mikročastici a následne pyrosekvenovanie na špeciálnej platničke s jamkami. Po fragmentácii sekvenovanej DNA sa jednotlivé fragmenty naviažu na mikročastice a pretrepú sa v zmesi oleja a roztoku, ktorý obsahuje všetky reagenty pre PCR. Okolo každej častice sa tak vytvorí vlastný mikroreaktor, v ktorom bude prebiehať PCR pre konkrétny fragment DNA. Po PCR sa mikročastice prenesú na platničku, pričom sa do každej jamky sa zmestí iba jedna mikročastica a reakčné komponenty pyrosekvenačnej reakcie. Uvedenú technológiu - 454 pyrosekvenovanie (http://www.454.com) zaviedla firma Roche ako prvý komerčne úspešný NGS systém v roku 2005. Z jedného sekvenovania možno získať informácie o sekvencii niekoľko stotisíc až milión fragmentov s dĺžkou asi 700 nukleotidov, čo predstavuje 700 Mb, ktoré je však potrebné softvérovo spojiť na základe prekrývania sekvencií. Výhodou tohto systému v porovnaní s inými technológiami je rýchlosť sekvenovania (do 24 hodín) a dĺžka čítaných fragmentov, nevýhodu predstavuje ťažšie rozlíšenie homopolymérnych sekvencií (dlhších ako 6 bp) a vysoká cena reagentov. 

Inú technológiu predstavila Illumina (http://www.illumina.com). Amplifikácia fragmentov DNA prebieha za vzniku klastrov PCR produktov na sklíčku (tzv. mostíková PCR), následne sa syntetizujú komplementárne vlákna v každom klastri s využitím fluorescenčne označených a chemicky upravených nukleotidov. Podľa fluorescencie (každý nukleotid emituje inú vlnovú dĺžku fluorescencie) systém vyhodnotí typ zabudovaného nukleotidu. Tento systém sekvenuje kratšie fragmenty s dĺžkou 36-150 nukleotidov, paralelne je však schopný prečítať až 6 miliárd klastrov, čo pri najvýkonnejších prístrojoch spolu predstavuje až 1500 Gb (za cca 3,5 dňa). Vysoký výkon spolu s nižšími nákladmi na sekvenovanie poskytujú hlavné výhody tejto technológie. Nevýhodou je dĺžka čítaných fragmentov a tým ťažšie „poskladanie“ sekvencie na základe prekrývania. 

K vysoko výkonným metódam sekvenovania možno tiež zaradiť metódu SOLiD (Sequencing by Oligonucleotide Ligation and Detection), vyvinutú Applied Biosystems, v súčasnosti pod Thermo Fisher Scientific (http://www.thermofisher.com). Táto technológia je založená na amplifikácii DNA emulznou PCR a následnej ligácii oligonukleotidov. Sekvenovanie amplifikovaných fragmentov v dĺžke 35-75 nukleotidov prebieha v 5 - 7 cykloch, počas ktorých sa fluorescenčne označené oktaméry pripájajú k tvoriacemu sa reťazcu. Prvé tri pozície na oktaméri sú degenerované (môžu sa naviazať na ktorúkoľvek bázu), na ďalších pozíciách sú dve konkrétne bázy, posledné tri pozície sú univerzálne a nesú fluorescenčné značenie. Systém je schopný získať sekvenciu viac ako 20 Gb za deň; ľudský genóm pri pokrytí 4-5x je možné osekvenovať za 7 dní. Metóda sa vyznačuje vysokou presnosťou (99,99 %), ktorá predstavuje hlavnú prednosť tejto technológie. Vzhľadom na dĺžku čítaných fragmentov je problematickejšie „poskladať“ sekvenciu na základe prekrývania, výsledky sú tiež ťažšie porovnateľné s ostatnými sekvenátormi. 

V roku 2010 bola predstavená metóda sekvenovania, založená na detekcii vodíkového iónu (protónu H+), ktorý sa uvoľňuje pri zabudovaní nukleotidu do reťazca DNA pri jeho syntéze. Uvedenú technológiu „polovodičového iónového sekvenovania“ (Ion Semiconductor Sequencing) zaviedla firma Ion Torrent, v súčasnosti pod Thermo Fisher Scientific (http://www.thermofisher.com). Pri tejto metóde sa nepoužívajú modifikované nukleotidy či terminátory reakcie ani fluorescenčný spôsob detekcie. Analyzovaná DNA sa najskôr fragmentuje a fragmenty sa amplifikujú emulznou PCR. Získavanie sekvencie následne prebieha v jamkách na polovodičovom čipe typu CMOS (Complementary Metal-Oxide-Semiconductor), ktorý sa v súčasnosti bežne využíva v elektrotechnickom priemysle (napr. pri výrobe mikroprocesorov alebo digitálnych fotoaparátov). Postupne sa na čip cyklicky pridávajú jednotlivé dNTP. Pokiaľ sa nukleotid zaradí do syntetizovaného komplementárneho vlákna a uvoľní sa vodíkový ión, senzor zaznamená zmenu pH a prevedie ju do digitálnej podoby. Systém analyzuje fragmenty s dĺžkou asi 200 nukleotidov s výkonom do 10 Gb, pričom proces sekvenovania trvá do 4 hodín. Vysoká rýchlosť, nízke náklady na prevádzku, malá veľkosť prístroja a perspektívy pre progres predstavujú hlavné výhody tejto technológie. Na druhej strane táto metóda má vyššiu chybovosť pri sekvenovaní homopolymérnych úsekov. 

V poslednom období sa objavili nové technológie sekvenovania „tretej“ generácie, ktoré pred samotným sekvenovaním nevyužívajú amplifikáciu pomocou PCR a signál získavania sekvencie sa zachytáva v reálnom čase. Jedna z nich, „sekvenovanie molekúl DNA v reálnom čase“ (Single Molecule Real-Time Sequencing, SMRT) bola vyvinutá firmou Pacific Biosciences (http://www.pacificbiosciences.com). Fragmenty DNA pre sekvenovanie s dĺžkou viac ako 10 kb sú najskôr upravené do topologicky kružnicovej podoby a následne naviazané na modifikovaný enzým DNA-polymerázu. Samotné SMRT sekvenovanie prebieha v jamkách (Zero-Mode Waveguides, ZMWs) s priemerom niekoľko desiatok nanometrov, kde sú jednotlivé vlákna s DNA-polymerázou zachytené. Do jamiek sa pridá zmes rôzne fluorescenčne označených nukleotidov. Počas reakcie enzým začleňuje jednotlivé nukleotidy do syntetizujúceho sa vlákna na základe komplementarity, pričom odštiepi fluorescenčné farbivo. Vďaka usporiadaniu v ZMWs systém zaznamená dlhší fluorescenčný signál v oblasti inkorporácie nukleotidu a na základe typu fluorescencie vyhodnotí konkrétny typ nukleotidu. Uvedená technológia má oproti metódam „sekvenovania druhej generácie“ viaceré prednosti: príprava vzoriek je rýchla (do 6 hodín), nie je potrebné realizovať amplifikačný krok (PCR), proces sekvenovania je krátky (1 deň), čítané fragmenty sú oveľa dlhšie. Istú nevýhodu metódy predstavuje nižšia výkonnosť, metóda však môže byť dobre aplikovateľná pri epigenetických analýzach. 

Inú technológiu v rámci sekvenovania „tretej“ generácie predstavuje sekvenovanie v nanopóroch (Nanopore Sequencing), ktoré vyvinula Oxford Nanopore Technologies (http://www.nanoporetech.com). Nanopóry sa v biologických systémoch vyskytujú v iónových kanáloch, tvorených špecifickými proteínmi, ktoré, umiestnené v membránach, zabezpečujú transport, resp. výmenu iónov. Táto technológia využíva poznatok, že prechod častice cez kanál mení tok iónov a tým elektrické napätie v rámci kanála. Sekvenovanie prebieha na čipe, obsahujúcom množstvo mikrojamiek, z ktorých každá je prekrytá membránou s modifikovaným proteínovým nanopórom a vybavená senzorom. Táto technológia je vo vývoji a je snaha nielen o jej komerčné využitie, ale aj o jej zdokonalenie, napríklad nahradenie proteínov syntetickými materiálmi.