DNA-sekvensering är i huvudsak en annan term för att "avläsa dubbelhelixen i DNA:t" eller att fastställa sekvensen av dess nukleotider eller baser. Nukleotider består av fyra kemiska baser: adenin (A), tymin (T), cytosin (C) och guanin (G). Dessa baser bildar alltid samma baspar i DNA:ts dubbelhelix: A parar alltid ihop med T, och C parar alltid ihop med G. Denna sammanparning är viktig för många processer i cellen, inklusive kopiering av DNA-molekylerna under celldelningen. Det är också väsentligt i DNA-sekvensering.

Med runt tre miljarder par av mänskligt DNA, sekvenserades det mänskliga genomet som en del av det så kallade HUGO-projektet (the Humane Genome Project, HGP), ett samarbetsprojekt som involverade ett internationellt forskarteam. De sekvenseringstekniker som utvecklades för att genomföra projektet möjliggjorde inte bara sekvenseringen av merparten av människans arvsmassa, de identifierade och kartlade också de flesta av generna i det mänskliga genomet.

Bakomliggande historia och olika typer av DNA-sekvensering

Allan Maxam och Walter Gilbert utvecklade den första allmänt antagna metoden för DNA-sekvensering 1973. Frederick Sanger och hans kollegor utvecklade under 1977 en alternativ metod, känd som Sanger-sekvensering eller dideoxi-metoden, som orsakar stopp i DNA-syntesen.

Inledningsvis var metoden utvecklad av teamet Maxam-Gilbert den mer populära metoden, då renat DNA kunde användas direkt – medan Sanger-metoden krävde kloning för att producera enkelsträngat DNA före sekvensering. Maxam-Gilbert-metoden hade emellertid ett antal nackdelar, bland annat svårigheter att använda den storskaligt, hög komplexitet samt användning av farliga kemikalier som utsatte forskare som använde den för risker.

Dessa nackdelar, i kombination med förbättringen av Sanger-sekvenseringen, säkerställde att Sangers dideoxi-metod blev den mest populära av den första generationens sekvenseringsmetoder. Den förblev allmänt använd under årtionden med vissa modifieringar.

I mitten av 2000-talet dök det upp en ny typ av DNA-sekvenseringsteknik, känd som next generation sequencing (NGS). Den möjliggjorde sekvenseringen av flera DNA-molekyler parallellt och ökade dramatiskt DNA-sekvenseringens hastighet.

Exempelvis pyrosekvensering, eller 454-sekvensering som den ibland kallas, lanserades 2005 och medförde enorma framsteg avseende mindre arbetskrävande och snabbare DNA-sekvensering. Forskarna använde den här tekniken för att sekvensera arvsmassan hos den berömde forskaren James Watson på bara två månader. Däremot tog HUGO-projektet (HGP), som slutfördes 2003, runt 15 år.

Sekvenseringens ökade hastighet och effektivitet har i sin tur resulterat i mycket lägre sekvenseringskostnader och analys av stora mängder DNA. Medan kostnaden för HGP var 3 miljarder USD, kunde forskarna sekvensera Watsons arvsmassa för mindre än 1 miljon USD. Idag har dessa kostnader sjunkit till runt 1 000 USD per genom.

Ett antal parallella sekvenseringstekniker har utvecklats efter 454-sekvenseringen. Medan Sanger-sekvensering fortfarande används relativt ofta för projekt i mindre skala som fokuserar på sekvensering av enskilda DNA-segment, sekvenseras genom idag vanligtvis med hjälp av dessa snabbare och mindre kostsamma parallella sekvenseringsmetoder. Och nya sekvenseringsmetoder dyker regelbundet upp allteftersom sekvenseringsteknikerna för DNA:t fortsätter att utvecklas.

Vad kan DNA-sekvenseringen berätta för oss?

Trots att DNA-sekvenseringstekniken endast är ungefär fyra årtionden är dess inverkan på medicinska, vetenskapliga och forskningsområden djupgående. Implikationerna av DNA-sekvensering är stora och lovande, med stor potential för allt från att lära mer om din historia till diagnostiska och terapeutiska tillämpningar.

Utmaningen med NGS-tekniker kommer att bli att analysera de riktigt stora mängder data som kommer att finnas tillgängliga under de kommande åren då dessa DNA-sekvenseringstekniker blir allt snabbare och effektivare, vilket genererar allt större mängder data.