DNA Som En Flash-enhet: Varför Skriva Digitala Data I Genomet - Alternativ Vy

Innehållsförteckning:

DNA Som En Flash-enhet: Varför Skriva Digitala Data I Genomet - Alternativ Vy
DNA Som En Flash-enhet: Varför Skriva Digitala Data I Genomet - Alternativ Vy

Video: DNA Som En Flash-enhet: Varför Skriva Digitala Data I Genomet - Alternativ Vy

Video: DNA Som En Flash-enhet: Varför Skriva Digitala Data I Genomet - Alternativ Vy
Video: Genome 2024, Maj
Anonim

Tillväxten i volym digital information uppmanar forskare att leta efter mer kompakta sätt att spela in och lagra den. Och vad kan vara mer kompakt än DNA? RIA Novosti, tillsammans med en expert, räknade ut hur man kodar ord med nukleotider och hur mycket data en molekyl innehåller.

Reasons-koder

DNA är en sekvens av nukleotider. Det finns bara fyra av dem: adenin, guanin, tymin, cytosin. För att koda information tilldelas var och en av dem en sifferkod. Till exempel tymin - 0, guanin - 1, adenin - 2, cytosin - 3. Kodning börjar med det faktum att alla bokstäver, siffror och bilder konverteras till en binär kod, det vill säga en sekvens av nollor och en, och de har redan konverterats till en sekvens av nukleotider, det vill säga en kvartärkod.

Innan du kodar data till DNA måste du översätta dem till en digital kod / Illustration av RIA Novosti. Alina Polyanina
Innan du kodar data till DNA måste du översätta dem till en digital kod / Illustration av RIA Novosti. Alina Polyanina

Innan du kodar data till DNA måste du översätta dem till en digital kod / Illustration av RIA Novosti. Alina Polyanina.

Endast tre nukleotider kan användas för att bygga en kod (ternär kod), och den fjärde är att bryta sekvenser i delar. Det finns ett alternativ med konstruktion av baser i form av en binär kod, när två av dem motsvarar noll och två motsvarar en.

Flera tekniker används för att läsa. En av de vanligaste är att en kedja av DNA-molekyler kopieras med baser, var och en har en färgmärkning. Sedan läser en mycket känslig detektor data, och datorn använder färgerna för att rekonstruera nukleotidsekvensen.

”DNA-molekylen är mycket rymlig. Även i bakterier innehåller den vanligtvis ungefär en miljon baser och hos människor så många som tre miljarder. Det vill säga att varje mänsklig cell har en volym av information som är jämförbar med kapaciteten för en flash-enhet. Och vi har biljoner sådana celler. En enorm mängd data kan registreras i DNA, men att skriva och läsa från ett sådant medium är fortfarande för långsamt och kostsamt, säger Alexander Panchin, Ph. D., seniorforskare vid Institutet för informationsöverföringsproblem uppkallat efter A. A. Kharkevich, Ryska vetenskapsakademin.

Kampanjvideo:

Inspelningsdensiteten växer

I juni 1999 publicerade tidskriften Nature en artikel av amerikanska forskare som utvecklade en teknik för att skicka hemliga meddelanden med DNA. De syntetiserade en molekyl genom att införliva en nukleotidsekvens bildad med användning av en kvartär kod. Det hemliga DNA i blandningen skickades till ett annat laboratorium. Dess anställda, med särskilda kemiska nycklar, hittade den önskade molekylen och extraherade information från den.

”I allmänhet finns det två sätt att registrera data om DNA. Den första är när du syntetiserar helt nytt DNA med hjälp av en kemisk synthesizer. På datorns kommando läggs nukleotider till lösningen i en viss ordning, och den erforderliga baskedjan "växer gradvis". I det andra fallet kodas data i en organisms redan befintliga DNA, förklarar Panchin.

I maj 2010 publicerade gruppen av Craig Venter, som först kartlade det mänskliga genomet, ett papper om skapandet av en konstgjord bakterie. De tog en bakteriecell renad från genomet som bas och placerade den bildade bassekvensen där. Resultatet är en ny bakterie, ganska aktiv och levande, som skiljer sig från den vanliga endast genom att dess DNA skapades för hand. Dessutom visade teamet en känsla av skönhet genom att skriva sina namn och citat från klassiker med hjälp av en kvartärkod i bakterie-DNA.

År 2012 tog en grupp under ledning av molekylärbiolog George Church en mer grundlig inställning och DNA-kodade en 52 000 ord bok Regenesis: How Synthetic Biology Will Reinvent Nature and Ourselves, flera bilder och ett Java-program. De använde binär kod. Den totala datamängden var 658 kilobyte. Informationstätheten visade sig vara nästan 1018 byte per gram molekyler. Som jämförelse väger en 1012-byte hårddisk cirka hundra gram. Den största nackdelen med denna metod är instabiliteten hos den inspelade informationen.

”DNA-molekylen tenderar att muteras, vilket minskar tillförlitligheten för datalagring. Speciellt om bäraren av DNA är en levande cell som kan delas: när DNA dupliceras kryper fel in särskilt ofta. Tillförlitligheten för datalagring ökar om du har tusentals kopior av samma meddelande. Eller bara lagra DNA, säg, i frysen. Vid låga temperaturer minskar molekylens förmåga att mutera avsevärt, förklarar experten.

Dessutom går information ibland förlorad vid läsning. Fel kan vara av kemisk karaktär när en felaktig bas är ansluten till ett element eller rent beräknat, det vill säga beroende på datorn.

Dyrt, pålitligt

I mars 2017 publicerade Science en artikel av amerikanska forskare som lyckades skriva 2 * 1017 byte per gram DNA. Biologer betonar att de inte har tappat en enda byte. Enkelt uttryckt, vad vi spelade in är vad vi fick vid utgången.

För en vanlig användare är en "genetisk flash-enhet" ännu inte tillgänglig, eftersom det är mycket dyrt att lagra information på den och läs- / skrivhastigheten är låg. Forskare uppskattar att läsning av bara en megabyte kräver cirka tre och ett halvt tusen dollar och flera timmars tid.

De tveklösa fördelarna med att registrera information om DNA inkluderar den enorma datalagringstätheten, liksom stabiliteten hos bäraren - om än bara vid låga temperaturer.

Rekommenderas: