DNA Vil Være I Stand Til At Gemme Alle Oplysninger Om Menneskeheden - Alternativ Visning

DNA Vil Være I Stand Til At Gemme Alle Oplysninger Om Menneskeheden - Alternativ Visning
DNA Vil Være I Stand Til At Gemme Alle Oplysninger Om Menneskeheden - Alternativ Visning

Video: DNA Vil Være I Stand Til At Gemme Alle Oplysninger Om Menneskeheden - Alternativ Visning

Video: DNA Vil Være I Stand Til At Gemme Alle Oplysninger Om Menneskeheden - Alternativ Visning
Video: Web Programming - Computer Science for Business Leaders 2016 2024, Kan
Anonim

Menneskeheden har et enormt datalagringsproblem. I de sidste to år har folk skabt flere oplysninger end i al tidligere historie. Og denne informationsstrøm vil snart overgå kapaciteten på harddiske.

Forskerne siger, at de har fundet en ny måde at kode digital information i DNA. Et gram DNA kan lagre 215 petabyte (215 millioner gigabyte) data. Således vil al information, der nogensinde er oprettet af en person, optage en container på størrelse med et par lastbiler.

DNA har mange fordele ved lagring af digital information. Det er ultrakompakt og kan opbevares i tusinder af år et køligt, tørt sted. Og folk vil altid være i stand til at dechifrere det. "DNA nedbrydes ikke over tid som kassetter eller diske, og det bliver ikke forældet," siger Yaniv Ehrlich, en videnskabsmand ved Columbia University (USA).

Image
Image

Forskere har bevaret digital information i DNA siden 2012, da genetikere ved Harvard University (USA) George Church, Sree Kosuri og deres kolleger kodede en bog på 52 tusind ord i tusinder af DNA-fragmenter ved hjælp af tråde fra alfabetet med fire bogstaver - A, G, T og C for at kode nuller og nøgler i den digitaliserede fil.

Dette krypteringssystem var relativt ineffektivt og kunne kun lagre 1,28 petabyte pr. Gram DNA. Andre tilgange har fungeret bedre. Men ingen tillod DNA at beholde mere end halvdelen af sin maksimale kapacitet. DNA kan opretholde ca. 1,8 bits pr. DNA-nukleotid (antallet når ikke 2 bits på grund af sjældne, men uundgåelige læse- og skrivefejl).

Ehrlich besluttede, at han ville komme tættere på denne grænse. Derfor vendte han og Dina Zilinski sig til algoritmerne, der blev brugt til at kryptere og dekryptere information. De startede med 6 filer, som omfattede et komplet computeroperativsystem, en computervirus, en fransk film fra 1895 kaldet Arrival of a Train at La Ciotat og en undersøgelse fra 1948 af teoretikeren Claude Shannon. For det første konverterede forskerne filerne til binære strenge med en og nuller, komprimerede dem til en basisfil og delte derefter dataene i korte strenge med binær kode. De udviklede en algoritme kaldet "Fountain of DNA", som tilfældigt pakker kæder i såkaldte "blobs". Forskerne tilføjede yderligere tags til disse, så de kunne genopbygges senere i den rigtige rækkefølge. I alt har forskere genereret en digital liste med 72 tusind DNA-tråde,hver 200 tegn lange.

Salgsfremmende video:

De sendte dem som tekstfiler til Twist Bioscience-opstarten i Californien, hvor de syntetiserede DNA-tråde. To uger senere modtog Ehrlich og Zilinski en ampul med et stykke DNA i posten, hvor deres filer blev krypteret. For at dechifrere dem brugte forskere moderne DNA-sekventeringsteknologi. Sekvenserne blev sendt til en computer, som oversatte den genetiske kode tilbage til binære og brugte tags til at samle de seks originale filer igen. Teknologien fungerede så godt, at de nye filer var fri for fejl.

Kosuri og Ehrlich bemærkede imidlertid, at den nye tilgang ikke er klar til brug i stor skala. De brugte 7 tusind dollars på at syntetisere 2 megabyte information i filer og yderligere 2 tusind dollars på at læse den. Sammenlignet med andre former for datalagring er skrivning og læsning fra DNA relativt langsom.

Anbefalet: