Genetinių duomenų saugojimas artinasi prie kritinio taško, auga sparčiau už Youtube  (7)

Viena iš didžiųjų duomenų problemų yra surasti pakankamai vietos svaiginamais tempais mokslininkų, tyrėjų, vyriausybių ir privačių bendrovių kasdien kuriamiems informacijos kiekiams.

Viena iš didžiųjų duomenų problemų yra surasti pakankamai vietos svaiginamais tempais mokslininkų, tyrėjų, vyriausybių ir privačių bendrovių kasdien kuriamiems informacijos kiekiams.

Reikalas tas, kad šią užduotį mes vis sunkiname, kadangi kuriame ir įrašome daugiau duomenų, nei kada nors anksčiau. 2013 m. tyrimas parodė, kad 90 procentų visų pasaulio duomenų buvo sugeneruota per praėjusius porą metų, o tai teikia didžiulius logistinius iššūkius tiems, kurių užsiėmimas yra užtikrinti, kad ši plūstanti informacija tinkamai išsaugoma dabartiniams ir būsimiems tikslams.

Taigi, kas generuoja neišpasakytai didelius informacijos kiekius? Jei spėjate, kad YouTube, esate teisus. Kiekvieną minutę į šią tarnybą žmonės sukelia ~300 valandų vaizdo medžiagos, ir per metus sukuria apie 100 petabaitų informacijos (t.y. 100 000 terabaitų, jei padės). Laimei, Google šlamančiųjų netrūksta, tad veikiausiai turi išteklių susidorojimui su tokiu antplūdžiu.

Bet kitose srityse duomenų kūrėjai gali nebūti taip gerai pasirengę. Nauja JAV Cold Spring Harbor laboratorijos tyrėjų studija rodo, kad sparčiausiai pasaulyje auganti duomenų generavimo sritis, kurios kasdien sukuriamų duomenų kiekis dabar dvigubėja maždaug kas 7 mėnesius, yra genomo tyrimai.

PLOS Biology, publikuotame tyrime spėjama, kad iki 2025 m., genomo tyrėjai gerokai aplenks YouTube ir Twitter, bei dabartinius mokslo duomenų karalius: astronomiją ir fiziką. Po 10 metų, genetiniai tyrimai kasmet sukurs nuo 2 iki 40 eksabaitų informacijos, priklausomai nuo to, kaip vystysis dvigubėjimo tempas. (Vis dar skaitantiems – 1 eksabaitą su daro 1000 petabaitų.)

„Labai ilgai žmonės, kalbėdami apie išties didžiulius, milžiniškus dalykus, naudojo žodį „astronominis“,pranešime spaudai sakė Michaelas Schatzas, tyrimo bendraautorius. „Bet nurodydami neįtikėtiną duomenų kūrimo augimo tempą biologijos moksluose, mes su kolegomis siūlome jau netolimoje ateityje pradėti išties neaprėpiamai didelių dalykui apibūdinimui naudoti epitetą „genominis“.“

Tyrėjai sako, kad su dabartiniu genominių duomenų lygiu, maždaug 25 PB, susitvarkyt nesunku, bet nereikia pamiršti, kad santykinai nedaug žmonių savo genomus yra nuskaitę. Tačiau yra ženklų, rodančių, kad tai pasikeis, ir tikimasi, kad visą savo genomą per ateinantį dešimtmetį nuskaitys 1 milijardas žmonių, daugiausia turtingose šalyse.

Nors panašiu metu iš genetinių tyrimų tikimasi sulaukti didžiulės medicininės naudos, panašu, problemos duomenų mokslininkams tik prasideda.

„Genomų tyrimai yra visiškai žaidimo taisykles keičiantis mokslas,” sakė Schatzas. „Su kolegomis sakome, kad svarbu galvoti apie ateitį, kad būtume jai pasiruošę.”


Peter Dockrill
www.sciencealert.com

Aut. teisės: Input.lt
Input.lt

(25)
(0)
(25)

Komentarai (7)

Visi šio ciklo įrašai