В скором времени все человечество начнет генерировать цифровые данные в таких объемах, что они уже не смогут уместиться на имеющихся жестких дисках, магнитных лентах и прочих носителях информации. Именно поэтому ученые постоянно занимаются поисками новых методов хранения больших объемов данных, и наиболее перспективным методом является хранение информации, закодированной в виде последовательности молекул синтетической ДНК. А исследователи из Колумбийского университета и нью-йоркского Центра Генома (New York Genome Center, NYGC) продемонстрировали, что немного видоизмененный алгоритм, изначально предназначенный для сжатия видео для мобильных телефонов, может полностью раскрыть «информационный потенциал» молекул ДНК, позволяя сжать большее количество информации и упаковать ее в виде последовательности четырех базовых оснований ДНК.
Как уже неоднократно упоминалось на страницах нашего сайта, молекулы ДНК являются идеальным носителем информации из-за того, что они чрезвычайно компактны и могут сохраняться в целости и сохранности в течение очень долгого времени. В пользу последнего утверждения говорит тот факт, что недавно ученым удалось восстановить полный геном, используя генетический материал найденных в одной из пещер в Испании костей далекого предка человека, который жил около 430 тысяч лет назад.
Для кодирования в виде последовательности молекулы ДНК ученые отобрали несколько файлов различного типа, полный код компьютерной операционной системы, короткометражный французский фильм 1895 года, изображение подарочной карты Amazon, снимок послания человечества, отправленного на борту космического аппарата Pioneer и текст одной из научных работ Клода Шеннона (Claude Shannon).
Все эти файлы были упакованы в один большой файл, который был разрезан на множество коротких файлов. При помощи специализированного алгоритма эти короткие участки были перемешаны случайным образом, к ним была добавлена информация для обратного преобразования и, в конце концов, набор двоичных данных был сжат и преобразован в код, соответствующий последовательности всех четырех оснований ДНК.
В результате этого получился внушительный список из 72 000 нитей ДНК, каждая из которых состояла из 200 пар оснований. Эти данные были отправлены компании Twist Bioscience, специалисты которой и выполнили синтез искусственной ДНК, вернувшейся к исследованиям внутри пробирки спустя две недели. Для восстановления исходной информации ученые использовали обычную технологию считывания последовательности, секвенирования. Восстановленные файлы не содержали ни единой ошибки, а восстановленную операционную систему удалось установить на компьютер без малейших проблем.
Более того, при помощи некоторых известных методов ученые скопировали исходную ДНК и сняли копии со сделанных копий. И даже в последнем случае информация, зашифрованная в ДНК, была восстановлена без ошибок.
И наконец, ученые продемонстрировали, что примененный ими метод сжатия позволяет упаковать 215 петабайт данных в молекулы ДНК, суммарный вес которых составляет 1 грамм. Это почти в 100 раз больше, чем это позволяют сделать другие методы, разработанные другими исследовательскими группами. «Мы полагаем, что нам удалось создать устройство хранения данных, имеющее самое высокое значение показателя плотности хранения информации» — пишут исследователи.
По поводу плотности, максимальная информационная емкость одного основания ДНК составляет два двоичных разряда. Однако, потребность включения в ДНК добавочной информации, необходимой для восстановления информации, понижает информационную емкость одного основания до 1.6 разряда. Но в любом случае, это на 60 процентов больше, чем было достигнуто при помощи других методов, и очень близко к теоретическому верхнему пределу в 1.8 бита на основание.
Непреодолимым препятствием к практическому применению ДНК в качестве носителя информации является высокая стоимость всего этого. Исследователи потратили около 7 тысяч долларов на синтез ДНК и еще 2 тысячи на то, чтобы считать записанную информацию. Следует отметить, что стоимость процесса считывания последовательности ДНК за последние годы снизилась в несколько раз, чего не скажешь о процессах синтеза искусственной ДНК. Тем не менее, тенденция снижения стоимости по мере появления новых технологий будет оставаться неизменной и есть надежда на то, что технологии хранения информации ДНК станут доступные не только «избранным», но и более широкому ряду людей, нуждающихся в этом.
Источник: