В 2024 году было создано, захвачено, скопировано или потреблено как минимум 149 зетабайт данных, и ожидается, что это число более чем удвоится к 2028 году, согласно данным Statista.
Для решения проблемы экспоненциального роста информации ученые по всему миру стремятся найти более эффективные и устойчивые решения для хранения данных.
Обнадеживающая идея приходит из биологии: использование ДНК, молекулы, которая несет генетические инструкции для всех живых существ, как модели для разработки революционной технологии хранения.
Недавнее исследование, опубликованное в журнале Nature, представило новый подход, основанный на эпигенетике, который обещает записывать информацию быстрее, экономичнее и стабильнее, чем традиционные методы.
ДНК известна своей огромной способностью хранить данные компактно и долговечно: один грамм этой молекулы может содержать до одного триллиона гигабайт информации, оставаясь нетронутым на протяжении тысяч лет при соблюдении надлежащих условий.
Идея использовать ДНК в качестве цифрового хранилища была предложена впервые в 1950-х годах физиком Ричардом Фейнманом.
Спустя десятилетия, в 2012 году команда генетика Джорджа Чёрча из Гарвардского университета успешно закодировала книгу из 53 400 слов в ДНК, доказав жизнеспособность концепции.
Тем не менее, использованный метод, известный как синтез de novo, добавляет нуклеотиды — буквы ДНК: аденин (A), тимин (T), гуанин (G) и цитозин (C) — по одному для создания последовательностей, представляющих двоичные данные (0 и 1).
Этот процесс дорогой, медленный и подверженный ошибкам, что ограничивает его применение в крупномасштабных проектах: только 1 бит (или одна восьмая байта) может быть добавлен к последовательности на один нуклеотид.
Важно отметить, что технология не использует ДНК человека для хранения, а вместо этого использует молекулы, произведенные в лаборатории, специально разработанные для этой цели.
Чтобы преодолеть ограничения синтеза de novo, команда исследователей из Китая, Германии и Соединенных Штатов разработала инновационный метод, использующий эпигенетику — область науки, изучающую химические модификации ДНК, которые не изменяют ее последовательность, но влияют на ее функциональность.
Система, созданная учеными, записывает данные с помощью процесса, называемого метилированием — добавления небольших химических групп, называемых метилами, к определенным нуклеотидам ДНК. Эти изменения, известные как эпи-биты, представляют собой 0 и 1 двоичного кода.
Для этого исследователи использовали универсальные шаблоны ДНК и дополнительные фрагменты, называемые подвижными типами — которые функционируют как типографические элементы, которые подходят к шаблонам, позволяя точно записывать данные.
Фермент DNMT1, который естественным образом выполняет метилирование ДНК в живых организмах, был адаптирован для программной печати метилирования, превращая ДНК в своего рода «данные ленты».
В экспериментах ученые смогли записать около 350 бит на реакцию — значительно больше, чем один бит с использованием техники синтеза de novo.
Кроме того, эта технология способна записывать данные параллельно, то есть несколько точек ДНК могут быть модифицированы одновременно. Это контрастирует с традиционным методом, который записывает данные последовательно, что делает процесс более медленным.
Данные были извлечены с высокой точностью с помощью нано-порового секвенирования, технологии, способной обнаруживать химические изменения в ДНК и переводить шаблоны метилирования в цифровую информацию.
Кроме того, ученые продемонстрировали, что эпи-биты оставались стабильными даже в неблагоприятных условиях, таких как нагревание.
В тесте под названием iDNAdrive 60 добровольцев без лабораторного опыта успешно использовали систему для записи данных, что доказывает, что техника доступна и может быть применена в децентрализованных условиях.
Тем не менее, несмотря на достижения, существуют барьеры для широкого применения технологии на основе эпигенетики.
Одной из них является необходимость улучшения алгоритмов, которые обнаруживают шаблоны метилирования, увеличивая точность и эффективность процесса. Другой проблемой является первоначальная стоимость необходимого оборудования, такого как платформы для секвенирования нано-поров, которые все еще дороги.
Тем не менее, результаты исследования многообещающие и указывают на будущее, в котором ДНК может быть использована для удовлетворения растущих глобальных потребностей в данных с потенциалом масштабируемости для крупных приложений.