На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Хранение данных с помощью бактерий: 900 Тбайт в грамме биоматериала


26.11.2010 [16:00], Константин Ходаковский

 

Возможность хранения данных с помощью ДНК давно будоражит умы многих учёных. Недавно исследователи Китайского университета Гонконга обнародовали результаты своей работы в рамках проекта Bioencryption. Они утверждают, что с помощью их способа хранения и считывания данных в одном грамме бактерий можно уместить до 900 Тбайт информации.

 

Проект Bioencryption

 

Технология была создана в рамках международного конкурса iGEM-2010 (International Genetically Engineered Machine) и позволяет кодировать информацию с помощью смешивания ДНК (DNA shuffling), а проверку точности чтения осуществлять с помощью контрольных сумм.

 

Проект Bioencryption

 

Перед записью данных в молекулы информация должна быть преобразована из двоичной системы, применяемой на ПК, в четверичную: по количеству видов азотистых оснований нуклеотидов  — аденин (A), тимин (T), цитозин (C), гуанин (G).

 

Проект Bioencryption

 

Таким образом, к примеру, последовательность «iGEM», если представить дело довольно условно, вначале должна быть переведена в двоичную кодовую таблицу ASCII (i = 105; G = 71; E = 69; M = 77), затем в четверичную систему (105 → TCCT; 71 → ATTG; 69 → ATTT; 71 → ATGT), чтобы в итоге превратиться в цепь нуклеотидов внутри ДНК.

iGEM → 1221 0113 0111 0131 → TCCT ATTG ATTT ATGT

Перед записью данных исследователи предлагают использовать алгоритм сжатия DEFLATE, позволяющий уменьшать длину гомополимера и число повторяющихся участков. В каждой «синтетической» клетке можно хранить не более 1 Кбайт данных, а потому более объёмные информационные блоки нужно разбивать на минимально адресуемые единицы, каждая из которых имеет собственный заголовок (включает порядок размещения данных) и хвост (включает контрольную сумму последовательности), и размещается в 4-уровневой иерархической структуре.

 

Проект Bioencryption

 

Учёные предлагают для хранения использовать бактерии E.coli DH5 α с внедрёнными в них синтезированными ДНК. 1 грамм таких бактерий может вместить столько же данных, сколько и 450 двухтерабайтных жёстких дисков. Пока, впрочем, технология не представляет практического интереса, потому что синтез ДНК чрезвычайно дорог.

 

Проект Bioencryption

 

В своей презентации исследователи отмечают, что в будущем подобную систему можно использовать для хранения любой информации: от текста и фотографий до аудио- и видеофайлов.

 

ДНК

Картина дня

наверх