Лестница жизни | страница 37
Теперь задача сразу стала ясна. Все свелось к математической головоломке, варианты решения которой не ограничивались никакими фактами из тех, что пришлось зубрить следующим поколениям студентов, изучавших молекулярную биологию. Четыре буквы в молекулах ДНК должны были кодировать двадцать аминокислот. Это позволяло отбросить возможность прямой транслитерации, при которой одна ДНК-буква соответствовала бы одной аминокислоте. Дублетный код тоже был невозможен, потому что кодировал бы не более шестнадцати аминокислот (4 x 4 = 16). Минимальное число букв было три, то есть код мог быть триплетным (впоследствии Фрэнсис Крик и Сидней Бреннер доказали, что это именно так). Каждая группа из трех ДНК-букв могла кодировать одну аминокислоту. Но такой код казался очень уж расточительным. Из четырех букв можно составить шестьдесят четыре триплета (4 x 4 x 4 = 64), а значит, потенциально триплетами можно было закодировать шестьдесят четыре аминокислоты. Так почему же их было только двадцать? Секрет этого фокуса должен был объяснить смысл четырехбуквенного «алфавита», организованного в шестьдесят четыре трехбуквенных «слова», кодирующие двадцать аминокислот.
Не случайно, наверное, первым, кому удалось дать хоть какой-то ответ, стал не биолог, а энергичный американский физик российского происхождения Георгий (Джордж) Гамов, больше известный своими теориями, касающимися Большого взрыва. Гамов считал ДНК в буквальном смысле матрицей для синтеза белков. Он полагал, что аминокислоты вкладываются в ромбовидные борозды между оборотами спирали. Но его теория генетического кода была в основе нумерологической, и когда он узнал, что белки вообще не синтезируются в ядре, а значит, в ходе синтеза не могут непосредственно контактировать с ДНК, это не произвело на него особого впечатления. Этот факт лишь делал его идею более абстрактной. Суть его предположения состояла в том, что код перекрывается. Это дает большое преимущество, которое обожают криптографы: максимизация плотности информации. Представьте себе последовательность АТЦГТЦ. Первое слово, или, если использовать более строгий термин, первый кодон, будет АТЦ, второй — ТЦГ, третий — ЦГТ, и так далее. Здесь важно то, что перекрывающиеся кодоны всегда ограничивали бы число аминокислотных последовательностей. Например, если АТЦ кодирует определенную аминокислоту, за ней может следовать только аминокислота, кодон которой начинается с букв ТЦ, а следующей аминокислоте должен соответствовать кодон, начинающийся с буквы Ц. Если изучить все возможные варианты, окажется, что очень многие триплеты просто недопустимы: они не могут входить в состав этого перекрывающегося кода, потому что в нем буква А всегда должна стоять рядом с Т, Т — рядом с Ц, и так далее. И сколько триплетов у нас останется для кодирования аминокислот? Ровно двадцать! — сказал Гамов с торжеством фокусника, вынимающего кролика из шляпы.