Вычисление Бога | страница 107
Хорошо — четырёхбуквенный алфавит. Но какой длины слова в генетическом языке? Ведь его назначение — определять последовательности аминокислот, строительных кирпичиков белков. А в живых организмах, как я только что сказал, их двадцать штук. Очевидно, нельзя однозначно приписать каждой из аминокислот слово из одной буквы: в четырёхбуквенном алфавите таких слов будет четыре. Двухбуквенных слов тоже недостаточно: в языке из четырёх символов таких слов всего шестнадцать. Но если мы возьмём трёхбуквенные слова, их хватит с лихвой — можно будет составить целый биохимический словарь в стиле Уильяма Ф. Бакли, из шестидесяти четырёх слов. Двадцать берём на обозначение каждой аминокислоты, ещё две — на пунктуационные метки начала и конца транскрипции. Занятыми получаются двадцать два из шестидесяти четырёх возможных слов. Их теоретически достаточно для того, чтобы ДНК могла функционировать. Если бы некий создатель конструировал генетический код, он должен был посмотреть на излишки лексики и задуматься о том, что с ними делать.
Мне представлялось, что это существо должно было рассмотреть две возможности. Первая — оставить «лишние» сорок две последовательности неопределёнными, подобно тому как в языках имеются последовательности букв, не обозначающие каких-либо действительных слов. При этом, если в нити ДНК вдруг появится одна из таких последовательностей, будет ясно, что при копировании произошла ошибка — генетический сбой, превративший имеющий смысл код А-Т-А в, скажем, не имеющий смысл А-Т-Ц. Это дало бы чёткий, полезный сигнал: что-то пошло не так.
Вторая альтернатива — примириться с тем, что при копировании будут возникать ошибки, но попытаться снизить их воздействие добавлением синонимов в генетическом языке. Вместо того, чтобы каждую аминокислоту означало одно слово, её могут означать целых три синонима. И останутся варианты для выбора начала и конца, что более или менее закруглит словарь ДНК. Если попытаться сгруппировать синонимы согласно логике, можно в некоторой степени предотвращать ошибки транскрипции: если А-Г-А, А-Г-Ц и А-Г-Г будут означать одну аминокислоту и отчётливому прочтению будут поддаваться лишь первые две буквы, шанс на правильное угадывание значения слова будет весьма неплох — даже без информации о третьей букве.
В действительности язык ДНК дозволяет синонимы. И, если бы каждую аминокислоту кодировали три синонима, можно было бы взглянуть на генетический код и сказать — о да, кто-то вдумчиво подошёл к этой задаче! Но две аминокислоты — лейцин и серин — кодируются шестью синонимами каждая, а остальные кодируются четырьмя, тремя и двумя. Или даже одним словом: бедняга триптофан кодируется одной-единственной последовательностью, Т-Г-Г.