Речь пойдёт о том генетическом коде, который изучается в школе - то есть о способе кодирования последовательности белка последовательностью нуклеиновой кислоты (ДНК или РНК). Достаточный материал для понимания текста изложен в википедии:
http://ru.wikipedia.org/wiki/Генетический_код. Другими словами,
генетический код (ГК) - это соответствие последовательности трёх нуклеотидов на матричной РНК (мРНК) одной аминокислоте. Садится мРНК на рибосому и начинается белковый синтез. Он чаще начинается чаще с последовательности AUG - это стартовый кодон (триплет). Далее мРНК двигается как считывающая лента вдоль рибосомы и каждым трём нуклеотидам (триплету, или кодону) соответствует точно своя аминокислота.
Если рибосома наткнётся на последовательность UAA или UAG, то синтез белка закончится. Поэтому такие триплеты называют стоп-кодонами. В википедии показаны различные табличные его представления.
Ниже на рисунке представлена структура кода в виде круговой таблицы.
Рис. 1. Генетический код в круговой форме. Внутренний круг - первая буква кодона, второй круг - вторая буква кодона, третий круг - третья буква кодона, четвертый круг - обозначения аминокислот в трехбуквенном сокращении; П – полярные аминокислоты, НП – неполярные аминокислоты. Для наглядности симметрий, рассмотренных здесь, важен избранный порядок символов U-C-A-G.
Ещё в школе акцентируют внимание на то, что ГК универсален. Он почти одинаков у бактерии и человека. На самом деле ГК может несколько изменяться у различных организмов (простейших, бактерий, грибов, митохондрий, хлоропластов) но, в целом, он почти похож. И эта похожесть - свидетельство единого происхождения белкового синтеза у всех живых организмов. Почему ГК почти не меняется? Потому что любое его изменение критично: изменение в способе кодирования приводит к тому, что изменится структура значительной части белков, что означает смерть для мутанта. Из этого факта проистекает важная мысль: ГК такой же, каким он был сразу после его формирования, то есть так он выглядел более 3,5 млрд. лет назад. Его структура несёт следы его возникновения.
Основные войства кода подробнее могу перечислить в обсуждении, они носят нетривиальный характер. А мы остановимся пока только на одном свойстве - вырожденности. Обратное соответствие в направлении аминокислота-кодон неоднозначно. Это свойство называется вырожденностью. Серия – это множество кодонов, кодирующих одну аминокислоту, другими словами, это группа эквивалентных кодонов. Представим себе кодон в виде XYZ. Если XY определяет “
смысл” (т.е. аминокислоту), то кодон называется “сильным”. Если же для определения
смысла кодона нужен определенный Z, то такой кодон называется “слабым”.
А теперь приступим к самому вкусному.
Распределение вырожденных (с сильными основами) и невырожденных (со слабыми основами) кодонов в ГК не является случайным и подчиняется ряду закономерностей.
Вскоре после расшифровки генетического кода во второй половине 60-х годов прошлого века Ю.Б. Румеру удалось обнаружить удивительно симметричные свойства системы кодонов. Между группами вырожденных и невырожденных кодонов и внутри каждой из этих двух групп можно установить отношения симметрии [Волькенштейн М. В., Румер Ю. Б. 1967; Румер Ю.Б. 1968; Конопельченко Б.Г., Румер Ю.Б.1975].
Это свойство может быть наглядно изображено графически на круговой диаграмме ГК, которая впервые была опубликована в 1965 году.
Можно наблюдать симметрию генетического кода в круговой форме по “силе” и “слабости”.
1. Если кодоны отразить в вертикальной плоскости, то все сильные кодоны перейдут в слабые, и наоборот. Такая замена называется трансформацией Румера. Формально она может быть записана так:
A на C, С на А, U на G, G на U для всех трёх нуклеотидов кодона.
2. При повороте на 180 градусов изображённой на рисунке диаграммы сильные кодоны переходят в сильные, а слабые – в слабые. Это преобразовние соответствет замене первого нуклелотида кодона на комплементарный ему. Формально это можно записать так:
A на U, U на A, C на G, G на C в первом нуклеотиде кодона.
3. Если кодоны отразить в горизонтальной плоскости, то все сильные кодоны перейдут опять в слабые и наоборот. Фактически это преобразование можно представить как последовательное применение двух, указанных выше преобразований – трансформации Румера и последующей замены первого нуклеотида кодона на комплементарный, и поэтому это свойство формально можно рассматривать как производное от первых двух.
Основы слабых кодонов AU, UA, CA, AA, GA, UG, AG. Они содержат нуклеотиды в соотношении C:G:U:A=1:3:5:7.
Основы сильных кодонов CU, GU, UC, CC, AC, GC. Они содержат нуклеотиды в обратном соотношении C:G:U:A=7:5:3:1.
Из этих соотношений выводится так называемое правило Румера: R1=G+C/A+U для слабых основ кодонов равно 1:4, а для сильных - 4:1; отношение R2=A+C/G+U=1:1.
Известно, что участки ДНК или РНК с избытком пар GC более стабильны, чем A-T-богатые участки. Поэтому сильные основы в среднем образуют больше водородных связей с антикодонами т-РНК, чем слабые основы.
Да, такого рода симметрии и свойства уже интересны, но самое интересное только начинается.
Загадочные симметрии ГК.Наиболее впечатляющие симметрии обнаруживаются при упорядочении кодонов по правилу, предложенному В.И. Щербаком. Упорядочивание кодонов в каком-то
смысле напоминает таблицу Менделеева. В основу упорядочения взяты два признака: молекулярную массу кодируемой кислоты и вырожденность группы эквивалентных кодонов тетрад. Все тетрады он разбил на преде всего на две группы: с сильными (группа 1) и слабыми основами (группа 2). Группу 2 он в свою очередь разбил на три подгруппы: с вырожденностью 1 (подгруппа 2.1), с вырожденностью 2 (подгруппа 2.2), с вырожденностью 3 (подгруппа 2.3). При анализе симметрий стоп-кодон UGA условно принят за цистеиновый (как уже упоминалось выше,он является ещё и селеноцистеиновым). Это единственное изменение универсального кода позволяет увидеть принципиально новые симметрии.
В группе 1, а также во всех подгруппах группы 2, кодоны упорядочиваются по возрастанию молекулярных масс кодируемых ими аминокислот. Такое упорядочивание триплетов напоминает упорядочивание химических элементов в таблице Менделеева (см. рис. 2 ).
Рис. 2. Таблица ГК, построенная с учётом вырожденности кодонов и молекулярных масс кодируемых аминокислот. Обозначения: R - пуриновые нуклеотиды A и G, Y - пиримидиновые нуклеотиды U и C. Цифры во второй строчке таблицы обозначают молекулярную массу кодируемых вертикально расположенными кодонами аминокислот.
Для начала проверим истинность преобразований Румера.
Легко можно убедиться для начала в реальности преобразований Румера. Замените в любом столбце, скажем верхней таблице A на U, U на A, C на G, G на C и вы получите столбец только из второй таблицы, и наоборот.
Также замените в любом столбце первый нуклеотид кодона на комплементарный (A на C, C на A, U на G, G на U) и вы останетесь в этой же таблице, например, берём из второй таблицы столбец UGG и заменяем по этому правилу на AGG - это и есть AG(А,U,C). Мы остались в той же таблице, то есть в группе невырожденных кодонов.
А теперь перейдём к наиболее удивительным свойствам. Посмотрим только на вторую строчку нуклеотидов в нижней таблице и находим геометрическую середину этой сточки - геометрическая середина находится между столбцами CAR и AAR.
Мы видим, что относительно этой середины все нуклеотиды зеркально отображаются друг в друга!
Для наглядности просто выпишу эту строчку и отмечу смайликом середину:
G U A G U A A A
A A A U G A U G
Просто поразительно! Как такое может быть? Двигаемся дальше. Рассмотрим первую сточку нуклеотидов верхней таблицы (рис.2). Тоже найдём середину. Выпишу также её для наглядности:
G G U C
G A C C
Сможете ли догадаться, какая симметрия обнаруживается при зеркальном отражении относительно вертикальной середины? Это симметрия по комлементарности! G переходит в комплементарный нуклеотид C, U - в A.
Двигаемся дальше. Сейчас самое самое вкусное начнётся.
Вернёмся к нижней таблице невырожденных кодонов (рис. 2).
Возле геометрической середины находится столбец кодона для аминокислоты лизин (Lys) - AAR. Найдите слева от него стоп-кодон (столбец UAR и цифра ноль для молекулярной массы) и окажется, что ему зеркально соответствует стартовый кодон (Met - метиониновый кодон, столбец AUG).
Поразительно, что ещё два стоп кодона во второй нуклеотидной строчке таже зеркально переходят при этом преобразовании в два стартовых. Эти кодоны выделены серым цветом. Два стоп-кодона лежат крест-накрест (вертикально UAR, горизонтально UAG) и ещё один стоп-кодон UAA лежит правее. Все три они зеркально переходят в три стартовых кодона относительно стобца AAR.
Итак, мы имеем ещё одну
смысловую симметрию при этом упорядочении. Возникает впечатление, что мы читаем какую-то информацию, как в акростихе:
Ангел лег у края небосклона,
Наклоняясь, удивлялся безднам.
Новый мир был темным и беззвездным.
Ад молчал. Не слышалось ни стона.
Продолжим рассматривать симметрию относительно этого же столбца (Lys). Мы видели странную СМЫСЛОВУЮ симметрию, когда три стопкодона, из которых два лежат крест-накрест, переходят в три стартовых кодона, из которых зеркально отражённые также два лежат крест-накрест. Эти кодоны окрашены в серый цвет, а лизиновый столбец, относительно которого рассматривается зеркальная симметрия, - в чёрный.
Поразительно, что относительно этого же стобца (Lys) - AAR мы видим большое множество и других симметрий (три следующих симметрии открыты мной 20 лет назад). Возьмите первую нуклеотидную строчку и видна опять симметрия по комлементарности относительно середины - А. Выпишу для наглядности:
А U A U A G C
A G C U A U A U
Здесь опять A переходит в U, U переходит в A, C переходит в G, G переходит в C.
А теперь в этой строчке объедините нуклеотиды в пары комплементраных кодонов и увидите, что эти пары зеркально отображаются друг в друга:
А U A U A G C A G C U A U A U
Пары UA переходят в пары UA, а GC - в GC.
Рассмотрим теперь нижнюю строчку - она имеет зеркальную симметрию относительно этого же столбца:
Y R Y Y R R R Y Y R Y
См. также рис. 3, на которой видны симметрии относительно лизинового столбца AAR для пар кодонов по первому и третьему нуклеотидам.
Рис. 3.
Красиво, не правда ли?
Напомню, что в данном рассуждении есть одно жульничество. В построенной таблице один из стоп-кодонов, а именно UGA, ПРИНЯТ ЗА ЦИСТЕИНОВЫЙ (Cys). Это жульничество делается для того, чтобы лучше выявить многие симметрии ГК. Чтобы успокоить самих себя, представим, что существует некий суперсимметричный ГК, отличающийся от реального универсального кода заменой
смысла только одного кодона. В итоге в этом суперсимметричном коде цистеин кодируется следующей группой кодонов: UGA, UGU, UGC.
Кроме того, и это важно, во всех организмах этот кодон иногда используется не как стоп, а как кодирующий НЕКАНОНИЧЕСКУЮ аминокислоту - селеноцистеин, которая похожа по структуре на цистеин, но вместо серы там селен. Такая фишка происходит по-видимому во всех организмах - чаще как стоп, но реже как селеноцистеин.
Переведём дыхание. Итак, МЫ ОБНАРУЖИЛИ НЕКУЮ ЗАГАДКУ, КОТОРАЯ ТРЕБУЕТ ОБЪЯСНЕНИЯ. ЗАГАДКА ЭТА СВЯЗАНА С КЛЮЧЕВЫМ ЭТАПОМ ВОЗНИКНОВЕНИЯ ЖИЗНИ – ВОЗНИКНОВЕНИЕМ ГЕНЕТИЧЕСКОГО КОДА.
Важно, что установленные закономерности – это не игра с числами. Это связь между реально существующими физическими параметрами, которая могла бы быть и другая, или её не могло быть вообще.
Резюме.
Изложим резюме, используя аналогию с Периодической таблицей Д.И.Менделеева.
1. Подобно тому, как в конце XIX века Д.И. Менделеев обнаружил периодический закон и построил периодическую таблицу, используя принцип возрастания молекулярных масс химических элементов, можно построить также таблицу для генетического кода, упорядочив по возрастанию молекулярных масс аминокислот.
2. Когда таблицу Менделеева построили, не существовало ещё объяснения причин существования периодического закона. Периодический закон был объяснён позднее на основе законов квантовой механики. Мы также не знаем причин существования симметрий кода в построенных таблицах. ОДНАКО САМ ФАКТ ИХ СУЩЕСТВОВАНИЯ ДОЛЖЕН ИМЕТЬ ОБЪЯСНЕНИЕ. Поскольку ГК заморожен (сохранил свою структуру после формирования), это объяснение должно быть связано с сценарием возникновения кода.
3. Подобно тому, как в таблице Менделеева были исключения – не все элементы укладывались в систему, были исключения из правил. Впоследствии эти исключения были объяснены тем, что нужно было использовать упорядочение не по возрастанию молекулярных масс элементов, а по возрастанию заряда ядра атома, тогда исключения исчезают. То есть объяснения периодического закона и более глубокое знание структуры атома позволили объяснить существующие исключения из правила.
В случае построенной таблицы ГК также есть исключение: мы условно присвоили одному стоп-кодону другое значение – он стал кодировать цистеин. ОДНАКО НАЙДЯ ОБЪЯСНЕНИЕ СУЩЕСТВОВАНИЮ ОБНАРУЖЕННЫХ СИММЕТРИЙ ГЕНКОДА, МЫ МОЖЕМ НАДЕЯТЬСЯ И НАЙТИ И ОБЪЯСНЕНИЕ ДАННОМУ ИСКЛЮЧЕНИЮ ИЗ ПРАВИЛА.
Литература:
1. Конопельченко Б.Г., Румер Ю.Б. Классификация кодонов в генетическом коде // ДАН. 1975. Т.223. С. 471-474.
2. Румер Ю.Б. Систематизация кодонов в генетическом коде. // Докл. АН СССР. 1968. T.183. C.225–226.
3. Shcherbak V.I. The Rumer’s rule and transformation in the context of the co-operative symmetry of the genetic code // J. Theor. Biol. 1989. V. 139. P. 271–276.
4. Shcherbak V.I. Ways of wobble pairing are formalized with the co-operative symmetry of the genetic code // J. Theor. Biol. 1989. V. 139. P. 277–281.
5. Shcherbak V.I. The «START» and «STOP» of the genetic code. Why exactly ATG and TAG, TAA? // J. Theor. Biol. 1989. V. 139. P. 283–286.
6. Shcherbak V.I. The symmetrical architecture of the genetic code systematization principle // J. Theor. Biol. 1993. V. 162. P. 395–398.
7. Shcherbak V.I. Twenty canonical amino acids of the genetic code: the arithmetical regularities. Part I. // J. Theor. Biol. 1993. V. 162. P. 399–401.
8. Shcherbak V.I. Sixty-four triplets and 20 canonical amino acids of the genetic code: the arithmetical regularities. Part II // J. Theor. Biol. 1994. V. 166. P. 475–477.