Проблемы Эволюции

Проблемы Эволюции

Крупные и мелкие перестройки в эволюции прокариотических геномов

Марков А. В., Захаров И. А.

Генетика. 2006. № 11. С. 1547-1557.

 

А.В.Марков, И.А.Захаров

КРУПНЫЕ И МЕЛКИЕ ПЕРЕСТРОЙКИ В ЭВОЛЮЦИИ ПРОКАРИОТИЧЕСКИХ ГЕНОМОВ

Генетика. 2006. № 11. С. 1547-1557.

English pdf

Относительные частоты крупных и мелких геномных перестроек (инверсий и транспозиций) в эволюции прокариотических геномов можно оценить по соотношению показателей S (отношение числа одинаковых пар генов-соседей в двух геномах к общему числу генов в рассматриваемой выборке) и 1-6•L/n, где L — средняя разность межгенных расстояний, n — число генов в выборке. По мере фиксации геномных перестроек величина S снижается равномерно, тогда как скорость снижения величины 1-6•L/n определяется размером перестроек: крупные инверсии и транпозиции приводят к резкому снижению, мелкие — к незначительному. Соотношение данных показателей вычислено для 20 пар близкородственных видов, относящихся к разным группам бактерий и архей. Рассмотренные пары сильно различаются по относительной частоте крупных и мелких перестроек, однако компьютерное моделирование показало, что всю наблюдаемую вариабельность можно воспроизвести при одних и тех же входных параметрах модели. Это означает, что наблюдаемые различия могут объясняться простой случайностью и для их интерпретации не требуется прибегать к предположениям о существенно разных механизмах и факторах геномных перестроек у разных групп прокариот. Относительные частоты крупных и мелких перестроек не проявляют заметных корреляций с таксономическим положением, общей скоростью фиксации перестроек, условиями обитания, обилием транспозонов и повторяющихся последовательностей. Деятельность фагов, возможно, в ряде случаев повышает вероятность крупных геномных перестроек.

Закономерности эволюционных изменений порядка генов в хромосомах различных организмов привлекают в последние годы все большее внимание исследователей. Генные порядки изменяются в результате инверсий, транслокаций и транспозиций. Впервые один из авторов настоящей работы [1] предложил количественно измерять сходство расположения генов на генетических картах. На основе предложенных мер сходства было проведено сравнение геномов млекопитающих, показана возможность реконструкции филогении геномов [4, 44] и промоделирована эволюция геномов, состоящих из нескольких хромосом [3, 5]. Предложенные меры сходства предназначались для сравнения геномов, в которых неизвестен порядок генов в хромосомах, а известно только их расположение в той или иной хромосоме. Была предложена также и мера сходства собственно генных порядков, которая давала возможность сравнивать геномы, представленные не группами синтении (порядок генов в которых неизвестен), а группами сцепления [2].

Для подобных сравнений другая мера была независимо разработана Санковым, который сравнил генные порядки в митохондриях разных организмов [8, 32]. В дальнейшем этим автором и его коллегами было проанализировано изменение генных порядков и в хромосомах млекопитающих [17].

По мере того, как все большее число прокариотических геномов было просеквенировано, различные количественные и качественные методы сравнения генных порядков были предложены и использованы при анализе геномов прокариот [12, 28, 31, 33, 35 — 37, 42]. Один из основных выводов этих и других исследований состоит в том, что степень сходства генных порядков в целом неплохо коррелирует со степенью филогенетической близости сравниваемых видов (или штаммов), что позволяет использовать количественные оценки этого сходства для построения осмысленных дендрограмм при помощи стандартных методов (Fitch-Margoliash, neighbor-joining и др.). Получающиеся при этом деревья могут быть использованы в филогенетике наряду с другими, основанными на величине сходства нуклеотидных последовательностей отдельных генов. Разработаны и находятся в свободном доступе в Интернете программы для построения филогенетических реконструкций на основе сравнения генных порядков (SHOT vs. 2.0 — Shared Ortholog and Gene Order Tree Reconstruction Tool: http://www.bork.embl-heidelberg.de/SHOT/ ) [23].

Вместе с тем эволюция генных порядков в разных группах прокариот имеет свои специфические особенности, которые необходимо учитывать при интерпретации результатов сравнительного анализа геномов. Можно выделить две такие особенности, по которым характер эволюции генных порядков может существенно различаться у разных прокариот: темп (частота) перестроек и их величина (соотношение мелких и крупных перестроек).

Существенные различия в темпах фиксации геномных перестроек в разных группах неоднократно отмечались в литературе. Например, аномально высокая скорость изменения порядка генов характерна для бактерии Wolbachia, внутриклеточного паразита наземных беспозвоночных [6]. Повышенное число геномных перестроек выявлено также при сравнении видов, относящихся к родам Pyrococcus и Mycobacterium, в то время как в пределах родов Mycoplasma, Chlamydia, Helicobacter и др. наблюдается ограниченное число перестроек [7, 18, 19, 21, 24, 27, 35, 38, 39, 45].

Менее изучена проблема соотношения крупных и мелких геномных перестроек в эволюции разных групп прокариот. По этому поводу в литературе встречаются диаметрально противоположные утверждения. Так, в одних публикациях сообщается о преобладании у прокариот крупных инверсий (в противоположность грибам Saccharomyces cerevisiae и Candida albicans, у которых половина инверсий мелкие, включающие один или несколько генов) [22]. В других публикациях, напротив, сообщается о преобладании у прокариот мелких инверсий, в противоположность животным и растениям, у которых преобладание мелких инверсий не столь выражено [14, 30]. Санков привлек внимание к тому факту, что количественное соотношение крупных и мелких геномных перестроек может приводить к количественным различиям в уровне сохранности длинных «консервативных сегментов» (conserved segments) с идентичным порядком генов и групп сближенных генов с различающимся их расположением внутри группы — «генных кластеров» (gene clusters). В случае преобладания мелких перестановок о родстве сравниваемых организмов можно судить по числу общих «генных кластеров», в противном случае более показательным является число «консервативных сегментов» [30]. Предложен ряд весьма сложных формул для расчета вероятностей случайного обнаружения в двух полностью перемешанных геномах того или иного количества генных кластеров с разными характеристиками: в зависимости от числа генов в кластере (m), размера генома (n), величины «окна» (r), т.е. длины участка генома, в пределах которого должны быть найдены искомые m генов [16, 40].

Результаты проведенного нами сравнения генных порядков у альфапротеобактерий [6] позволили сделать предположение о повышенной частоте мелких геномных перестроек по сравнению с крупными, притом что вероятность крупных перестроек в этой группе бактерий все же была достаточно высока.

В настоящей работе нами предлагается новый способ количественной оценки соотношения крупных и мелких геномных перестроек в эволюции различных групп прокариот, основанный на сопоставлении числа разрывов и средней разности межгенных расстояний. Цель данной работы — на основе сравнения генных порядков в парах близкородственных видов, относящихся к разным группам прокариот, оценить степень имеющихся различий по относительной частоте крупных и мелких геномных перестроек и выявить их возможные причины.

МАТЕРИАЛ

Анализировали геномы 34 видов прокариот (табл. 1). Сравнивали генные порядки в 20 парах близкородственных видов (табл. 2). Эти пары геномов выбраны на основе предварительного сравнения генных порядков (выбирались пары со средним и высоким числом одинаковых пар генов-соседей). Использовали тот же набор гомологичных генов, что и в предыдущей работе [6], за исключением генов рибосомных белков, которые образуют т.н. «рибосомный супероперон» и ведут себя в ходе эволюции особым образом, сохраняя сходный порядок даже у неродственных групп прокариот (отчасти их порядок сохранился даже в геномах пластид и митохондрий) [10, 13, 20]. Впрочем, следует отметить, что исключение генов рибосомных белков из анализируемой выборки генов слабо влияет на полученные результаты.

Таблица ортологичных генов и их порядок в хромосомах доступны по адресу: http://macroevolution.narod.ru/bact.htm (бактерии) и http://macroevolution.narod.ru/arch.htm (археи).

МЕТОДИКА

Использовались следующие количественные показатели [6]:

1) Относительное число общих пар соседних генов в двух геномах:

S=m/n,

где m — число одинаковых пар соседних генов в двух сравниваемых геномах (соседними гены считались в том случае, если между ними в хромосоме нет ни одного гена из рассматриваемой выборки); n — число гомологичных генов, используемых при сравнении двух данных геномов. Величина S отражает степень сходства точного порядка генов в двух сравниваемых геномах (т.е. степень сохранности «консервативных сегментов»).

2) Средняя разность расстояний между генами L. Показатель вычисляли следующим образом. Для каждого гена вычисляли расстояние до всех остальных генов в данном геноме; всего, таким образом, для генома вычислялось (n2 — n)/2 межгенных расстояний. Каждое межгенное расстояние вычисляли как модуль разности условных номеров позиций двух генов в геноме (условный номер позиции — порядковый номер гена в последовательности из n рассматриваемых генов); с учетом того, что хромосома кольцевая, величина межгенного расстояния x, превышающая n/2, заменялась на величину n — x. Затем вычисляли абсолютное значение разности межгенных расстояний для каждой из (n2 — n)/2 пар гомологичных генов в двух сравниваемых геномах. Итоговую величину L вычисляли как среднее из этих абсолютных значений.

Для сопоставления результатов, полученных при сравнении разных пар геномов с разными значениями n, использовали нормированную величину 6•L/n (поскольку, как показывают модельные эксперименты, по мере накопления геномных перестроек величина L стремится к n/6 при любом значении n). Эта величина, в свою очередь, вычиталась из единицы, чтобы получить меру сходства (вместо меры различия), сопоставимую с показателем S. Величина 1-6•L/n отражает в первую очередь степень сходства приблизительного порядка генов в двух сравниваемых геномах (т.е. степень сохранности «генных кластеров»).

Соотношение величин S и 1-6•L/n можно использовать как показатель относительной частоты крупных и мелких геномных перестроек, произошедших в ходе дивергенции данной пары геномов. Модельные эксперименты показывают, что величина S по мере накопления геномных перестроек снижается более-менее равномерно и отражает не размер перестроек, а только их число. Величина 1-6•L/n по мере накопления геномных перестроек тоже снижается, но не равномерно: темп снижения сильно зависит от величины перестроек. Крупные перестройки приводят к резкому снижению, мелкие — к незначительному.

СООТНОШЕНИЕ ВЕЛИЧИН S И 1-6•L/n В ЭКСПЕРИМЕНТАХ ПО МОДЕЛИРОВАНИЮ ГЕНОМНЫХ ПЕРЕСТРОЕК

Для выяснения зависимости динамики показателей S и 1-6•L/n от относительной частоты крупных и мелких геномных перестроек использовали компьютерную модель эволюции генных порядков, разработанную нами ранее [6]. Моделировали эволюцию кольцевого генома, включающего 120 генов. В каждом эксперименте имитировалось 100 событий (инверсий и транспозиций). Вероятность того, что очередное событие окажется инверсией (а не транспозицией), полагалась равной 0,5 (т.е. число инверсий и транспозиций в эволюции модельного генома было примерно одинаковым). Это, по-видимому, достаточно точно соответствует тому, что происходит в эволюции реальных прокариотических геномов. Так, в ходе дивергенции Chlamydia trachomatis и C. pneumoniae произошло 59 +/- 6 событий, среди которых было 51% инверсий (преимущественно коротких) и 49% транспозиций [14].

Модельные эксперименты показали, что:

1) динамика S мало зависит от величины перестроек; S убывает в целом пропорционально числу перестроек. Транспозиции приводят к более быстрому (в 1,5 раза) снижению по сравнению с инверсиями, поскольку транспозиция создает 3 точки разрыва, а инверсия — только 2;

2) динамика 1-6•L/n сильно зависит от величины перестроек. Если происходят только мелкие перестройки, эта величина снижается медленно (рис. 1). На всех графиках точка (1,1) соответствует полной идентичности генных порядков; точка (0,0) соответствует максимальной несхожести генных порядков; по мере накопления различий в геномах точки смещаются влево (что отражает снижение величины S) и вниз (снижение 1-6•L/n). По мере роста относительной вероятности возникновения крупных перестроек снижение 1-6•L/n ускоряется (рис. 2-4);

3) поскольку динамика S зависит лишь от числа, а 1-6•L/n — еще и от размера геномных перестроек, соотношение этих величин действительно можно использовать как показатель относительной частоты крупных и мелких геномных перестроек в ходе дивергенции конкретных пар видов прокариот. Задавая различные вероятности крупных и мелких перестроек в модели, мы получаем четко очерченные «области распространения» точек на графике (рис. 1-4). Отчасти эти области пересекаются, особенно при максимальных (близких к 1) и минимальных (близких к 0) значениях S. Тем не менее в широком диапазоне промежуточных значений S положение точки на графике характеризует относительную вероятность крупных и мелких геномных перестроек;

4) достаточно большой разброс точек при одних и тех же параметрах модели (особенно в том случае, когда крупные перестройки разрешены, но относительно маловероятны; рис. 3) говорит о том, что следует различать относительную вероятность крупных перестроек и их относительную частоту в ходе эволюции конкретной пары модельных или реальных геномов. Вероятность определяется только параметрами модели, которые мы задаем; реальная частота — параметрами модели в сочетании с фактором случайности. Например, если заданная вероятность крупной перестройки равна 0.1, это вовсе не означает, что крупной окажется именно каждая десятая перестройка. В модели вероятности задаются искусственно путем изменения параметров модели. В эволюции реальных микроорганизмов эти вероятности определяются реальными молекулярными механизмами геномных перестроек (активностью фагов и транспозонов, особенностями ферментов, участвующих в репликации и др.), возможно, в сочетании с факторами внешней среды. Однако в обоих случаях (и в модели, и в реальности) эти вероятности, имеющие вполне материальную и поддающуюся анализу основу, определяют не точные частоты крупных и мелких перестроек, а лишь некоторый возможный (и довольно широкий) диапазон частот. О величине этого диапазона можно судить по степени разброса точек на рис. 1-4.

Рис. 1. Соотношение показателей S (горизонтальная ось) и 1-6•L/n (вертикальная ось) в реальных и модельных парах геномов прокариот. Модель: разрешены только очень мелкие геномные перестройки (вырезаются участки не длиннее 6 генов, при транспозиции переносятся не далее, чем на 6 позиций). Представлено 10 прогонов модели. Параметры модели: длина вырезаемого участка — 1 ген (вероятность 0.5) или 2-6 генов (0.5). Расстояние переноса: 0 (вероятность 0.5, в этом случае всегда происходит инверсия), 1 (0.2), 2-6 (0.3). Здесь и далее: при транспозициях вероятность встраивания в обратном порядке 0.5; крупные значки — реальные пары геномов; мелкие значки — модель.

Рис. 2. Модель: разрешены только мелкие и средние перестановки (вырезаются участки не длиннее 6 генов, переносятся при транспозиции на любое расстояние). Представлено 10 прогонов модели. Параметры модели: длина вырезаемого участка — 1 ген (вероятность 0.5) или 2-6 генов (0.5). Расстояние переноса: 0 (вероятность 0.5), 1 (0.02), 2-6 (0.08), 7-14 (0.2), 15-60 (0.2).

Рис. 3. Модель: вероятность мелких перестановок выше, чем крупных (участки длиннее 6 генов вырезаются в 15% случаев, длиннее 14 — в 5%; перенос при транспозиции на любое расстояние). Представлено 20 прогонов модели. Параметры модели: длина вырезаемого участка: 1 ген (вероятность 0.15), 2-6 генов (0.7), 7-14 (0.1) или 15-60 (0.05). Расстояние переноса: 0 (вероятность 0.5), 1 (0.02), 2-6 (0.08), 7-14 (0.2), 15-60 (0.2).

Рис. 4. Модель: величина перестроек случайна (длина вырезаемого участка — случайная, расстояние переноса — как на рис. 3). Представлено 20 прогонов модели.

 

ИНТЕРПРЕТАЦИЯ ЭМПИРИЧЕСКИХ ДАННЫХ ПО 20 ПАРАМ ВИДОВ ПРОКАРИОТ НА ОСНОВЕ РЕЗУЛЬТАТОВ МОДЕЛИРОВАНИЯ.

Исследованные пары близкородственных видов прокариот сильно отличаются друг от друга по соотношению величин S и 1-6•L/n (рис. 1). Иными словами, относительные частоты крупных и мелких перестроек в ходе эволюции этих пар существенно различались. В связи с этим возникает вопрос: можно ли на основе имеющихся данных утверждать, что наблюдаемый разброс обусловлен различиями в механизмах геномных перестроек у разных прокариот, или, иными словами, что наблюдаемые различия в относительной частоте крупных и мелких перестроек отражают различия соответствующих вероятностей?

Данные, представленные на рис. 3, убедительно показывают, что оснований для такого утверждения нет. При одних и тех же изначально заданных вероятностях крупных и мелких перестроек в ходе эволюции двадцати модельных пар геномов был полностью воспроизведен весь диапазон изменчивости по соотношению величин S и 1-6•L/n, наблюдаемый у двадцати реальных пар видов прокариот.

Таким образом, полученные результаты не противоречат гипотезе о том, что соотношение вероятностей крупных и мелких перестроек в ходе дивергенции рассмотренных 20 пар видов прокариот было одинаковым (причем крупные перестройки были возможны, но менее вероятны, чем мелкие); соответственно, нет оснований для утверждения о существенных различиях механизмов и факторов, определяющих размер перестроек у этих видов. Весь наблюдаемый разброс может быть объяснен случайностью.

Вместе с тем остается неопровергнутой и обратная гипотеза о существенно различных вероятностях крупных и мелких перестроек (и, соответственно, различных механизмах и факторах геномных перестроек). Об этом свидетельствуют результаты моделирования, отраженные на рис. 2 и 4. Рис. 2 показывает, что лишь несколько пар видов с наиболее высокими относительными значениями 1-6•L/n (pyf/pyh, spn/spy, eco/shg, msa/msm; в меньшей степени clt/cpp и tpa/tpv) соответствуют гипотезе о крайне низкой или нулевой вероятности крупных перестроек (гипотеза 1). Рис. 4 показывает, что несколько пар видов с минимальными относительными значениями 1-6•L/n (wMe/wBm, sus/sut, ric/rif, syn/pro, bah/lii) соответствуют гипотезе об абсолютно случайном размере всех происходящих геномных перестроек (гипотеза 2). При этом все без исключения рассмотренные пары видов соответствуют гипотезе о том, что крупные перестройки возможны, но менее вероятны, чем мелкие (гипотеза 3).

Таким образом, все изученные пары геномов можно подразделить на три группы:

1) Пары с очень высоким сходством приблизительного порядка генов; соответствуют гипотезам 1 и 3 (pyf/pyh, spn/spy, eco/shg, msa/msm, clt/cpp, tpa/tpv); в ходе дивергенции этих пар число крупных перестроек было минимальным;

2) Пары со средней степенью сходства приблизительного порядка генов; соответствуют только гипотезе 3 (ana/ehr, eco/sal, eco/yep, bah/bas, cla/clp, eco/pas, myt/myl, myt/cor);

3) Пары с минимальной степенью сходства приблизительного порядка генов; соответствуют гипотезам 2 и 3 (wMe/wBm, sus/sut, ric/rif, syn/pro, bah/lii); в ходе дивергенции этих пар число крупных геномных перестроек было максимальным.

Пара ric/rip соответствует всем трем гипотезам одновременно (в силу очень небольшого числа геномных перестроек, произошедших в этой паре). В пределах рассматриваемой выборки генов различия данных двух видов риккетсий сводятся всего лишь к двум транспозициям коротких фрагментов (2 и 4 гена соответственно) на небольшое расстояние.

ВОЗМОЖНЫЕ РАЗЛИЧИЯ В МЕХАНИЗМАХ И ФАКТОРАХ ГЕНОМНЫХ ПЕРЕСТРОЕК

Если наблюдаемые различия в относительной частоте крупных перестроек определяются (хотя бы отчасти) не только простой случайностью, но и различиями в механизмах и факторах геномных перестроек, то можно ожидать, что в группах с минимальным и максимальным числом крупных перестроек имеются достаточно контрастные различия по каким-то реальным генетическим или экологическим параметрам, с которыми может быть связано возникновение геномных перестроек.

Таксономическое положение слабо коррелирует с наблюдаемыми различиями. Так, среди альфапротеобактерий имеются пары с большим (wMe/wBm, ric/rif) и средним (ana/ehr) числом крупных перестроек; среди Firmicutes имеются пары с высоким (bah/lii), средним (bah/bas, cla/clp) и низким (spn/spy) числом крупных перестроек. С другой стороны, все три пары, относящиеся к Euryarchaeota (pyf/pyh, msa/msm, tpa/tpv) характеризуются низким числом крупных перестроек, а единственная пара, относящаяся к Crenarchaeota (sus/sut) претерпела в ходе своей дивергенции весьма высокое число таких перестроек.

Условия обитания, очевидно, не оказывают определяющего влияния на относительную частоту крупных перестроек, поскольку обитающие в одном биотопе Sulfolobus и Thermoplasma контрастно различаются по относительной величине 1-6•L/n; столь же сильные различия наблюдаются и у внутриклеточных паразитов (wMe/wBm, ric/rif — высокая частота крупных перестроек; ana/ehr — средняя, clt/cpp — низкая).

Общая скорость геномных перестроек, по-видимому, не коррелирует с относительной частотой крупных и мелких перестроек. Это видно по результатам сопоставления показателя S с числом нуклеотидных замен в парах близкородственных видов прокариот [35]. Так, отношение темпа геномных перестроек (изменений порядка генов) к темпу накопления нуклеотидных замен оказалось очень низким у хламидий и очень высоким — в паре термококков pyh/pyf. Однако по относительной частоте крупных геномных перестроек пары clt/cpp и pyh/pyf весьма сходны.

Фаги и мобильные элементы. Для Wolbachia pipientis, штамм wMel, и для Rickettsia felis характерно аномально высокое число МГЭ, а также многочисленные признаки активности фагов [25, 43]. Это справедливо и для гипертермофильных архей из рода Sulfolobus, для которых характерны аномально большое количество транспозонов (у S.solfataricus), кластеры тандемных повторов [9, 11, 34] и высокая зараженность вирусами [41]. Геном Listeria innocua переполнен генами фагового происхождения. Строение генома Prochlorococcus свидетельствует о пониженной склонности к геномным перестройкам (нет транспозаз, сайт-специфичных рекомбиназ, XerC-подобных интеграз и т.п.) [15]. С другой стороны, для остальных цианобактерий характерно большое число транспозаз, а для штамма Synechococcus WH 8102, в частности, отмечены признаки высокой активности фагов и интенсивного горизонтального переноса генов, в том числе посредством фагов [26]. Таким образом, во всех случаях, когда наблюдается минимальная степень сохранения «приблизительного» сходства генных порядков и максимальная частота крупных геномных перестроек, можно говорить об обилии в геноме по крайней мере одного из членов каждой пары мобильных генетических элементов различной природы и других признаков гиперактивности рекомбинационных процессов, включая рекомбинацию, спровоцированную деятельностью фагов.

Однако и среди пар с наименьшей частотой крупных перестроек наблюдается весьма схожая картина. Детальный сравнительный анализ генных порядков в геномах трех видов рода Pyrococcus [45] показал, что локализация значительной части мелких геномных перестроек у P.furiosus проявляет высокую степень корреляции с локализацией двадцати трех гомологичных IS-подобных элементов, ассоциируемых с транспозонами, которые есть только у этого вида рода и отсутствуют у других, в том числе у P.horikoshii. Предполагается, что «заражение» P.furiosus этими элементами произошло после его отделения от линии P.horikoshii и P. abyssi. Возможно, преобладание мелких перестроек в данной паре обусловлено специфическими свойствами именно этого семейства IS-подобных элементов. Специфической особенностью Pyrococcus является также пониженная частота транслокаций, пересекающих ось начало-конец репликации (картина, обратная той, что была выявлена у хламидий и микобактерий) [45]. Однако и для Sulfolobus solfataricus (группа с наибольшей частотой крупных перестроек) предполагается, что ось начало-конец репликации является барьером для перемещений IS-элементов [11]. Уникальная черта P.furiosus заключается в том, что совпадение направлений репликации и транскрипции наблюдается менее чем у половины генов (у всех других прокариот, у которых известны полные геномные последовательности, таких генов всегда более половины). Для всех видов Pyrococcus характерны длинные кластеры тандемных повторов, как и для Sulfolobus. Явные признаки активности фагов в геноме P.furiosus и P.horikoshii практически отсутствуют; гены транспозаз многочисленны только у первого вида (что связано с «зараженностью» IS-элементами). Предполагается, что геном P.furiosus находится в состоянии активной перестройки. У Thermoplasma сравнительно много транспозаз в геноме; фаговых генов, по-видимому, нет. Интересно, что между Thermoplasma и обитающим в тех же биотопах Sulfolobus solfataricus происходит активный латеральный перенос генов. По крайней мере 252 гена Thermoplasma чрезвычайно похожи на гены Sulfolobus, хотя эти археи относятся к разным большим группам (Euryarchaeota и Crenarchaeota) [29]. Среди пар видов с минимальной частотой крупных перестроек, кроме tpa/tpv и pyf/pyh, еще у двух (msa/msm и clt/cpp) в геномах отмечается малое число или отсутствие признаков фаговой активности. Этого, однако, нельзя сказать о парах eco/shg и spn/spy.

Таким образом, в группах с максимальной и минимальной сохранностью приблизительного порядка генов (и соответственно с минимальной и максимальной частотой крупных перестроек) прослеживается существенное сходство. Большинство этих пар включает виды (штаммы), геном которых находится в состоянии активной реорганизации. Прямые свидетельства активной деятельности фагов характерны для всех пар второй группы и отсутствуют для большинства пар первой группы. Возможно, активность фагов в ряде случаев действительно может повышать вероятность крупных геномных перестроек.

Таким образом, проведенный анализ позволяет заключить, что наблюдаемые различия в относительной частоте крупных и мелких геномных перестроек у разных прокариот не проявляют строгой корреляции с их таксономическим положением, обилием транспозонов и повторяющихся последовательностей, условиями обитания и общим темпом геномных перестроек. Это свидетельствует в пользу того, что наблюдаемые различия, скорее всего, объясняются простой случайностью (возможно, однако, что активность фагов в ряде случаев может повышать вероятность появления крупных перестроек). Данный вывод подкрепляется и результатами компьютерного моделирования, показывающими, что при одной и той же постоянной, изначально заданной вероятности крупных и мелких перестроек (причем крупные перестройки возможны, но менее вероятны, чем мелкие) может быть полностью воспроизведен весь наблюдаемый диапазон изменчивости по соотношению крупных и мелких перестроек в исследованных парах прокариотических геномов.

БЛАГОДАРНОСТИ

Работа выполнена при поддержке Подпрограммы 2 Программы 25 Президиума РАН «Происхождение и эволюция биосферы» и Фонда содействия отечественной науке.

СПИСОК ЛИТЕРАТУРЫ

1. Захаров И.А., Валеев А.К. Количественный анализ эволюции геномов млекопитающих посредством сравнения генетических карт // Доклады АН СССР. 1988. Т.301. С.1213-1218.

2. Захаров И.А., Никифоров В.С., Степанюк Е.В. Измерение сходства порядков гомологичных генов// Генетика. 1991. Т.27. С. 367-369.

3. Захаров И.А., Никифоров В.С., Степанюк Е.В. Гомология и эволюция генных порядков: комбинаторная мера сходства групп синтении и моделирование эволюционного процесса // Генетика. 1992. Т. 28. С. 77-81.

4. Захаров И.А., Никифоров В.С., Степанюк Е.В. Гомология и эволюция генных порядков: простой метод проверки гипотез о характере этой эволюции // Генетика. 1996. Т. 32. С. 128-132.

5. Захаров И.А., Никифоров В.С., Степанюк Е.В. Гомология и эволюция генных порядков: моделирование и реконструкция эволюционного процесса. // Генетика. 1997. Т. 33. С. 31-39.

6. Захаров И.А., Марков А.В. Генные порядки в геномах альфапротеобактерий: сходство и эволюция // Генетика. 2005. Т. 41. № 12. С. 1624-1633.

7. Alm R.A., Ling L.S., Moir D.T., King B.L., Brown E.D., Doig P.C., Smith D.R., Noonan B., Guild B.C., deJonge B.L., Carmel G., Tummino P.J., Caruso A., Uria-Nickelsen M., Mills D.M., Ives C., Gibson R., Merberg D., Mills S.D., Jiang Q., Taylor D.E., Vovis G.F., Trust T.J. Genomic-sequence comparison of two unrelated isolates of the human gastric pathogen Helicobacter pylori // Nature. 1999. V.397. № 6715. P. 176-180.

8. Blanchette M., Kunisawa T., Sankoff D. Gene order breakpoint evidence in animal mitochondrial phylogeny // J. Mol. Evol. 1999. V. 49. P. 193-203.

9. Blount Z.D., Grogan D.W. New insertion sequences of Sulfolobus: functional properties and implications for genome evolution in hyperthermophilic archaea // Mol. Microbiol. 2005. V. 55. № 1. P. 312-325.

10. Brinkman F.S.L., Blanchard J.L., Cherkasov A.,Av-Gay Y., Brunham R.C., Fernandez R.C., Finlay B.B., Otto S.P., Ouellette B.F.F., Keeling P.J., Rose A.M., Hancock R.E.W., Jones S.J.M. Evidence That Plant-Like Genes in Chlamydia Species Reflect an Ancestral Relationship between Chlamydiaceae, Cyanobacteria, and the Chloroplast // Genome Research. 2002. V. 12. P. 1159-1167.

11. Brugger K., Redder P., She Q., Confalonieri F., Zivanovic Y., Garrett R.A. Mobile elements in archaeal genomes // FEMS Microbiol Lett. 2002. V. 206. № 2. P. 131-141.

12. Bourque G., Pevzner P.A. Genome-Scale Evolution: Reconstructing Gene Orders in the Ancestral Species // Genome Research. 2002. V. 12. № 1. P. 26-36.

13. Coenye T., Vandamme P. Organisation of the S10, spc and alpha ribosomal protein gene clusters in prokaryotic genomes // FEMS Microbiology Letters. 2005. V. 242. P. 117–126.

14. Dalevi D.A., Eriksen N., Eriksson K., Andersson S.G. Measuring genome divergence in bacteria: a case study using chlamydian data // J. Mol. Evol. 2002. V. 55. № 1. P. 24-36.

15. Dufresne A., Salanoubat M., Partensky F., Artiguenave F., Axmann I.M., Barbe V., Duprat S., Galperin M.Y., Koonin E.V., Le Gall F., Makarova K.S., Ostrowski M., Oztas S., Robert C., Rogozin I.B., Scanlan D.J., Tandeau de Marsac N., Weissenbach J., Wincker P., Wolf Y.I., Hess W.R. Genome sequence of the cyanobacterium Prochlorococcus marinus SS120, a nearly minimal oxyphototrophic genome // Proc. Natl. Acad. Sci. USA. 2003. V. 100. № 17. P. 10020-10025.

16. Durand D., Sankoff D. Tests for gene clustering // J. Comput. Biol. 2003. V. 10. № 3-4. P. 453-482.

17. Ehrlich J., Sankoff D., Nadeau J.H. Synteny conservation and chromosome rearrangements during mammalian evolution // Genetics. 1997. V. 147. № 1. P. 289-296.

18. Eisen J.A., Heidelberg J.F., White O., Salzberg S.L. Evidence for symmetric chromosomal inversions around the replication origin in bacteria // Genome Biol. 2000. V. 1. № 6. P. RESEARCH0011.

19. Grigoriev A. Graphical genome comparison: rearrangements and replication origin of Helicobacter pylori // Trends Genet. 2000. V. 16. № 9. P. 376-378.

20. Hauth A.M., Maier U.G., Lang B.F., Burger G. The Rhodomonas salina mitochondrial genome: bacteria-like operons, compact gene arrangement and complex repeat region // Nucleic Acids Research. 2005. V. 33. № 14. P. 4433–4442.

21. Hughes D. Evaluating genome dynamics: the constraints on rearrangements within bacterial genomes // Genome Biol. 2000. V. 1. № 6. P. REVIEWS0006.

22. Huynen M.A., Snel B., Bork P. Inversions and the dynamics of eukaryotic gene order // Trends Genet. 2001. V. 17. № 6. P. 304-306.

23. Korbel J.O., Snel B., Huynen M.A., Bork P. SHOT: a web server for the construction of genome phylogenies // Trends Genet. 2002. V. 18. P. 158-162.

24. Maeder D.L., Weiss R.B., Dunn D.M., Cherry J.L., Gonzalez J.M., DiRuggiero J., Robb F.T. Divergence of the hyperthermophilic archaea Pyrococcus furiosus and P. horikoshii inferred from complete genomic sequences // Genetics. 1999. V. 152. № 4. P. 1299-1305.

25. Ogata H., Renesto P., Audic S., Robert C., Blanc G., Fournier P.E., Parinello H., Claverie J.M., Raoult D. The genome sequence of Rickettsia felis identifies the first putative conjugative plasmid in an obligate intracellular parasite // PLoS Biol. 2005. V. 3. № 8. P. e248.

26. Palenik B., Brahamsha B., Larimer F.W., Land M., Hauser L., Chain P., Lamerdin J., Regala W., Allen E.E., McCarren J., Paulsen I., Dufresne A., Partensky F., Webb E.A., Waterbury J. The genome of a motile marine Synechococcus // Nature. 2003. V. 424. № 6952. P. 1037-1042.

27. Read T.D., Brunham R.C., Shen C., Gill S.R., Heidelberg J.F., White O., Hickey E.K., Peterson J., Utterback T., Berry K., Bass S., Linher K., Weidman J., Khouri H., Craven B., Bowman C., Dodson R., Gwinn M., Nelson W., DeBoy R., Kolonay J., McClarty G., Salzberg S.L., Eisen J., Fraser C.M. Genome sequences of Chlamydia trachomatis MoPn and Chlamydia pneumoniae AR39 // Nucleic Acids Res. 2000. V. 28. № 6. P. 1397-1406.

28. Rogozin I.B., Makarova K.S., Murvai J., Czabarka E., Wolf Y.I., Tatusov R.L., Szekely A., Koonin E.V. Connected gene neighborhoods in prokaryotic genomes // Nucleic Acids Research. 2002. V. 30. № 10. P. 2212-2223.

29. Ruepp A., Graml W., Santos-Martinez M.L., Koretke K.K., Volker C., Mewes H.W., Frishman D., Stocker S., Lupas A.N., Baumeister W. The genome sequence of the thermoacidophilic scavenger Thermoplasma acidophilum // Nature. 2000. V. 407. № 6803. P. 508-513.

30. Sankoff D. Short inversions and conserved gene clusters // Bioinformatics. 2002. V. 18. № 10. P. 1305-1308.

31. Sankoff D. Rearrangements and chromosomal evolution // Current Opinion in Genetics and Development. 2003. V. 13. P. 583–587.

32. Sankoff D., Leduc G., Antoine N., Paquin B., Lang B.F., Cedergren F. Gene order comparisons for phylogenetic inference: Evolution of mitochondrial genome // Proc. Natl. Acad. Sci. USA. 1992. V.89. P.6575-6579.

33. Sankoff D., Nadeau J.H. Chromosome rearrangements in evolution: From gene order to genome sequence and back // Proc. Nat. Acad. Sci. USA. 2003. V. 100. № 20. P. 11188-11189.

34. She Q., Singh R.K., Confalonieri F., Zivanovic Y., Allard G., Awayez M.J., Chan-Weiher C.C., Clausen I.G., Curtis B.A., De Moors A., Erauso G., Fletcher C., Gordon P.M., Heikamp-de Jong I., Jeffries A.C., Kozera C.J., Medina N., Peng X., Thi-Ngoc H.P., Redder P., Schenk M.E., Theriault C., Tolstrup N., Charlebois R.L., Doolittle W.F., Duguet M., Gaasterland T., Garrett R.A., Ragan M.A., Sensen C.W., Van der Oost J. The complete genome of the crenarchaeon Sulfolobus solfataricus P2 // Proc. Nat. Acad. Sci. USA. 2001. V. 98. № 14. P. 7835-7840.

35. Suyama M., Bork P. Evolution of prokaryotic gene order: genome rearrangements in closely related species // Trends in Genetics. 2001. V. 17. № 1. P. 10-13.

36. Tamames J. Evolution of gene order conservation in prokaryotes // Genome Biology. 2001. V. 2. № 6. P. 0020.1–0020.11.

37. Tang J., Moret B.M.E. Scaling up accurate phylogenetic reconstruction from gene-order data // Bioinformatics. 2003. V. 19. Suppl. 1. P. i305–i312.

38. Tillier E.R., Collins R.A. Replication orientation affects the rate and direction of bacterial gene evolution // J. Mol. Evol. 2000a. V. 51. № 5. P. 459-463.

39. Tillier E.R., Collins R.A. Genome rearrangement by replication-directed translocation // Nat. Genet. 2000b. V. 26. № 2. P. 195-197.

40. Trachtulec Z., Forejt J. Synteny of orthologous genes conserved in mammals, snake, fly, nematode, and fission yeast // Mamm. Genome. 2001. V. 3. № 12. P. 227 -231.

41. Wiedenheft B., Stedman K., Roberto F., Willits D., Gleske A.K., Zoeller L., Snyder J., Douglas T., Young M. Comparative genomic analysis of hyperthermophilic archaeal Fuselloviridae viruses // J. Virol. 2004. V. 78. № 4. p. 1954-1961.

42. Wolf Y.I., Rogozin I.B., Kondrashov A.S., Koonin E.V. Genome alignment, evolution of prokaryotic genome organization, and prediction of gene function using genomic context // Genome Res. 2001. V. 11. № 3. P. 356-372.

43. Wu M., Sun L.V., Vamathevan J., Riegler M., Deboy R., Brownlie J.C., McGraw E.A., Martin W., Esser C., Ahmadinejad N., Wiegand C., Madupu R., Beanan M.J., Brinkac L.M., Daugherty S.C., Durkin A.S., Kolonay1 J.F., Nelson W.C., Mohamoud Y., Lee P., Berry K., Young M.B., Utterback T., Weidman J., Nierman W.C., Paulsen I.T., Nelson K.E., Tettelin H., O’Neill S.L., Eisen J.A. Phylogenomics of the reproductive parasite Wolbachia pipientis wMel: a streamlined genome overrun by mobile genetic elements // PLoS Biol. 2004. V.2. № 3. P. 327-341.

44. Zakharov I.A. Measurements of similarity of synteny groups and an analysis of genome rearrangements in the evolution of mammals // Bioinformatics and Genome Research. Proceedings of the 3d International Conference. Ed. H.A.Lim, C.R.Cantor. Singapore. World Scientific Publ.Co. 1995. P.107-113.

45. Zivanovic Y, Lopez P, Philippe H, Forterre P. Pyrococcus genome comparison evidences chromosome shuffling-driven evolution // Nucleic Acids Res. 2002. V. 30. № 9. P. 1902-1910.

Таблица 1. Геномы прокариот, использованные в работе

Вид Штамм Размергенома (п.н.) Систематика Обозначение Код в генбанке
Wolbachia pipientis endosymbiont of D. melanogaster 1267782 Alphaproteobacteria Rickettsiales Wolbachieae wMe NC_002978
W. sp. endosymbiont of Brugia malayi str. TRS 1080084 - wBm NC_006833
Rickettsia conorii str. Malish 7 1268755 Alphaproteobacteria Rickettsiales Rickettsieae ric NC_003103
R. prowazekii str. Madrid E 1111523 - rip NC_000963
R. felis URRWXCal2 1485148 - rif NC_007109
Anaplasma marginale str. St. Maries 1197687 Alphaproteobacteria Rickettsiales Anaplasmataceae ana NC_004842
Ehrlichia ruminantum str. Welgevonden 1512977 - her NC_006832
Escherihia coli CFT073 5231428 Gammaproteobacteria Enterobacteriales Enterobacteriaceae eco NC_004431
Salmonella enterica subsp. enterica serovar. Typhi Ty2 4791961 - sal NC_004631
Shigella flexneri 2a str. 301 4607203 - shg NC_004337
Yersinia pestis KIM 4600755 - yep NC_004088
Pasteurella multocida subsp. Multocida Pm70 2257487 Gammaproteobacteria Pasteurellales Pasteurellaceae pas NC_002663
Chlamydia trachomatis D/UW-3/CX 1042519 Chlamydiae Chlamydiales Chlamydiaceae clt NC_000117
Chlamydophila pneumoniae AR39 1229853 - cpp NC_002179
Corynebacterium glutamicum ATCC 13032 3309401 Actinobacteria Actinobacteridae Actinomycetales Corynebacterineae Corynebacteriaceae cor NC_003450
Mycobacterium leprae TN 3268203 Actinobacteria Actinobacteridae Actinomycetales Corynebacterineae Mycobacteriaceae myl NC_002677
M. tuberculosis CDC1551 4403837 - myt NC_002755
Synechococcus sp. WH 8102 2434428 Cyanobacteria Chroococcales syn NC_005070
Prochlorococcus marinus MIT 9313 2410873 Cyanobacteria Prochlorales Prochlorococcaceae pro NC_005071
Clostridium perfringens 13 3031430 Firmicutes Clostridia Clostridiales Clostridiaceae clp NC_003366
C. acetobutylicum ATCC 824 3940880 - cla NC_003030
Streptococcus pneumoniae R6 2038615 Firmicutes Lactobacillales Streptococcaceae spn NC_003098
S. pyogenes SSI-1 1894275 - spy NC_004606
Bacillus halodurans C-125 4202352 Firmicutes Bacillales Bacillaceae bah NC_002570
B. subtilis subsp. subtilis 168 4214630 - bas NC_000964
Listeria innocua Clip11262 3011208 Firmicutes Bacillales Listeriaceae lii NC_003212
Methanosarcina acetivorans C2A 5751492 Euryarchaeota Methanomicrobia Methanosarcinales Methanosarcinaceae msa NC_003552
M. mazei Go1 4096345 - msm NC_003901
Thermoplasma acidophilum DSM 1728 1564906 Euryarchaeota Thermoplasmata Thermoplasmatales Thermoplasmataceae tpa NC_002578 NC_002578
T. volcanicum GSS1 1584804 - tpv NC_002689
Pyrococcus furiosus DSM 3638 1908256 Euryarchaeota Thermococci Thermococcales Thermococcaceae pyf NC_003413
P. horikoshii OT3 1738505 - pyh NC_000961
Sulfolobus solfataricus P2 2992245 Crenarchaeota Thermoprotei Sulfolobales Sulfolobaceae sus NC_002754
S. tokodaii 7 2694756 - sut NC_003106

Таблица 2. Результаты сравнения генных порядков в парах близкородственных видов прокариот. n — число использованных для сравнения гомологичных генов.

Пара n S L 1-6•L/n
wMe/wBm 155 0.426 25.4 0.017
ana/ehr 155 0.742 15.1 0.415
ric/rip 155 0.968 0.76 0.971
ric/rif 155 0.910 12.7 0.507
eco/sal 155 0.813 15.4 0.404
eco/shg 155 0.877 2.70 0.895
eco/yep 154 0.773 16.2 0.369
eco/pas 140 0.279 21.2 0.091
clt/cpp 102 0.706 9.33 0.451
myt/myl 113 0.664 15.4 0.182
myt/cor 110 0.727 13.9 0.242
syn/pro 123 0.805 14.5 0.293
cla/clp 110 0.573 12.9 0.296
spn/spy 104 0.327 13.4 0.227
bah/bas 124 0.782 12.9 0.376
bah/lii 122 0.598 17.7 0.130
msa/msm 160 0.875 4.74 0.822
tpa/tpv 159 0.667 15.6 0.411
pyf/pyh 159 0.616 13.6 0.487
sus/sut 160 0.806 22.6 0.153

 

 

Рекламные ссылки