Научные проекты

Геномное секвенирование Aholeplasma laidlawii

Aholeplasma laidlawii – представитель семейства микоплазм, отличающийся рядом специфических особенностей, значительно отличающих данный организм от других известных молликут.

В данной работе впервые получена полная последовательность генома Aholeplasma laidlawii PG8 протяженностью 1 496 992 п.о. и осуществлена его аннотация. Так же получен полный протеом Aholeplasma laidlawii PG8, в составе которого идентифицирован 521 белок, что составляет 44% от количества предсказанных ОРС. Впервые полученный полный протеом Aholeplasma laidlawii PG8 в нашем исследовании был использован в качестве основного инструмента протеогеномного профилирования исследуемого микроорганизма, позволяющего верифицировать геномную аннотацию, а так же подтвердить функциональную активность специфических метаболических путей.

Геном Aholeplasma laidlawii PG8 стал первым полноразмерным геномом бактерии, полностью выполненным в Российской Федерации.

Complete genome and proteome of Acholeplasma laidlawii. Lazarev VN, Levitskii SA, Basovskii YI, Chukin MM, Akopian TA, Vereshchagin VV, Kostrjukova ES, Kovaleva GY, Kazanov MD, Malko DB, Vitreschak AG, Sernova NV, Gelfand MS, Demina IA, Serebryakova MV, Galyamina MA, Vtyurin NN, Rogov SI, Alexeev DG, Ladygina VG, Govorun VM.
J Bacteriol. 2011 Sep;193(18):4943-53.

Геномное секвенирование Spiroplasma melliferum

Интерес к структурно-функциональной организации генома спироплазм обусловлен их значением для сельского хозяйства развитых стран. Известно, что три вида спироплазм - S. citri, S. kunkelii и S. phoeniceum - поражают сельскохозяйственные растения, а S. melliferum является причиной массовой гибели медоносных пчел. Понимание механизмов взаимодействия спироплазм с организмами-хозяевами и идентификация их факторов вирулентности является черезвычайно важной задачей.

В данной работе впервые получена частичная последовательность генома S. melliferum KC3 протяженностью 1260174 пар нуклеотидов, что составляет 88% от размера полного генома, предсказанного в результате физического картирования, и осуществлена его аннотация. Так же получен полный протеом S. melliferum KC3, в составе которого идентифицирован 521 белок, что составляет 44% от количества предсказанных ОРС. Так же в работе впервые представлен метаболом данной бактерии.

lpgi15На основе данных секвенирования были получены сведения о мобильных элементах в составе генома спироплазмы S. melliferum KC3. Показано, что мобильные элементы организуются из из генов, кодирующих фаговых белки, фрагменты либо полные последовательности транспозаз и смысловых белков, характерных для представителей семейства плектовирусов и являющихся факторами вирулентности. Примечательно, что подобные конструкции обладают значительным потенциалом к горизонтальному переносу

Application of Spiroplasma melliferum proteogenomic profiling for the discovery of virulence factors and pathogenicity mechanisms in host-associated spiroplasmas. Alexeev D, Kostrjukova E, Aliper A, Popenko A, Bazaleev N, Tyakht A, Selezneva O, Akopian T, Prichodko E,
Kondratov I, Chukin M, Demina I, Galyamina M, Kamashev D, Vanyushkina A, Ladygina V, Levitskii S, Lazarev V, Govorun V.
J Proteome Res. 2012 Jan 1;11(1):224-36.

Метагеном природного водоема Кротовая ляга

в сотрудничестве с ИЦиГ СО РАН.

lpgi16Кротовая Ляга - водоем природного происхождения, привлекший внимание исследователей аномально высокой скоростью деградации биополимеров, попадающих в воду. В качестве исходного материала в исследовании использовались пробы грунта Кротовьей ляги. В ходе проекта была разработана методика выделения ДНК из придонных слоев грунта. На основе полученного образца ДНК была получена геномная библиотека с размером фрагментов 2000 пар нуклеотидов. На текущий момент библиотека прочитана в размере 8000 образцов с помощью секвенирования по методу Сэнгера с детекцией результатов в режиме капиллярного электрофореза. Так же подготовлена и прочитана фрагментная библиотека в формате полутора полных слайдов генетической платформы SOLiD™ 4 System (Applied Biosystems). Полученные данные переданы в ИЦиГ СО РАН для проведения дальнейшего анализа, в ходе которого в числе прочих значимых результатов в генном составе анализируемого образца обнаружено значительное количество и разнообразие генов, кодирующих различные ферменты в составе метаболических путей деградации биополимеров, в том числе семейства целлюлаз.

Компьютерный анализ метагеномных данных - предсказание количественной величины специфической активности белков. В.А. Иванисенко, П.С. Деменков, С.С. Пинтус, Т.В. Иванисенко, Н.Л. Подколодный, Л.Н. Иванисенко, Н.И. Гончарова, А. С. Розанов, А.В. Брянская, Е.С. Кострюкова, С.А. Левицкий, О.В. Селезнева, М.М. Чукин, А.К. Ларин, И.Г. Кондратов, В.Н. Лазарев, С.Е. Пельтек, В.М. Говорун, академик РАН Н.А. Колчанов.
Доклады академии наук, 2012, том 443, №2, с. 1-5.

«Русский метагеном»

в рамках российского метагеномного консорциума (www.metagenome.ru)

Нормальная микрофлора (нормофлора, микробиота) человека имеет чрезвычайно важное общебиологическое значение. Сформировано представление, согласно которому кишечный микробиоценоз представляет собой высокоорганизованную систему, реагирующую качественными и количественными сдвигами на динамическое состояние организма человека в различных условиях жизнедеятельности, здоровья и болезни.
В ходе реализации проекта с использованием генетической платформы SOLiD™ 4 System (Applied Biosystems) выполнено глубокое секвенирование свыше 150 образцов ДНК, выделенных из кала здоровых людей, проживающих на территории Российской Федерации – как в крупных городах (Москва, Санкт-Петербург, Ростов-на-Дону, Саратов, Новосибирск), так и в сельской местности (Омская область, Тыва, Хакасия, Татарстан).
Нуклеотидные последовательности, полученные в ходе эксперимента для каждого из образцов, были картированы на известные геномы кишечных бактерий, после чего образцы сравнивались между собой статистическими методами по таксономическим единицам и функциональным группам генов. Для вычленения особенностей метагенома жителей Российской Федерации в мировом контексте, полученные результаты были подвергнуты сравнительному анализу вместе с существующими данными для взрослых жителей Западной Европы (Дания, n=85), Северной Америки (США, n=137), коренных жителей Южной Америки (Венесуэла, n=10) и Африки (Малави, n=5).
В целом, полученные результаты соответствуют данным, представленным в аналогичных европейских и американских исследованиях. Из 86 микробных родов, представленных в базе данных, 61 род, как было обнаружено, присутствует хотя бы в одном из исследованных образцов. Основными количественными доминантами стали представители родов Prevotella, Bacteroides, Faecalibacterium, Roseburia, Lachnospiraceae, Coprococcus, Blautia, Ruminococcus. В свою очередь, их совокупность составляет более 80% общей относительной представленности во всех российских образцах.
В то же время к ярким особенностям российской выборки относится наличие уникальных преобладающих сочетаний микроорганизмов, ранее не описанных в мировой литературе. В состав подобных кластеров входят представители родов Prevotella, Lachnospiraceae, Coprococcus, Faecalibacterium, Roseburia, Ruminococcus и Bifidobacterium. Важно, что они обнаруживаются у жителей отдаленных регионов Российской Федерации, в отличие от жителей крупных городов, качественный и количественный состав микробиоты которых в значительной степени схож с данными, получаемыми для жителей стран Европы. Сходство между образцами внутри каждого кластера значительно варьируется в зависимости от выбора метрики: их бактериальные соотношения схожи, если основываться на корреляции по Спирмену (0,93 ± 0,07 SD), однако, при использовании UniFrac расхождения достаточно высоки (0.04±0.03). Подобное наблюдение может объясняться значительным сходством качественного состава образца при достаточно серьезных различиях на количественном уровне, что характерно для семейных случаев, а так же анализа образцов из закрытых популяций.

Malina - a web-based tool for visual analytics of human gut microbiota whole-genome metagenomic reads. Alexander V Tyakht, Anna S Popenko, Maxim S Belenikin, Ilya A Altukhov, Alexander V Pavlenko, Elena S Kostryukova, Oksana V Selezneva, Andrei V Larin, Irina Y Karpova, Dmitry G Alexeev. Source Code Biol Med. (2012) 7(1):13.

Транскриптомное профилирование мха Physcomitrella patens.

в сотрудничестве с ИБХ РАН

lpgi17Исследование посвящено системному анализу процессов пептидогенеза в растительных клетках. Одним из важных этапов системного анализа пептидогенеза, протекающего в растительных клетках является анализ транскрипции генов, в том числе тех, которые кодируют белки прекурсоры пептидов. В ходе реализации проекта был проведен анализ транскриптома клеток гаметофоров, протонемы и протопластов, выделяемых из протонемы мха P. patens.
Секвенирование проводилось с использование генетической платформы SOLiD™ 4 System (Applied Biosystems). Образцы были проанализированы в нескольких повторах - гаметофоры: два биологических и два технических, протонема и протопласты: по три биологических и два технических повтора. В итоге получили 173, 197 и 204 миллионов ридов для образцов гаметофоров, протонемы и протопластов, соответственно. Значения корреляции Спирмена между измерениями экспрессии генов методом ПЦР и РНК-секвенирования составило 0.7, 0.7 и 0.8 для образцов гаметофоров, протонемы и протопластов, соответственно.
Мы оценили уровень экспрессии генов белков-прекурсоров в сравнении с остальными генами. Распределение уровней экспрессии генов во всех трех состояниях оказалось близким к логнормальному, причем гены белков-прекурсоров являются высокоэкпрессируемыми. Это подтверждается статистическим тестом Манна-Уитни-Уилкоксона: гаметофоры (W = 263423.5, p-value < 2.2e-16), протонема (W = 447475.5, p-value < 2.2e-16), протопласты(W = 9291323, p-value < 2.2e-16). Следует отметить, что наблюдается снижение общего уровня экспрессии генов в протопластах (W = 64461020, p-value < 2.2e-16).
Полученные в результате реализации проекта данные по транскрипции генов в разных тканях мха, совместно с данными по протеому и пептидому могут быть использованы для построения системных моделей процессов пептидогенеза.

Новые кандидатные маркеры колоректального рака по данным полногеномного метилирования

lpgi18Метилирование ДНК является важным механизмом регуляции работы генетического аппарата в нормальном и в патологических состояниях клеток. С использованием биочипа HumanMethylation450 для сканера iScan Plus (Illumina) был проанализирован статус метилирования 485577 сайтов ДНК в 22 образцах аденокарциномы толстой кишки и 22 биоптатах нормального эпителия толстой кишки от тех же пациентов.
В кандидатную панель отбирали дифференциально метилированные CpG сайты, удовлетворяющие одновременно следующим критериям: разница средних значений степеней метилирования в группах > 40% FDR p<0.05; разброс степеней метилирования в группе нормы < 25%; отсутствие пересечения крайних значений метилирования в сравниваемых группах (InformationGain =1).
После применения вышеописанного алгоритма в предварительную панель вошло 14 CpG сайтов. Обучение классификационной модели на основе линейной регрессии и дополнительный отбор атрибутов были выполнены на исходной выборке в программе RapidMiner 5.1. В итоговую модель вошли 3 наиболее информативных сайта метилирования, расположенные в генах: ADHFE1(cg01588438), COL4A1 (cg27546237) и C1orf70 (cg15487867). Далее была осуществлена валидация модели на данных по метилированию, предоставленных консорциумом Cancer Genome Atlas (247 образцов: 205 – аденокарцинома, 42 – нормальная ткань). Результаты независимой валидации теста: диагностическая чувствительность - 98.09% и специфичность 97.37%. Данные по ассоциации с колоректальным раком гена C1orf70 (cg15487867) получены впервые. Для генов ADHFE1(cg01588438) и COL4A1 (cg27546237) такие ассоциации были показаны ранее, но они не анализировались в качестве кандидатных маркеров для диагностики. Полученные показатели классификационной модели, верифицированные на независимой выборке, говорят о диагностическом потенциале отобранных маркеров.