Clustal


Clustal Omega
Скриншот программы Clustal Omega
Тип Биоинформатика
Автор Desmond G. Higgins[d]
Разработчик Des Higgins, Fabian Sievers, David Dineen и Andreas Wilm (Conway Institute, UCD)
Написана на C++
Операционная система UNIX, Linux, Mac, Windows
Последняя версия 1.2.2 (1.07.2016)
Лицензия GNU GPL 2
Сайт clustal.org/omega/
ClustalW/ClustalX
Скриншот программы ClustalW/ClustalX
Тип Биоинформатика
Автор Desmond G. Higgins[d]
Разработчик Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD)
Написана на C++
Операционная система UNIX, Linux, Mac, Windows
Последняя версия 2.1 (17.11.2010)
Лицензия GNU GPL 2
Сайт clustal.org

Clustal (англ. Cluster alignment) — одна из самых широко используемых компьютерных программ для множественного выравнивания нуклеотидных и аминокислотных последовательностей[1].

Clustal использует метод попарного прогрессивного выравнивания.

Программа представлена в трех версиях:

  • ClustalW — с интерфейсом командной строки[2].
  • ClustalX — с графическим интерфейсом[3].
  • Clustal Omega — более современная версия программы, позволяющая выравнивать сотни последовательностей в течение нескольких часов и являющаяся одной из наиболее эффективных программ для множественного выравнивания по данным тестов производительности[4]. В этой разновидности используется только интерфейс командной строки.

Несмотря на то что ClustalW и ClustalX не были первыми инструментами для множественного выравнивания, они получили широкое распространение благодаря своей широкой доступности для персональных компьютеров и интуитивно понятному пользовательскому интерфейсу.

Clustal Omega

Все современные версии Clustal базируются на Clustal Omega (ClustalΩ). Clustal Omega предоставил новую систему оценки нуклеотидных последовательностей: сначала выравниваются наиболее схожие последовательности, постепенно переходя к наименее схожим, тем самым создавая глобальное выравнивание. Для проведения глобального выравнивания в этой программе необходимо иметь минимум три последовательности, для парного выравнивания можно использовать EMBOSS или LALIGN.

Алгоритм

Сначала ClustalΩ рассчитывает приблизительную матрицу расстояний одним из двух методов:

  • быстрый метод, который считает совпадение пар аминокислотных остатков или коротких нуклеотидных фрагментов (2-4 основания)
  • классический алгоритм попарного выравнивания последовательностей с аффинными штрафами за пропуски.

Затем методом присоединения соседей строится направляющее дерево, на котором и будет построена глобальная сеть выравниваний. Дерево укореняется методом средней точки (mid-point). [5]

Хотя другие программы для множественного выравнивания, основанные на методе согласованности (Probcons, T-Coffee, Probalign и MAFFT) превосходят по точности Clustal Omega, они используют больше оперативной памяти и медленнее чем Clustal.[6]

Clustal 2 (ClustalW/ ClustalX)

ClustalX - это версия ClustalW с графическим интерфейсом. В данном обновлении не были презентованы новые функции, однако были обновлены и улучшены старые версии, описанные выше.

ClustalX используется для следующих функций:

  • выполнить множественное выравнивание последовательностей
  • посмотреть на результаты выравнивания
  • внести правки, если это необходимо.[7]

ClustalX как и ClustalW хорошо скомпилированы для загрузки на всех операционных системах: Linux, Mac OS X, Windows (как XP так и Vista). Данное обновление стало наиболее удобным для пользователя, однако предыдущие версии все так же доступны для скачивания на сайте.


Примечания

  1. Frédéric Dardel, François Képès. Bioinformatics: Genomics and Post-Genomics. Wiley. 2006. p.54
  2. Larkin M.A., Blackshields G., Brown N.P., Chenna R., McGettigan P.A., McWilliam H., Valentin F., Wallace I.M., Wilm A., Lopez R., Thompson J.D., Gibson T.J., Higgins D.G. ClustalW and ClustalX version 2 (неопр.) // Bioinformatics. — 2007. — Т. 23, № 21. — С. 2947—2948. — doi:10.1093/bioinformatics/btm404. — PMID 17846036.
  3. Thompson J.D., Gibson T.J., Plewniak F., Jeanmougin F., Higgins D.G. The CLUSTAL_X windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools (англ.) // Nucleic Acids Research  (англ.) : journal. — 1997. — Vol. 25, no. 24. — P. 4876—4882. — doi:10.1093/nar/25.24.4876. — PMID 9396791.
  4. Sievers F., Wilm A., Dineen D.G., Gibson T.J., Karplus K., Li W., Lopez R., McWilliam H., Remmert M., Söding J., Thompson J.D., Higgins D.G. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega (англ.) // Mol Syst Biol 7 : journal. — 2011. — Vol. 7, no. 539. — doi:10.1038/msb.2011.75.
  5. Григорий Мавропуло-Столяренко, Александр Тулуб, Василий Стефанов. Биоинформатика. Учебник для академического бакалавриата. — Litres, 2021-04-01. — 253 с. — ISBN 978-5-04-028650-8.
  6. Fabiano Sviatopolk-Mirsky Pais, Patrícia de Cássia Ruy, Guilherme Oliveira, Roney Santos Coimbra. Assessing the efficiency of multiple sequence alignment programs // Algorithms for Molecular Biology : AMB. — 2014-03-06. — Т. 9. — С. 4. — ISSN 1748-7188. — doi:10.1186/1748-7188-9-4.
  7. Clustal X (англ.) ?. Evolution and Genomics. Дата обращения: 6 июня 2021.

Ссылки