TopHat (биоинформатика) - TopHat (bioinformatics)

TopHat это открытый исходный код биоинформатика инструмент для выравнивания производительности считывания секвенирования кДНК дробовика, генерируемого технологии транскриптомики (например. РНК-Seq ) с помощью Галстук-бабочка сначала, а затем сопоставление с эталонный геном обнаружить сайты сплайсинга РНК de novo.^[1] TopHat выравнивает чтение RNA-Seq с геномами размером с млекопитающее.^[2]

История

TopHat был первоначально разработан в 2009 году компанией Коул Трапнелл, Лиор Пахтер и Стивен Зальцберг на математическом факультете, Калифорнийский университет в Беркли и Центр биоинформатики и вычислительной биологии при Университет Мэриленда, Колледж-Парк.^[1] Позднее Трапнелл перешел в отдел геномных наук в Вашингтонский университет. TopHat - результат совместных усилий Коула Трапнелла из Вашингтонского университета и Дэвана Кима и Стивена Зальцберга из Центра вычислительной биологии в Университет Джона Хопкинса которые вместе в 2013 году также придумали TopHat2, который выполняет точное выравнивание транскриптомы при наличии вставок, делеций и слияний генов.^[3]

Использует

TopHat используется для выравнивания чтения из эксперимента RNA-Seq. Это алгоритм чтения-отображения, который сопоставляет чтение с эталонным геномом. Это полезно, потому что не нужно полагаться на известные места монтажа.^[1] TopHat можно использовать с Смокинг конвейер и часто используется с Галстук-бабочка.

Преимущества недостатки

Преимущества

Когда TopHat только вышел, он был быстрее предыдущих систем. Было выполнено более 2,2 миллиона операций чтения в час процессора. Такая скорость позволила пользователю обработать весь эксперимент RNA-Seq менее чем за день, даже на стандартном настольном компьютере.^[1] Вначале Tophat использует Bowtie для анализа считываний, но затем делает больше для анализа считываний, охватывающих соединения экзон-экзон. Если вы используете TopHat для данных RNA-Seq, вы получите больше чтения, сопоставленное с эталонным геномом.^[4]

Еще одно преимущество TopHat заключается в том, что ему не нужно полагаться на известные сайты сплайсинга при выравнивании считываний с эталонным геномом.^[1]

Недостатки

TopHat практически не требует обслуживания и поддержки, а также содержит ошибки программного обеспечения, которые потребовали исправления стороннего программного обеспечения для постобработки.^[5] Он был заменен HISAT2, который является более эффективным и точным и обеспечивает те же основные функции (сплайсинговое выравнивание считываний RNA-Seq).^[2]

Новые протоколы теперь более эффективны по сравнению с TopHat, такие как запонки, STAR и limma.

Это пример конвейера для рабочего процесса RNA-seq с использованием STAR и Limma. Этот конкретный конвейер более эффективен, чем тот, который использует TopHat.

Смотрите также

внешняя ссылка

Страница TopHat в Центре вычислительной биологии JHU

[Trapnell_2009-1] а ^б ^c ^d ^е Трапнелл С., Пахтер Л., Зальцберг С.Л. (май 2009 г.). «TopHat: обнаружение сплайсинговых соединений с помощью RNA-Seq». Биоинформатика. 25 (9): 1105–11. Дои:10.1093 / биоинформатика / btp120. ЧВК 2672628. PMID 19289445.

[:0-2] а ^б "TopHat". ccb.jhu.edu. Получено 2018-04-17.

[tophat2-3] Ким Д., Пертеа Г., Трапнелл С., Пиментел Х, Келли Р., Зальцберг С.Л. (апрель 2013 г.). «TopHat2: точное выравнивание транскриптомов при наличии вставок, делеций и слияний генов». Геномная биология. 14 (4): R36. Дои:10.1186 / gb-2013-14-4-r36. ЧВК 4053844. PMID 23618408.

[4] "Bowtie & Tophat". www.biostars.org. Получено 2018-04-24.

[5] Брюффер К., Зааль Л.Х. (май 2016 г.). «TopHat-Recondition: постпроцессор для несопоставленных чтений TopHat». BMC Bioinformatics. 17 (1): 199. Дои:10.1186 / с12859-016-1058-х. ЧВК 4855331. PMID 27142976.

[1]

[2]

[3]

[4]

[5]

Биоинформатика
Базы данных	Базы данных последовательностей: GenBank, Европейский архив нуклеотидов и Банк данных ДНК Японии Вторичные базы данных: UniProt, база данных белковых последовательностей, сгруппированных вместе Swiss-Prot, TrEMBL и Информационный ресурс о белках Другие базы данных: Банк данных белков, Ансамбль и ИнтерПро Специализированные геномные базы данных: СМЕЛЫЙ, База данных генома Saccharomyces, FlyBase, VectorBase, WormBase, База данных генома крысы, PHI-база, Информационный ресурс об арабидопсисе и Информационная сеть по рыбкам данио
Программного обеспечения	ВЗРЫВ Галстук-бабочка Clustal EMBOSS HMMER МЫШЦЫ SAMtools Набор SOAP TopHat
Другой	Сервер: ExPASy Онтология: Генная онтология Розалинд (образовательная платформа)
Учреждения	Broad Institute Китайский национальный генетический банк (CNGB) Кафедра вычислительной биологии (CBD) Microsoft Research - Центр вычислительной и системной биологии Университета Тренто (COSBI) Центр баз данных по наукам о жизни (DBCLS) Банк данных ДНК Японии (DDBJ) Европейский институт биоинформатики (EMBL-EBI) Европейская лаборатория молекулярной биологии (EMBL) Институт Флэтайрон Институт Дж. Крейга Вентера (JCVI) Институт молекулярной клеточной биологии и генетики Макса Планка (MPI-CBG) Национальный центр биотехнологической информации США (NCBI) Японский институт генетики Нидерландский центр биоинформатики (NBIC) Филиппинский центр генома (PGC) Scripps Research Швейцарский институт биоинформатики (SIB) Институт Wellcome Sanger Институт Уайтхеда
Организации	Африканское общество биоинформатики и вычислительной биологии (ASBCB) Ресурс по биоинформатике Австралии (EMBL-AR) Европейская сеть молекулярной биологии (EMBnet) Сотрудничество с международными базами данных нуклеотидных последовательностей (INSDC) Международное общество биодокументации (ЭТО Б) Международное общество вычислительной биологии (ISCB) Студенческий совет (ISCB-SC) Институт геномики и интегративной биологии (CSIR-IGIB) Японское общество биоинформатики (JSBi)
Встречи	Базельская конференция по вычислительной биологии ([ДО Н.Э²]) Европейская конференция по вычислительной биологии (ECCB) Интеллектуальные системы для молекулярной биологии (ISMB) Международная конференция по биоинформатике (InCoB) Конференция ISCB Africa ASBCB по биоинформатике Тихоокеанский симпозиум по биокомпьютингу (PSB) Исследования в области вычислительной молекулярной биологии (РЕКОМБ)
Форматы файлов	Формат CRAM Формат FASTA Формат FASTQ Формат NeXML Формат Nexus Формат Pileup Формат SAM Стокгольмский формат
похожие темы	Вычислительная биология Список биобанков Список биологических баз данных Молекулярная филогенетика Последовательность действий База данных последовательностей Выравнивание последовательности
Категория Commons