TopHat (биоинформатика) - TopHat (bioinformatics)

TopHat это открытый исходный код биоинформатика инструмент для выравнивания производительности считывания секвенирования кДНК дробовика, генерируемого технологии транскриптомики (например. РНК-Seq ) с помощью Галстук-бабочка сначала, а затем сопоставление с эталонный геном обнаружить сайты сплайсинга РНК de novo.[1] TopHat выравнивает чтение RNA-Seq с геномами размером с млекопитающее.[2]

История

TopHat был первоначально разработан в 2009 году компанией Коул Трапнелл, Лиор Пахтер и Стивен Зальцберг на математическом факультете, Калифорнийский университет в Беркли и Центр биоинформатики и вычислительной биологии при Университет Мэриленда, Колледж-Парк.[1] Позднее Трапнелл перешел в отдел геномных наук в Вашингтонский университет. TopHat - результат совместных усилий Коула Трапнелла из Вашингтонского университета и Дэвана Кима и Стивена Зальцберга из Центра вычислительной биологии в Университет Джона Хопкинса которые вместе в 2013 году также придумали TopHat2, который выполняет точное выравнивание транскриптомы при наличии вставок, делеций и слияний генов.[3]

Использует

TopHat используется для выравнивания чтения из эксперимента RNA-Seq. Это алгоритм чтения-отображения, который сопоставляет чтение с эталонным геномом. Это полезно, потому что не нужно полагаться на известные места монтажа.[1] TopHat можно использовать с Смокинг конвейер и часто используется с Галстук-бабочка.

Преимущества недостатки

Преимущества

Когда TopHat только вышел, он был быстрее предыдущих систем. Было выполнено более 2,2 миллиона операций чтения в час процессора. Такая скорость позволила пользователю обработать весь эксперимент RNA-Seq менее чем за день, даже на стандартном настольном компьютере.[1] Вначале Tophat использует Bowtie для анализа считываний, но затем делает больше для анализа считываний, охватывающих соединения экзон-экзон. Если вы используете TopHat для данных RNA-Seq, вы получите больше чтения, сопоставленное с эталонным геномом.[4]

Еще одно преимущество TopHat заключается в том, что ему не нужно полагаться на известные сайты сплайсинга при выравнивании считываний с эталонным геномом.[1]

Недостатки

TopHat практически не требует обслуживания и поддержки, а также содержит ошибки программного обеспечения, которые потребовали исправления стороннего программного обеспечения для постобработки.[5] Он был заменен HISAT2, который является более эффективным и точным и обеспечивает те же основные функции (сплайсинговое выравнивание считываний RNA-Seq).[2]

Новые протоколы теперь более эффективны по сравнению с TopHat, такие как запонки, STAR и limma.

Это пример конвейера для рабочего процесса RNA-seq с использованием STAR и Limma. Этот конкретный конвейер более эффективен, чем тот, который использует TopHat.

Смотрите также

Рекомендации

  1. ^ а б c d е Трапнелл С., Пахтер Л., Зальцберг С.Л. (май 2009 г.). «TopHat: обнаружение сплайсинговых соединений с помощью RNA-Seq». Биоинформатика. 25 (9): 1105–11. Дои:10.1093 / биоинформатика / btp120. ЧВК  2672628. PMID  19289445.
  2. ^ а б "TopHat". ccb.jhu.edu. Получено 2018-04-17.
  3. ^ Ким Д., Пертеа Г., Трапнелл С., Пиментел Х, Келли Р., Зальцберг С.Л. (апрель 2013 г.). «TopHat2: точное выравнивание транскриптомов при наличии вставок, делеций и слияний генов». Геномная биология. 14 (4): R36. Дои:10.1186 / gb-2013-14-4-r36. ЧВК  4053844. PMID  23618408.
  4. ^ "Bowtie & Tophat". www.biostars.org. Получено 2018-04-24.
  5. ^ Брюффер К., Зааль Л.Х. (май 2016 г.). «TopHat-Recondition: постпроцессор для несопоставленных чтений TopHat». BMC Bioinformatics. 17 (1): 199. Дои:10.1186 / с12859-016-1058-х. ЧВК  4855331. PMID  27142976.

внешняя ссылка