Спиральный домен, содержащий 42B - Coiled-coil domain containing 42B

CFAP73
Идентификаторы
ПсевдонимыCFAP73, MIA2, CCDC42B, домен спиральной спирали, содержащий 42B, белок, ассоциированный с ресничками и жгутиками 73
Внешние идентификаторыMGI: 3779542 ГомолоГен: 53205 Генные карты: CFAP73
Расположение гена (человек)
Хромосома 12 (человек)
Chr.Хромосома 12 (человек)[1]
Хромосома 12 (человек)
Геномное расположение CFAP73
Геномное расположение CFAP73
Группа12q24.13Начните113,149,858 бп[1]
Конец113,159,276 бп[1]
Ортологи
ВидыЧеловекМышь
Entrez
Ансамбль
UniProt
RefSeq (мРНК)

NM_001144872

NM_001195094

RefSeq (белок)

NP_001138344

NP_001182023

Расположение (UCSC)Chr 12: 113.15 - 113.16 МбChr 5: 120,63 - 120,63 Мб
PubMed поиск[3][4]
Викиданные
Просмотр / редактирование человекаПросмотр / редактирование мыши

Домен со спиральной спиралью, содержащий белок 42B, также известен как CCDC42B, это белок кодируется белок-кодирующим ген CCDC42B.[5]

Locus

CCDC42B ген расположен на плюсовой цепи хромосома 12 в позиции 24.13 длинной руки. Ген CCDC42B начинается с 113 587 663 пар оснований и заканчивается 113 597 081 пар оснований. Часть CCDC42B перекрывается с геном DDX54 (113,594,978-113,623,284). Размер CCDC42B составляет 9 419 оснований, а его молекулярная масса составляет 35 914 Да.[5][6][7] МРНК CCDC42B содержит 1514 п.н. и расположена от 113,587,663 до 113,597,081. Белок CCDC42B содержит 308 AA и расположен от 113 587 663 до 113 595 484. Область промотора (GXP_642107) содержит 859 п.н., предположительно, она расположена от 113,586,906 до 113,587,764. Ген CCDC42B человека имеет три соседних гена: DDX54, RASAL 1 и DTX1.

Ген DDX54 является членом семейства белков DEAD предполагаемых РНК-геликаз. Ген кодирует DEAD-бокс-белок, который имеет консервативный мотив Asp-Glu-Ala-Asp (DEAD). Семейство DEAD-боксов связано с клеточными процессами, которые включают изменение вторичной структуры РНК, такими как сплайсинг РНК, сборка рибосом, инициация трансляции, ядерный и митохондриальный сплайсинг, сперматогенез, эмбриогенез, а также рост и деление клеток. Белок RASAL 1 является членом семейства GAP1, который подавляет функцию Ras путем инактивации связанной с GDP формы Ras, что позволяет контролировать клеточную пролиферацию и дифференцировку. DTX1 функционирует как убиквитинлигазный белок, облегчая убиквитинирование и делая возможной деградацию MEKK1. Активность убиквитинлигазы DTX1 регулирует Notch Pathway, путь передачи сигналов, который связан с межклеточными коммуникациями, который регулирует детерминацию клеточной судьбы.


Сохранение

Базовый инструмент поиска выравнивания (BLAST)[8] базы данных белок-белок CCDC42B человека, включая Mammalia для близкородственных видов, и исключение Mammalia для отдаленно связанных видов привело к появлению нескольких видов-ортологов с разумным E-значением и высоким, средним и низким охватом в зависимости от родства ортологов с CCDC42B человека . Более высокая консервация гена CCDC42B привела к появлению нескольких строгих ортологов (млекопитающих) с процентным диапазоном идентичности 95% -53%: макака-резус, кит, свинья, крупный рогатый скот и мышь. Более низкая сохранность гена CCDC42B у отдаленных гомологов (не млекопитающих) с процентным диапазоном идентичности 23-40%: дрозофилы, рептилии, земноводные и рыбы.

Паралоги

CCDC42B ген имеет только один главный паралог CCDC42 '(CCDC42A)

имяВидыОбщее название видаРегистрационный номер NCBIДлинаИдентичность белков
CCDC42BHomo sapiensЧеловекNM_001144872.1308aa100%
CCDC42AHomo sapiensЧеловекNM_144681.2316aa36%

Ортологи

Человек CCDC42B Ген обнаружен у ~ 58 видов ортологов.[5] CCDC42B более высокая сохранность у многих видов ортологов млекопитающих по сравнению с видами ортологов, не относящихся к млекопитающим. Более высокая сохранность гена CCDC42B у нескольких строгих ортологов (млекопитающие): шимпанзе, макака-резус, собака, корова, мышь, крыса и курица, а также идентичности, которые варьируются от 95% до 69%. Более низкая консервация гена CCDC42B у отдаленных гомологов (не млекопитающих): птиц, рептилий, земноводных и рыб, а также идентичностей, которые колеблются между 23% -40%. На рисунке показано сравнение строгих ортологов и отдаленных гомологов на предмет сохранения CCDC42B (фиолетовый цвет: совпадающие аминокислотные остатки; синий: консервативные остатки; розовый: аналогичные остатки; белый: разные остатки).

Строгие ортологи против отдаленных гомологов для CCDC42B.
Род / видРаспространенное имяКлассMYAДлина (AA)ИдентичностьПрисоединение (RefSeq)
Macaca mulattaОбезьяна-резусМлекопитающие2930895%NP_001181192.1
Orcinus orcaКосаткаМлекопитающие94.230981%XM_004281459.1
Bos taurusКрупный рогатый скотМлекопитающие94.231479%NM_001144873.1
Sus scrofaСвиньяМлекопитающие94.230879%XM_005670689.1
Ceratotherium simum simumЮжный белый носорогМлекопитающие94.231179%XM_004430130.1
Loxodonta africanaАфриканский слон саванныМлекопитающие98.730379%XM_003419288.1
Trichechus manatus latirostrisФлоридский ламантинМлекопитающие98.730378%XM_004379058.1
Equus caballusЛошадьМлекопитающие94.230676%[1]
Dasypus novemcinctusДевятиполосный броненосецМлекопитающие104.231074%XM_004456157.1
Микротус охрогастерСтепная полевкаМлекопитающие92.330869%XM_005371872.1
Циона кишечникаВаза-оболочкаAscidiacea722.530840%XM_002128423.1
Стронгилоцентротус пурпуратусФиолетовый морской ежEchinoidea742.931240%[2]
Xenopus (Silurana) tropicalisЗападная когтистая лягушкаАмфибия371.232638.7XM_004910626.1
Crassostrea gigasТихоокеанская устрицаДвустворчатые моллюски782.731238.2%JH816130.1
Lepisosteus oculatusПятнистый гарКостяная рыба400.130238%XM_006640471.1
Гидра обыкновеннаяПресноводный полипHydrozoa855.330538%XM_004206385.1
Chrysemys picta belliiЗападная расписная черепахаРептилии29632137%XM_005309857.1
Анолис каролинезЗеленый анолРептилии29631436%XM_003217075.1
Latimeria chalumnaeЛатимериякостлявая рыба414.931235%XM_006005425.1
Амфимедон королевскийГубкадемоспонгии716.531933%XM_003385188.1
Drosophila melanogasterПлодовая мухаНасекомое782.733123%NP_609955.1

Филогения

Согласно Biology Workbench,[9] было построено филогенетическое дерево, показывающее дивергентность CCDC42B между видами. Процент идентичности в зависимости от времени расхождения ортологов видов по сравнению с человеческой последовательностью показан ниже. Рисунок иллюстрирует эволюционную историю гена CCDC42B у различных видов (показано в пространстве ортологов). Близкородственные виды имеют более высокий процент идентичности, что обеспечивает статистические доказательства более высокой сохранности аминокислот. Дистанционно связанные виды с человеческим CCDC42B показали более низкую процентную идентичность, что поддерживает небольшую сохранность аминокислотных остатков. На рисунке показано количество изменений, произошедших в эволюции CCDC42B, и скорость мутаций в гене.

Дивергенция CCDC42B между видами.

Протеин

Согласно инструменту SAPS,[9] Белок CCDC42B человека состоит из 308 аминокислот 8 экзонов. Зрелая форма белка CCDC42B имеет молекулярную массу 35,9 кДал (35 914 Да). Изоэлектрическая точка для человеческого CCDC42B составляет 7,01, в которой белок CCDC42B не несет чистого заряда при данном конкретном pH. N-конец белковой последовательности состоит из Met (M). Среднее значение гидропатичности составило -0,694 для CCDC42B (человек) и -0,398 для Drosophila melanogaster CG10750, отдаленно родственных ортологов. Отрицательный GRAVY подтверждает, что оба белка растворимы и гидрофильны. Теоретический индекс нестабильности (II) для CCDC42B прогнозируется равным 63,73, а для CG10750 - 45,20, что указывает на то, что оба белка нестабильны в пробирке. Предполагается, что период полужизни CCDC42B и CG10750 в ретикулоцитах млекопитающих (in vitro) составит 30 часов, что соответствует периоду полужизни для ферментов, ответственных за контроль скорости метаболизма. Приведенные выше результаты подтвердили, что и CCDC42B, и CG10750 имеют сходство в аминокислотном составе и характеристиках белка. Таким образом, многие характеристики CCDC42B были сохранены у близкородственных и удаленных видов.

Первичная последовательность и варианты / изоформы

Ген CCDC42B человека содержит 9 интронов и продуцируется 8 различных транскриптов мРНК: 4 варианта с альтернативным сплайсингом и 4 варианта без сплайсинга. Альтернативный сплайсинг приводит к кодированию 2 очень хороших белков, 3 хороших белков и 3 некодирующих белков.[10]

Домены и мотивы

CCDC42B белок неизвестной функции содержит спиральная область неизвестной функции (DUF4200), принадлежащий Эукариот семейства и расположены в диапазоне 34–159 аминокислот. Домен DUF4200 был сохранен в Eukaryote. Спиральная катушка структура состоит из двух альфа-спиралей, намотанных друг на друга, образуя изгиб. Гептада повторить pattern (abcdefg) n образует последовательность структуры спиральной катушки, где a и d являются гидрофобными, а e и g полярно заряженными.

Орудие трудадомены и мотивы Позиция (AA)
2ZIP [11]Домен лейциновой молнии123-154
2ZIP [11]спиральная катушка123-150 & 171-201
PFSCAN[12]Богатый аргинином94-139

Посттрансляционные модификации

Инструмент ExPASy Proteomics[13] в первую очередь использовался для анализа посттранскрипционных модификаций белка CCDC42B. Ацетилирование N-конца человеческого CCDC42B (A2) соответствовало 5 из 6 ортологов. Drosophila не имеет Ala, Gly, Ser или Thr в положении 1-3, поэтому ацетилирование N-конца консервативно в CCDC42B человека. Белок CCDC42B человека имеет консервативный сайт SUMOylation, поскольку лизин (K) в положении 285 был консервативен в 5 из 6 ортологов, в большинстве случаев близкородственные организмы продемонстрировали консервативность лизина. События фосфорилирования происходят в основном в CCDC42B, который, как предполагается, участвует в сигнальных путях. Сайт фосфорилирования тирозина CCDC42B человека в положении 8 (Y8) полностью законсервирован у всех 6 видов ортологов (сайт соответствует сайту сульфатирования). Также другие сайты фосфорилирования в человеческом белке CCDC42B были консервативными в ортологах (проиллюстрированы на рис. множественное выравнивание последовательностей ). Одни и те же аминокислотные остатки в человеческом белке CCDC42B подвергаются конкурирующему фосфорилированию и O-связанному гликозилированию. Однако сайты гликозилирования встречаются в основном в остатках серина и треонина, которые могут фосфорилироваться серин / треонинкиназами. Таким образом, фосфорилирование остатков Ser / Thr может предотвратить O-GlcNAc от обработки. Белок CCDC42B человека имеет консервативный сайт модификации GPI аланина (A) в положении 293, который был консервативен в 4 из 6 ортологов.

Посттранскрипционная модификация.
Орудие трудаПрогнозируемое изменениеHomo sapiensMus musculusDrosophila melanogaster
ИноЯН[14]O-β-GlcNAcT60, T240, S308Т302, Т304, Т306S30, S116, T155, S238, S241
NetPhos[15]фосфорилированиеS18, S80, T227, T277, Y8S14, S58, S170, S188, S198, S238, S240, T4, T25, T59, T119, T167, T269S19, S45, S116, S120, S141, S178, S201, S238, S241, S261, S290, S293, S308, S319, T7, T125, T132, Y239
Сульфинатор[16]сульфатирование(никто)(никто)Y61
SulfoSite[17]сульфатированиеY8Y56Y61, Y294
SumoPlot[18]сумоилированиеK289К178, К287, К202, К53, К38, К39, К153К9, К251, К232, К39, К328, К99
Терминатор[19]N-конецA2A2P2

Вторичная структура

CCDC42B белок образуют вторичную структуру на основе альфа-спирали. Структура CCDC42B предсказано, что он содержит несколько альфа-спиралей и другие случайные спирали. Структуры петли шпильки были обнаружены в области 5'UTR и 3'UTR CCDC42B. Кроме того, было обнаружено, что домен лейциновой молнии перекрывается с доменом спиральной спирали. Приложенное изображение показывает сравнение между человеческим CCDC42B и 5 другими видами ортологов, которое подтверждает, что человеческий CCDC42B в основном состоит из альфа-спиралей для его вторичной структуры.

Структура 3 ° и 4 °

Согласно CBLAST,[20] последовательность белка CCDC42B выровняли с 2I1K_A (цепь A, моэзин из Spodoptera Frugiperda выявляет домен спиральной спирали при разрешении 3,0 ангстрем), и было получено значение E 1,00e-03. Выровненные последовательности 164-243 AA для CCDC42B и 302-381 AA для 2I1K_A привели к 22% идентичности между обеими последовательностями в 80 аминокислотных остатках. Структура показывает только выровненную последовательность CCDC42B с 2I1K_A. Предсказанная структура (синий: несхожие остатки, красный: консервативные остатки, серый: невыровненные остатки CCDC42B с 2I1K_A).

Выражение

Атлас белков человека [21] привело к экспрессии CCDC42B в нормальной ткани человека. Уровень экспрессии гена CCDC42B в нормальных тканях человека был обнаружен на высоком или умеренном уровне в 17 из 78 тканей, проанализированных с использованием метода экспрессирующей метки последовательности (EST). Ген CCDC42B имеет суженную экспрессию в тканях. Ген имеет более высокую экспрессию в респираторном эпителии и фаллопиевых трубах; Умеренная экспрессия в кишечнике и печени; и от низкой до нулевой экспрессии в других нормальных тканях. Более того, экспрессия микроматрицы и иммуногистохимии (ИГХ) выявила присутствие низкого уровня экспрессии мРНК CCDC42B в: слюнной железе, желудке, коже, костном мозге и легких. Домен спиральной спирали, содержащий 42B, вовлечен в рак; Ген CCDC42B экспрессируется в опухолевой клетке на низком или умеренном уровне.

Промотор и факторы связывания транскрипции

Область промотора для человеческого CCDC42B, демонстрирующая основные факторы связывания транскрипции.

Согласно Genomatix,[22] Область промотора содержит 859 пар оснований и расположена на положительной цепи хромосомы 12 от области 113 586 906 до 113 587 764 выше гена CCDC42B. Предполагается, что промоторная область содержит сайты для факторов связывания транскрипции, которые регулируют экспрессию CCDC42B. Прикрепленное изображение иллюстрирует важные факторы связывания транскрипции в промоторной области у человека. CCDC42B .

Выражение

CCDC42B ген имеет суженную экспрессию в тканях. Ген имеет более высокую экспрессию в респираторном эпителии и фаллопиевых трубах; Умеренная экспрессия в кишечнике и печени; экспрессия в других нормальных тканях от низкой до нулевой. Домен спиральной катушки, содержащий 42B участвует в некоторых типах рака. CCDC42B Ген экспрессируется в опухолевой клетке на низком или умеренном уровне.[21][23][24]

Функция / Биохимия

По данным 2014 года, CCDC42B Функция гена / белка неизвестна у homo sapiens. Однако предполагается, что CCDC42B человека участвует в сборке и подвижности жгутиков.

Взаимодействующие белки

Согласно STRING,[25] МЯТА,[26] и IntAct,[27] CCDC42B человека не обнаружил прямого взаимодействия с другими белками.[28] другие взаимодействия были идентифицированы по совместной экспрессии с другими белками, как показано на рисунке. Было обнаружено, что CCDC42B коэкспрессирует с другими белками, содержащими спиральные спирали (CCDC78 и CCDC153). Поскольку человеческий CCDC42B экспрессируется на низком уровне в семенниках, предполагается, что человек будет взаимодействовать с SPATC1 (связанный со сперматогенезом и центриоли 1).

Клиническое значение

Ассоциация болезней

Человеческий CCDC42B расположен на хромосоме 12 (12q24.13), что связано с деформациями скелета, гипохондрогенезом, ахондрогенезом и дисплазией самого высокого уровня. По данным OMIM[29] поисковая хромосома 12 (12q24.1) связана с синдромом Нунана 1, который вызван гетерозиготной мутацией в продукте гена PTPN11, SH-PTP2, и в первую очередь вызывает дефекты развития лица и пороки сердца.

Мутации

Два SNP (Y8, Q280) высоко консервативны у многих видов ортологов. Таким образом, эти остатки могут изменять функцию белка, приводя к возможному заболеванию не только у человека.

SNPХромосома (12)ДолжностьОбласть генаТипИзменение аллеляИзменение остатка
61748300 рупий1135876672CDS регионMissense (не синонимы)GCG → GTGАла (А) → Вал (В)
373892417 рупий1135876858CDS регионMissense (не синонимы)ТАТ → ТГТТир (Y) → Cys (C)
61738699 рупий11358979945CDS регионMissense (не синонимы)GCA → ACAАла (А) → Тр (Т)
377463846 рупий11359059457CDS регионMissense (не синонимично)CGC → ТГКАрг (R) → Cys (С)
34765757 рупий11359102394CDS регионСдвиг кадраCGG → GАрг (R) → Gly (G)
34276842 рупий11359103698CDS регионСдвиг кадраGCG → CG Ala(А) → Арг (R)
Rs370323183113591110122CDS регионMissense (не синонимы)CAG → CGGGln (Q) → Arg (R)
34078446 рупий113591152138CDS регионСдвиг кадраAAG → АЛиз (К) → Сер (S)
200344876 рупий113592306187CDS регионСдвиг кадра→ GGAGlu (E) → Gly (G)
Rs377537662113593122250CDS регионMissense (не синонимично)CGC → ТГКАрг (R) → Cys (С)
RS144548708113593212280CDS регионMissense (не синонимы)CAG → GAGGln (Q) → Glu (E)

Концептуальный перевод

Основные предсказанные домены, сайты посттранскрипционной модификации и структурная форма показаны в концептуальном переводе.

Концептуальный перевод для CCDC42B.
Легенды для концептуального перевода.

использованная литература

  1. ^ а б c ГРЧ38: Ансамбль выпуск 89: ENSG00000186710 - Ансамбль, Май 2017
  2. ^ а б c GRCm38: выпуск Ensembl 89: ENSMUSG00000094282 - Ансамбль, Май 2017
  3. ^ "Справочник человека по PubMed:". Национальный центр биотехнологической информации, Национальная медицинская библиотека США.
  4. ^ «Ссылка на Mouse PubMed:». Национальный центр биотехнологической информации, Национальная медицинская библиотека США.
  5. ^ а б c "CCDC42B домен спиральной спирали, содержащий 42B [Homo sapiens (человек)]". Национальный центр биотехнологической информации (NCBI). Получено 17 марта 2014.
  6. ^ «Спиральный домен, содержащий 42B». Генные Карты. Получено 18 марта 2014.
  7. ^ «Ген CCDC42B человека Homo sapiens, кодирующий домен спиральной спирали, содержащий 42B». Национальный центр биотехнологической информации. Получено 18 марта 2014.
  8. ^ «ВЗРЫВ». Национальный центр поисковой базы данных биотехнологической информации (NCBI). Архивировано из оригинал 4 мая 2014 г.. Получено 6 мая 2014.
  9. ^ а б "ClustLaw". Биология WorkBench. Получено 6 мая 2014.[постоянная мертвая ссылка ]
  10. ^ «Ген CCDC42B человека Homo sapiens, кодирующий домен спиральной спирали, содержащий 42B». AceView (NCBI). Получено 6 мая 2014.
  11. ^ а б Эрих Борнберг-Бауэр; Эрик Ривалс; Мартин Вингрон. «2ZIP». Вычислительные подходы к идентификации лейциновых молний. Получено 13 апреля 2014.
  12. ^ «Последовательный поиск по набору профилей (PROSITE и PFAM)». Биология WorkBench.[постоянная мертвая ссылка ]
  13. ^ . ExPASy: Портал ресурсов SIB по биоинформатике http://www.expasy.org/proteomics/families__patterns_and_profiles. Получено 6 мая 2014. Отсутствует или пусто | название = (Помогите)
  14. ^ "ИНОЯН". Получено 12 апреля 2014.
  15. ^ «НетФос». Получено 12 апреля 2014.
  16. ^ «Сульфинатор». Получено 12 апреля 2014.
  17. ^ «СульфоСайт». Архивировано из оригинал на 2008-07-24. Получено 12 апреля 2014.
  18. ^ «СумоПлот». Архивировано из оригинал 20 апреля 2009 г.. Получено 12 апреля 2014.
  19. ^ "Терминатор". Архивировано из оригинал на 2008-04-16. Получено 12 апреля 2014.
  20. ^ "CCDC42B". Wang Y, Addess KJ, Chen J, Geer LY, He J, He S, Lu S, Madej T., Marchler-Bauer A, Thiessen PA, Zhang N, Bryant SH (2007), «MMDB: аннотирование белковых последовательностей с помощью Entrez's 3D. -структурная база данных », Nucleic Acids Res.35 (D) 205-10. Получено 6 мая 2014.
  21. ^ а б "CCDC42B". Атлас белков человека. Получено 6 мая 2014.
  22. ^ . © Genomatix Software GmbH, 2014 г. http://www.genomatix.de/. Получено 6 мая 2014. Отсутствует или пусто | название = (Помогите)
  23. ^ «Экспрессия CFAP73 при раке». Атлас человеческого белка.
  24. ^ «Экспрессия белка 73, ассоциированного с ресничками и жгутиками». Nextprot Beta.
  25. ^ «STRING - известные и прогнозируемые белок-белковые взаимодействия». STRING. Получено 6 мая 2014.
  26. ^ Licata L, Briganti L, Peluso D, Perfetto L, Iannuccelli M, Galeota E, et al. (Январь 2012 г.). «MINT, база данных молекулярных взаимодействий: обновление 2012 г.». Исследования нуклеиновых кислот. 40 (Выпуск базы данных): D857–61. Дои:10.1093 / nar / gkr930. ЧВК  3244991. PMID  22096227.
  27. ^ Орчард С., Аммари М., Аранда Б., Бреуза Л., Бриганти Л., Брукс-Картер Ф. и др. (Январь 2014). «Проект MIntAct - IntAct как общая платформа для 11 баз данных молекулярных взаимодействий». Исследования нуклеиновых кислот. 42 (Выпуск базы данных): D358–63. Дои:10.1093 / нар / gkt1115. ЧВК  3965093. PMID  24234451.
  28. ^ "CCDC42B". геномания. Получено 10 мая 2014.
  29. ^ «ОМИМ». Национальный центр биотехнологической информации (NCBI). Получено 6 мая 2014.