Джин пустыня - Gene desert

Джин пустыни являются участками генома, лишенными генов, кодирующих белок. Генные пустыни составляют примерно 25% всего генома, что привело к недавнему интересу к их истинным функциям.[1] Первоначально считалось, что они содержат несущественную и «мусорную» ДНК из-за их неспособности создавать белки, генные пустыни с тех пор были связаны с несколькими жизненно важными регуляторными функциями, включая дистальное усиление и консервативное наследование. Таким образом, растущее число рисков, ведущих к нескольким серьезным заболеваниям, включая несколько видов рака, связано с нарушениями, обнаруженными в генетических пустынях. Одним из наиболее ярких примеров является область гена 8q24, которая при воздействии определенных однонуклеотидный полиморфизм, приводят к множеству болезней. Основные факторы идентификации генных пустынь заключаются в их низком содержании GpC и относительно высоком уровне повторов, которые не наблюдаются в кодирующих областях. Недавние исследования позволили разделить генные пустыни на вариабельные и стабильные формы; регионы классифицируются на основе их поведения посредством рекомбинации и их генетического содержания. Хотя текущие знания о генных пустынях довольно ограничены, продолжающиеся исследования и усовершенствованные методы начинают открывать двери для изучения различных важных эффектов этих некодирующих областей.

История

Хотя возможность функционирования в генных пустынях была предсказана еще в 1960-х годах, инструменты генетической идентификации не смогли выявить каких-либо специфических характеристик длинных некодирующих областей, кроме того, что в этих регионах не происходило кодирования.[2] До завершения создания генома человека в 2001 году в рамках проекта «Геном человека» большинство ранних ассоциативных сравнений генов основывались на убеждении, что основные гены домашнего хозяйства были сгруппированы в одних и тех же областях генома для облегчения доступа и жесткого регулирования. Это убеждение позже создало гипотезу, что генные пустыни, следовательно, являются предыдущими регуляторными последовательностями, которые сильно связаны (и, следовательно, не подвергаются рекомбинации), но имеют замены между ними с течением времени.[2][3] Эти замены могут вызвать разделение строго консервативных генов с течением времени, таким образом формируя области бессмысленных кодов с несколькими важными генами. Однако неопределенность из-за разной степени сохранения генов в разных частях хромосом не позволяла точной идентификации. Позже ассоциации были реконструированы, когда регуляторные последовательности были связаны с факторами транскрипции, что привело к рождению крупномасштабного картирования всего генома. Так началась охота за содержанием и функциями генных пустынь. Последние достижения в скрининге сигнатур хроматина на хромосомах (например, захват конформации хромосомы, также известный как 3C) позволили подтвердить модель активации генов дальнего действия, которая постулирует, что действительно существуют физические связи между регуляторными энхансерами и их целевыми промоторами.[2] Исследования генетических пустынь, хотя и сосредоточены на генетике человека, также применялись к мышам, различным птицам и Drosophila melanogaster.[4][5] Хотя сохранение в геномах отдельных видов варьирует, пустыни ортологичных генов действуют аналогичным образом. Таким образом, преобладающее утверждение генных пустынь состоит в том, что эти некодирующие последовательности содержат активные и важные регуляторные элементы.

Возможные функции

Одно исследование было сосредоточено на регуляторном архипелаге, регионе с «островками» кодирующих последовательностей, окруженных обширными некодирующими регионами. Исследование, в котором изучалось влияние регулирования на гены hox, первоначально сфокусированы на двух энхансерных последовательностях, GCR и Prox, которые расположены на 200 пар оснований и 50 пар оснований соответственно выше локуса Hox D.[5] Чтобы манипулировать этой областью, исследование инвертировало две последовательности энхансера и не обнаружило серьезных эффектов на транскрипцию гена Hox D, даже несмотря на то, что две последовательности были наиболее близкими к гену последовательностями. Таким образом, они обратились в генную пустыню, которая фланкировала последовательность GCR выше по течению, и обнаружили в ней 5 регуляторных островков, которые могли регулировать ген. Чтобы выбрать наиболее вероятного кандидата, исследование затем применило несколько отдельных и множественных удалений к пяти островам, чтобы наблюдать эффекты. Эти разнообразные делеции приводили только к незначительным эффектам, включая физические отклонения или несколько пропущенных цифр.

Когда эксперимент был сделан еще дальше и применил делецию всего 830-килобазного гена пустыни, функциональность всего локуса Hox D стала неактивной.[5] Это указывает на то, что соседняя генная пустыня, как целая единица из 830 килобаз (включая пять островных последовательностей в ней), служит важным регулятором одного гена, охватывающего всего 50 килобаз. Таким образом, эти результаты намекают на регуляторные эффекты фланкирующих генных пустынь. Это исследование было подтверждено более поздним наблюдением путем сравнения между флуоресценция in situ гибридизация и захват конформации хромосомы, который обнаружил, что локус Hox D был наиболее деконденсированной частью в регионе. Это означало, что он имел относительно более высокую активность по сравнению с фланкирующими генными пустынями.[6] Следовательно, Hox D может регулироваться специфическими соседними энхансерными последовательностями, которые не экспрессируются согласованно. Однако это предупреждает, что близость является неточной при использовании любого из аналитических методов.[6] Таким образом, ассоциации между регуляторными пустынями генов и их промоторами-мишенями, по-видимому, имеют переменные расстояния и не обязаны действовать как границы.

Образование петли приближает комплексы энхансеров к их промоторам-мишеням. Это указывает на то, что генные «острова», покрытые генными пустынями, выполняют важные регуляторные функции.

Изменчивость расстояний показывает, что расстояние может быть еще одним важным фактором, который определяется генетическими пустынями. Например, дистальные энхансеры могут взаимодействовать со своими целевыми промоторами посредством петлевых взаимодействий, которые должны действовать на определенном расстоянии.[7] Таким образом, близость не является точным предиктором энхансеров: энхансерам не нужно граничить со своей целевой последовательностью, чтобы регулировать их. Хотя это приводит к изменению расстояний, среднее расстояние между сайтами начала транскрипции и комплексом взаимодействия, опосредованным их энхансерными элементами, составляет 120 килобаз перед стартовым сайтом.[7] Генные пустыни могут играть роль в построении этого расстояния, чтобы обеспечить максимальное образование петель. Учитывая, что механизм образования энхансерного комплекса является довольно просто регулируемым механизмом (структуры, которые рекрутируются в усиливающий комплекс, имеют различные регуляторные регуляторы, которые контролируют конструкцию), более 50% промоторов имеют несколько дальнодействующих взаимодействий. У некоторых основных генов даже есть до 20 возможных усиливающих взаимодействий. Существует любопытная предвзятость к тому, что комплексы образуются только перед промоторами.[7] Таким образом, учитывая корреляцию, что многие регуляторные пустыни генов появляются выше своих промоторов-мишеней, возможно, что более непосредственная роль, которую играют пустыни генов, заключается в регуляции ключевых последовательностей на больших расстояниях. Поскольку для идеального формирования энхансерных взаимодействий требуются специфические конструкции, возможным побочным продуктом регуляторных ролей генных пустынь может быть консервация генов: для сохранения определенной длины петель и порядка регуляции генов, скрытых в генных пустынях, определенные части генные пустыни более консервативны, чем другие, при прохождении через события наследования. Эти консервативные некодирующие последовательности (ЦНС) напрямую связаны с синтенической наследственностью у всех позвоночных.[8] Таким образом, наличие этих ЦНС может служить для сохранения больших участков генов. Хотя расстояние может варьироваться в пустынях регуляторных генов, расстояние, по-видимому, имеет верхний предел в пустынях консервативных генов. Первоначально считалось, что ЦНС расположены рядом с их консервативными генами: более ранние оценки помещали большинство ЦНС в непосредственной близости от последовательностей генов.[8] Однако расширение генетических данных показало, что несколько ЦНС располагаются на расстоянии до 2,5 мегабаз от своих генов-мишеней, при этом большинство ЦНС находятся между 1 и 2 мегабазами. Этот диапазон, который был измерен для генома человека, варьируется у разных видов. Например, по сравнению с людьми, рыба фугу имеет меньший диапазон, с расчетным максимальным расстоянием в несколько сотен килобаз. Независимо от разницы в длине, ЦНС у обоих видов работают одинаково.[8] Таким образом, как функции различаются между генными пустынями, так и их содержание.

Стабильные и изменчивые генные пустыни

Стабильные генные пустыни, в которых находятся более важные гены, легче сохраняются с течением времени, передавая эту консервацию соседним генам. Пустыни вариабельных генов с меньшим количеством основных генов, таким образом, подвергаются частым SNP, большинство из которых являются нейтральными.

Некоторые генные пустыни являются тяжелыми регуляторами, в то время как другие могут быть удалены без какого-либо эффекта. В качестве возможной классификации генные пустыни можно разбить на два подтипа: стабильные и изменчивые.[1] Стабильные пустыни генов имеют меньше повторов и имеют относительно более высокое содержание гуанина и цитозина (GpC), чем наблюдается в пустынях с вариабельными генами.

Содержание гуанина и цитозина указывает на функциональность кодирования белка. Например, в исследовании хромосом 2 и 4, которые были связаны с несколькими генетическими заболеваниями, в определенных регионах было повышенное содержание GpC.[9] Мутации в этих областях, богатых GC, вызывали множество заболеваний, обнаруживая необходимую целостность этих генов. Области CpG высокой плотности служат в качестве регуляторных областей для метилирования ДНК.[10] Следовательно, основные кодирующие гены должны быть представлены областями с высоким содержанием CpG. В частности, регионы с высоким содержанием GC должны иметь тенденцию к высокой плотности генов, которые предназначены в основном для основных хозяйственных и тканевых процессов.[11] Эти процессы потребуют максимальной продукции белка для выражения функциональности. Следовательно, стабильные генные пустыни, которые имеют более высокий уровень содержания GC, должны содержать основные энхансерные последовательности. Это могло определять консервативные функции стабильных генных пустынь.

С другой стороны, примерно 80% генных пустынь имеют низкое содержание GpC, что указывает на то, что у них очень мало важных генов.[9] Таким образом, большинство генных пустынь представляют собой изменчивые генные пустыни, которые могут иметь альтернативные функции. Одна из распространенных теорий о происхождении генных пустынь постулирует, что генные пустыни - это скопления важных генов, действующих как расстояние.[1][10] Это может быть правдой, поскольку с учетом небольшого количества важных генов в них эти области были бы менее консервативными. В результате из-за преобладания превращений цитозина в тимин наиболее распространенный SNP, вызовет постепенное разделение между несколькими важными генами в вариабельных генных пустынях. Эти важные последовательности могли бы сохраняться и консервироваться, что приводило бы к небольшим областям с высокой плотностью, которые регулируются на расстоянии.[10] Следовательно, содержание GC является показателем наличия кодирующих или регуляторных процессов в ДНК.

Сравнение содержания GC и скорости рекомбинации между пустынями стабильных и вариабельных генов, разделенных кодирующим геном. Отображаемые общие соотношения не зависят друг от друга; точные значения не отражают масштабы.

В то время как стабильные генные пустыни имеют более высокое содержание GC, это относительное значение является лишь средним. В стабильных генных пустынях, хотя концы содержат очень высокие уровни содержания GC, основная масса ДНК содержит даже меньше GC, чем наблюдается в вариабельных генных пустынях. Это указывает на то, что очень мало высококонсервативных областей в стабильных генных пустынях, которые не рекомбинируют или делают это с очень низкой скоростью.[9] Учитывая, что концы стабильных генных пустынь имеют особенно высокие уровни содержания GC, эти последовательности должны быть чрезвычайно консервативными. Это сохранение может, в свою очередь, привести к тому, что фланкирующие гены также будут иметь более высокие показатели сохранения. Таким образом, стабильные гены должны быть напрямую связаны по крайней мере с одним из своих фланкирующих генов и не могут быть отделены от кодирующих последовательностей посредством событий рекомбинации.[1] Большинство генных пустынь, по-видимому, группируются парами вокруг небольшого числа генов. Эта кластеризация создает длинные локусы с очень низкой плотностью генов; небольшие регионы с большим количеством генов окружены длинными участками генных пустынь, что создает низкий средний уровень генов. Следовательно, минимальная вероятность событий рекомбинации в этих длинных локусах создает синтенные блоки, которые наследуются вместе с течением времени.[1] Эти синтенические блоки могут сохраняться в течение очень долгих периодов времени, предотвращая потерю основного материала, даже если расстояние между важными генами может со временем увеличиваться.

Хотя этот эффект теоретически должен быть усилен за счет еще более низкого содержания GC в вариабельных генных пустынях (тем самым действительно сводя к минимуму плотность генов), темпы сохранения генов в изменчивых генных пустынях даже ниже, чем наблюдаемые в стабильных генных пустынях - на самом деле, этот показатель составляет намного ниже, чем остальной геном. Возможное объяснение этого феномена состоит в том, что вариабельные генные пустыни могут быть недавно развившимися регионами, которые еще не закреплены в стабильных генных пустынях.[1] Следовательно, перетасовка все еще может происходить до того, как стабилизирующие области в вариабельных генных пустынях начнут группироваться в целые единицы. Есть несколько исключений из этой минимальной скорости сохранения, так как несколько пустынных генов GC подвергаются гиперметилированию, что значительно снижает доступность ДНК, таким образом эффективно защищая область от рекомбинации.[11] Однако при наблюдении это случается редко.

Хотя стабильные и изменчивые генные пустыни различаются по содержанию и функциям, оба обладают консервативными способностями. Возможно, что, поскольку большинство вариабельных генных пустынь имеют регуляторные элементы, которые могут действовать на расстоянии, сохранение всей генной пустыни в ситенический локус не было бы необходимым, если бы сами эти регуляторные элементы сохранялись как единицы. Учитывая особенно низкие уровни содержания GC, регуляторные элементы, следовательно, будут в ситуации с минимальной плотностью генов, как это наблюдается аналогично при фланкировании стабильных генных пустынь, с тем же эффектом. Таким образом, оба типа генных пустынь служат для сохранения основных генов в геноме.

Генетические заболевания

Консервативный характер генных пустынь подтверждает, что эти участки некодирующих оснований необходимы для правильного функционирования. Действительно, широкий спектр исследований нарушений в некодирующих генах обнаружил несколько ассоциаций с генетическими заболеваниями. Одной из наиболее изученных генных пустынь является область 8q24. Ранние полногеномные исследования ассоциации были сосредоточены на области 8q24 (проживающей на хромосома 8 ) из-за аномально высоких показателей SNP, которые, по-видимому, встречаются в регионе. Эти исследования показали, что этот регион связан с повышенным риском развития различных видов рака, особенно простаты, груди, яичников, толстой кишки и поджелудочной железы.[12][13] Используя вставки генной пустыни в бактериальные искусственные хромосомы, в одном исследовании удалось выявить активность энхансера в определенных областях, которые были выделены с помощью систем клонирования.[14] Это исследование успешно идентифицировало энхансерную последовательность, скрытую в этом регионе. В этой энхансерной последовательности у больных мышей был обнаружен SNP, который представлял риск рака простаты, помеченный как SNP s6983267. Однако область 8q24 не ограничивается только предполагаемым риском рака простаты. В исследовании 2008 года был проведен скрининг людей (и контрольной группы) с вариациями в регионе генной пустыни, и было обнаружено пять различных регионов, которые создают разные риски при воздействии разных SNP.[12] В этом исследовании использовались идентифицированные маркеры SNP в «пустыне генов», чтобы определить степень риска в каждой из областей для конкретной тканевой экспрессии. Хотя эти риски были успешно связаны с различными формами рака, Ghoussaini, M., et al. обратите внимание на их неуверенность в том, функционировали ли SNP просто как маркеры или были прямыми возбудителями рака.

Эти различные эффекты возникают из-за различных взаимодействий между SNP в этой области и промоторами MYC разных органов. Промотор MYC, расположенный на небольшом расстоянии ниже области 8q24, является, пожалуй, наиболее изученным онкогеном из-за его связи с множеством заболеваний.[13] Нормальное функционирование промотора MYC обеспечивает регулярное деление клеток. Исследование предполагает, что область 8q, которая подверглась хромосомной транслокации у людей, могла переместить важный энхансер для промотора MYC.[13] Эти области вокруг этой области могли быть подвергнуты рекомбинации, которая могла скрыть существенный энхансер MYC в генной пустыне с течением времени, хотя его усиливающие эффекты все еще в значительной степени сохраняются. Этот анализ основан на ассоциациях болезней, наблюдаемых у нескольких видов мышей, у которых эта область сохраняется в непосредственной близости от промотора MYC.[13] Таким образом, пустыня гена 8q24 должна была быть каким-то образом связана с промотором MYC. Пустыня напоминает стабильную генную пустыню, в которой после транслокации было очень мало рекомбинации. Таким образом, потенциальная гипотеза состоит в том, что SNP, влияющие на эту область, нарушают важные тканеспецифические гены со стабильной генной пустыней, что может объяснить риски рака в различных тканевых формах. Этот эффект скрытых энхансерных элементов можно также наблюдать в других частях генома. Например, SNP в 5p13.1 дерегулируют кодирующую область PTGER4, что приводит к болезни Крона.[15] Другой пораженный регион в пустыне гена 9p21 вызывает несколько заболеваний коронарной артерии.[16] Однако ни одна из этих несущих риск генетических пустынь, по-видимому, не затронута так сильно, как области 8q24. Текущие исследования все еще не уверены в процессах, затронутых SNP в области 8q24, которые приводят к особенно усиленным ответам на промотор MYC. С помощью более доступной популяции и более специфических маркеров для картирования ассоциаций в масштабе всего генома все большее количество аллелей риска отмечается в генных пустынях, где небольшие, изолированные и, казалось бы, неважные участки генов могут модерировать важные гены.

Предостережение

Крайне важно отметить, что хотя большинство исследованных здесь генных пустынь являются важными, возможно, что большая часть содержимого генных пустынь все еще может быть несущественной и одноразовой. Естественно, это не означает, что роли, которые играют генные пустыни, несущественны или не важны, скорее, чем их функции могут включать эффекты буферизации. Примером незаменимых генных пустынь с несущественным содержанием ДНК являются теломеры которые защищают концы геномов. Теломеры можно отнести к категории истинных генных пустынь, учитывая, что они содержат только повторы TTAGGG (у людей) и не имеют явных функций кодирования белков. Без этих теломер человеческие геномы сильно мутировали бы в течение фиксированного числа клеточных циклов. С другой стороны, поскольку теломеры не кодируют белки, их потеря гарантирует отсутствие влияния на важные процессы. Следовательно, термин «мусорная» ДНК больше не следует применять к какой-либо области генома; каждая часть генома должна играть роль в защите, регулировании или восстановлении областей, кодирующих белок, которые определяют функции жизни. Хотя еще многое предстоит узнать об укромных уголках огромного (но ограниченного) человеческого генома, с помощью различных новых технологий и синтеза полного генома человека мы, возможно, сможем разгадать большую коллекцию секретов в приближающемся лет о чудесах нашего генетического кода.

Смотрите также

Рекомендации

  1. ^ а б c d е ж Овчаренко, Иван; и другие. (Декабрь 2004 г.). «Эволюция и функциональная классификация пустынь позвоночных генов». Геномные исследования. 15 (1): 137–145. Дои:10.1101 / гр.3015505. ЧВК  540279. PMID  15590943.
  2. ^ а б c Монтавон, Томас; Дубуль, Дени (июль 2012 г.). «Пейзажи и архипелаги: пространственная организация регуляции генов у позвоночных». Тенденции в клеточной биологии. 22 (7): 347–354. Дои:10.1016 / j.tcb.2012.04.003. PMID  22560708.
  3. ^ Тейлор, Джеймс (19 апреля 2005 г.). «Ключи к функциям в генных пустынях». Тенденции в биотехнологии. 23 (6): 269–271. Дои:10.1016 / j.tibtech.2005.04.003. PMID  15922077.
  4. ^ Купер, Моника; Кеннисон, Джеймс (август 2011 г.). "Молекулярно-генетический анализ области 72A-D политенной хромосомы в Drosophila melanogaster выявил генную пустыню в 72D". PLOS ONE. 6 (8): e23509. Дои:10.1371 / journal.pone.0023509. ЧВК  3154481. PMID  21853143.
  5. ^ а б c Монтавон, Томас; и другие. (23 ноября 2011 г.). «Регуляторный архипелаг контролирует транскрипцию Hox-генов в цифрах». Клетка. 147 (5): 1132–1145. Дои:10.1016 / j.cell.2011.10.023. PMID  22118467.
  6. ^ а б Уильямсон, Иэн; и другие. (30 октября 2014 г.). «Организация пространственного генома: противоположные взгляды на конформацию хромосомы и флуоресценцию гибридизации in situ». Гены и развитие. 28 (24): 2778–2791. Дои:10.1101 / gad.251694.114. ЧВК  4265680. PMID  25512564.
  7. ^ а б c Саньял, Амартья; Ладжуа, Брайан; Джайн, Гаурав; Деккер, Джоб (6 сентября 2012 г.). "Ландшафт дальнего взаимодействия промоторов генов". Природа. 489 (7414): 109–113. Дои:10.1038 / природа11279. ЧВК  3555147. PMID  22955621.
  8. ^ а б c Вулф, Адам; Элгар, Грег (2008). «Организация консервативных элементов рядом с ключевыми регуляторами развития в геномах позвоночных». Достижения в генетике. 61: 307–38. Дои:10.1016 / S0065-2660 (07) 00012-0. PMID  18282512.
  9. ^ а б c Хиллер, ЛаДеана; и другие. (7 апреля 2005 г.). "Создание и аннотация последовательностей ДНК хромосом 2 и 4 человека". Природа. 434 (7034): 724–731. Дои:10.1038 / природа03466. PMID  15815621.
  10. ^ а б c Скиннер, Майкл; Босанья, Карлос (2014). «Роль CpG-пустынь в эпигенетическом трансгенерационном наследовании областей дифференциального метилирования ДНК». BMC Genomics. 15 (692): 692. Дои:10.1186/1471-2164-15-692. ЧВК  4149044. PMID  25142051.
  11. ^ а б Заглул, Ламия; и другие. (11 июля 2014 г.). «Большие асимметричные домены репликации ограничивают GC-бедные генные пустыни у человека». Вычислительная биология и химия. 53: 153–165. Дои:10.1016 / j.compbiolchem.2014.08.020. PMID  25224847.
  12. ^ а б Гусаини, Майя; и другие. (2 июля 2008 г.). «Множественные локусы с различными видами рака в пустыне генов 8q24». Краткие сообщения. 100 (13).
  13. ^ а б c d Хуппи, Конрад; Питт, Джейсон; Уолберг, Брэди; Каплен, Наташа (апрель 2012 г.). «Пустыня генов 8q24: оазис некодирующей транскрипционной активности». Границы генетики. 3. Дои:10.3389 / fgene.2012.00069. PMID  22558003.
  14. ^ Вассерман, Нора; Aneas, Плющ; Нобрега, Марсело (3 июня 2010 г.). «Пустынный вариант гена 8q24, связанный с риском рака простаты, придает дифференциальную активность in vivo энхансеру MYC». Геномные исследования. 20 (9): 1191–1197. Дои:10.1101 / гр.105361.110. ЧВК  2928497. PMID  20627891.
  15. ^ Либиулль, Сесиль; и другие. (Апрель 2007 г.). «Новый локус болезни Крона, идентифицированный с помощью общегеномных ассоциативных карт в генной пустыне на 5p13.1, и модулирующий экспрессию PTGER4». PLOS Genetics. 3 (4): e58. Дои:10.1371 / journal.pgen.0030058. ЧВК  1853118. PMID  17447842.
  16. ^ Харисменди, Оливье; и другие. (10 февраля 2011 г.). «Варианты ДНК 9p21, связанные с ишемической болезнью сердца, ухудшают интерферон-гамма-сигнальный ответ». Природа. 470 (7333): 264–268. Дои:10.1038 / природа09753. ЧВК  3079517. PMID  21307941.