Информация

Уменьшается ли величина изменений экспрессии генов по мере того, как ген находится ниже по течению от источника изменения?

Уменьшается ли величина изменений экспрессии генов по мере того, как ген находится ниже по течению от источника изменения?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Если у меня наблюдается уменьшение или увеличение экспрессии одного гена, всегда ли уменьшение / увеличение экспрессии в нижележащих генах будет меньше, чем у предыдущих генов, или они могут быть выше?

Я думаю с точки зрения распространения сигнала в сети. Если я, например, нокдаун ген $ X $ до 40% от его базального уровня и влияет на гены $ Y $ а также $ Z $ следующим образом:

$$ X → Y → Z, $$

Буду ли я ожидать гены $ Y $ а также $ Z $ страдать меньшим снижением / увеличением, чем предыдущий ген, например:

$$ X: 40 \% ~ ⇒ ~ Y: 60 \% ~ ⇒ ~ Z: 80 \% $$

Или у меня может быть сценарий, в котором небольшое изменение в экспрессии одного гена может привести к более значительным изменениям в последующих генах, например:

$$ X: 40 \% ~ ⇒ ~ Y: 20 \% ~ ⇒ ~ Z: 10 \% $$

Я предполагаю, что в некоторых сетях сигнал всегда будет уменьшаться по величине по мере удаления от источника, но мне интересно, будет ли это происходить в биологической сети, причем последовательно на каждом этапе. Я все время читаю статьи о нокдаунах, но никогда не останавливался, чтобы проанализировать, всегда ли нокдауны вызывают меньшие изменения в нижестоящих генах или нет. Поэтому мне было интересно, обосновывается ли это интуитивное представление эмпирически или нет.


Экспрессия генов может быть очень хорошо описана функциями Хилла, то есть:

$$ c_Y (c_X) = frac {c_X ^ n} {1 + c_X ^ n} $$

когда $ X $ активирует $ Y $ а также

$$ c_Y (c_X) = frac {1} {1 + c_X ^ n} $$

когда $ X $ подавляет $ Y $ (без единиц измерения и всевозможных констант для простоты). Для общего случая, что $ n> 1 $, эти функции выглядят так:

Как видите, они далеко не линейные, а сигмоиды. Для $ n → ∞ $, они становятся идеальными ступенчатыми функциями.

В результате регуляция генов в основном работает как переключатель: пока вы не приближаетесь к критической концентрации ($1$ в приведенном выше примере) изменения в регуляторе имеют меньший, чем пропорциональный эффект. Например, в приведенном выше примере не имеет значения, соответствует ли концентрация вашего активатора $2$ или $10$, производство белка в значительной степени $1$.

Следовательно, «сигналы» в сетях генной регуляции стабилизируются, а не разбавляются. Этому способствуют также некоторые другие эффекты саморегуляции, такие как саморегулирующиеся гены, доступность аминокислот и ограничения аппарата трансляции.

Обратите внимание, что без этих сигмоидальных отношений на вас также будет большое влияние неизбежные колебания регулятора. В результате было бы невозможно поддерживать метаболизм в каком-либо стабильном состоянии - единственное стабильное состояние в линейной системе - это смерть. Проще говоря, вам придется соблюдать очень точную и регулярную диету, чтобы ваше тело не переставало работать.


Просто чтобы расширить отличный ответ @ Wrzlprmft конкретным примером:

Придерживаясь своей простой генной цепи с $ X $, $ Y $, а также $ Z $, теперь рассмотрим возможность того, что $ Y $ также активирует собственное выражение через петля положительной обратной связи:

$ X to underset { circlearrowright} Y to Z $

Здесь активация $ Y $ будет лишь минимально зависеть от $ X $. Один раз $ Y $ активируется, следующая самоактивация вызывает $ Y $ практически не зависит от дальнейших $ X $ активность, вызывающая $ Y $ управлять собственной активацией до насыщения.

Если при уменьшении $ X $ до 50%, его уровни все еще выше минимального уровня, необходимого для активации $ Y $, это практически не повлияет на конечные (установившиеся) уровни $ Y $. И наоборот, если снижение на 50% приносит $ X $ ниже $ Y $ уровень активации, это приведет к полному отключению $ Y $.


Уменьшается ли величина изменений экспрессии генов по мере того, как ген находится ниже по течению от источника изменения? - Биология

Стресс вызывает стойкие функциональные изменения кода гистонов и метилирования ДНК.

Эпигенетика опосредует вызванные стрессом изменения экспрессии CRH, GR, AVP.

Характеристики эпигенетической реакции на стресс зависят от множества факторов.

Эпигенетические механизмы составляют решающий элемент стрессовой реакции.

Эпигенетические механизмы, управляющие стрессовой реакцией, все еще плохо изучены.


Сердечная недостаточность в эпоху геномной медицины

Айвор Дж. Бенджамин, Джитендра Патель, в Genomic and Personalized Medicine, 2009

Случай биологической переклассификации сердечной недостаточности

Профилирование экспрессии генов значительно улучшило диагностическую классификацию конкретных состояний (например, рак груди, хронический миелогенный лейкоз), но остается сложной задачей для расшифровки значимых сведений о биологических механизмах, лежащих в основе патогенеза заболевания (Quackenbush, 2006). Среди наследственных форм сердечно-сосудистых заболеваний недавние достижения в области одногеновых нарушений фундаментально изменили наши представления о клеточных процессах, метаболических изменениях и транскрипционном репрограммировании больного сердца (Seidman and Seidman, 2001). Подобно успеху, достигнутому в классификации опухолей и других улучшениях в лечении рака (Bell, 2004 Quackenbush, 2006), и помимо доступности генетических тестов на болезнетворные мутации кардиомиопатии (Morita et al., 2005), развитие геномной инструменты, которые причинно связаны с патогенезом болезни, называемые «молекулярной сигнатурой», вероятно, ускорят прогресс в области раннего выявления, таргетной терапии и мониторинга наследственной сердечной недостаточности (Bell, 2004). Мы предполагаем, что существуют возможности для профилирования на основе микроматриц, протеомики, метаболомики и общегеномных технологий, чтобы ускорить переход от клинико-патологической к клинико-геномной классификации сердечной недостаточности.

Различные профили генов для отказов сердца и без отказов сердца уже позволили дифференцировать сердечную недостаточность с разной этиологией, как недавно показали Донахью и его коллеги в Таблице 59.2 (Donahue et al., 2006). Однако существуют значительные расхождения, поскольку наша способность диагностировать сердечную недостаточность с использованием геномного профиля существенно отстает от клинического ведения. Остаются важные препятствия, такие как ограничения на получение образцов тканей, необходимых для геномных профилей, и их переход от использования в качестве инструментов исследования в сферу клинической диагностики.

ТАБЛИЦА 59.2. Открытие проектов в области сердечной недостаточности

Повышенная регуляция генов предсердного натрийуретического пептида, саркомерных и цитоскелетных белков, стрессовых белков и регуляторов транскрипции / трансляции

Подавление генов, регулирующих сигнальные пути кальция

364 дифференциально экспрессируемых гена

Повышающая регуляция является наиболее заметной в генах энергетических путей, сокращения мышц, транспорта электронов и внутриклеточной передачи сигналов.

Понижающая регуляция была наиболее заметной в генах, контролирующих клеточный цикл.

95 дифференциально экспрессируемых генов с заметной активацией предсердного натрийуретического пептида и мозгового натрийуретического пептида

Основные пути активации включают передачу сигналов клеток и сокращение мышц.

179 дифференциально экспрессируемых генов (130 вверх и 49 вниз

Наблюдалась заметная повышающая регуляция путей оксида азота и понижающая регуляция воспалительных генов.

107 дифференциально регулируемых генов (85 вверх и 22 вниз)

Заметной была повышающая регуляция генов, регулирующих сосудистые сети, и понижающая регуляция генов, регулирующих гипертрофию миоцитов.

DCM = дилатационная кардиомиопатия HCM = гипертрофическая кардиомиопатия ICM = ишемическая кардиомиопатия.


СОДЕРЖАНИЕ

Понимание эпистаза значительно изменилось на протяжении истории генетики, как и использование этого термина. Этот термин впервые был использован Уильямом Бейтсоном и его сотрудниками Флоренс Дарем и Мюриэль Велдейл Онслоу. [4] В ранних моделях естественного отбора, разработанных в начале 20 века, считалось, что каждый ген вносит свой собственный характерный вклад в приспособленность на среднем фоне других генов. На некоторых вводных курсах популяционная генетика до сих пор преподается таким образом. Из-за того, как развивалась популяционная генетика, эволюционные генетики склонны рассматривать эпистаз как исключение. Однако в целом экспрессия одного аллеля сложным образом зависит от многих других аллелей.

В классической генетике, если гены A и B мутированы, и каждая мутация сама по себе дает уникальный фенотип, но две мутации вместе показывают тот же фенотип, что и мутация гена A, тогда ген A эпистатический, а ген B гипостатический. Например, ген полного облысения эпистатичен гену каштановых волос. В этом смысле эпистаз можно противопоставить генетическому доминированию, которое представляет собой взаимодействие между аллелями в одном и том же локусе гена. По мере развития генетических исследований и с появлением молекулярной биологии эпистаз начали изучать в отношении локусов количественных признаков (QTL) и полигенного наследования.

Эффекты генов теперь обычно поддаются количественной оценке путем анализа величины фенотипа (например, роста, пигментации или скорости роста) или путем биохимического анализа активности белка (например, связывания или катализа). Все более сложные модели вычислительной и эволюционной биологии стремятся описать эффекты эпистаза в масштабе всего генома и его последствия для эволюции. [5] [6] [7] Поскольку идентификация эпистатических пар является сложной задачей как в вычислительном, так и в статистическом отношении, в некоторых исследованиях делается попытка отдать приоритет эпистатическим парам. [8] [9]

Терминология эпистаза может варьироваться в зависимости от области науки. Генетики часто ссылаются на аллели дикого типа и мутантные аллели, в которых мутация неявно вредна, и могут говорить о генетическом улучшении, синтетической летальности и генетических супрессорах. И наоборот, биохимик может чаще сосредотачиваться на полезных мутациях и, таким образом, явно указывать эффект мутации и использовать такие термины, как эпистаз реципрокного знака и компенсаторная мутация. [16] Кроме того, существуют различия при рассмотрении эпистаза в пределах одного гена (биохимия) и эпистаза в пределах гаплоидного или диплоидного генома (генетика). В общем, эпистаз используется для обозначения отклонения от «независимости» эффектов различных генетических локусов. Путаница часто возникает из-за различного толкования понятия «независимость» в разных областях биологии. [17] Приведенные ниже классификации пытаются охватить различные термины и то, как они соотносятся друг с другом.

Аддитивность Править

Две мутации считаются чисто аддитивными, если эффект двойной мутации является суммой эффектов одиночных мутаций. Это происходит, когда гены не взаимодействуют друг с другом, например, действуя через разные метаболические пути. Просто аддитивные признаки изучались на ранних этапах истории генетики, однако они относительно редки, и большинство генов демонстрируют, по крайней мере, некоторый уровень эпистатического взаимодействия. [18] [19]

Величина эпистаза Править

Когда двойная мутация имеет более подходящий фенотип, чем ожидалось из-за эффектов двух одиночных мутаций, она упоминается как положительный эпистаз. Положительный эпистаз между полезными мутациями вызывает большее улучшение функции, чем ожидалось. [10] [11] Положительный эпистаз между вредными мутациями защищает от отрицательных эффектов, вызывая менее серьезное падение пригодности. [13]

И наоборот, когда две мутации вместе приводят к менее подходящему фенотипу, чем ожидалось, исходя из их эффектов в одиночку, это называется отрицательный эпистаз. [20] [21] Отрицательный эпистаз между полезными мутациями вызывает меньшее, чем ожидалось, улучшение приспособленности, тогда как отрицательный эпистаз между вредными мутациями вызывает более чем аддитивное падение приспособленности. [12]

Независимо от того, когда влияние на приспособленность двух мутаций оказывается более радикальным, чем ожидалось от их эффектов в одиночку, это называется синергетический эпистаз. Противоположная ситуация, когда различие приспособленности двойного мутанта от дикого типа меньше, чем ожидалось от эффектов двух одиночных мутаций, называется антагонистический эпистаз. [15] Таким образом, для вредных мутаций отрицательный эпистаз также является синергическим, в то время как положительный эпистаз является антагонистическим, и наоборот, для благоприятных мутаций положительный эпистаз является синергическим, а отрицательный эпистаз - антагонистическим.

Срок генетическое улучшение иногда используется, когда двойной (вредоносный) мутант имеет более тяжелый фенотип, чем аддитивные эффекты одиночных мутантов. Креационисты иногда называют сильный позитивный эпистаз неснижаемой сложностью (хотя большинство примеров неправильно идентифицированы).

Знаковый эпистаз Править

Знак эпистаза [22] возникает, когда одна мутация оказывает противоположный эффект при наличии другой мутации. Это происходит, когда вредная мутация сама по себе может усилить эффект конкретной полезной мутации. [17] Например, большой и сложный мозг - это пустая трата энергии без ряда органов чувств, но органы чувств становятся более полезными благодаря большому и сложному мозгу, который может лучше обрабатывать информацию. Если в фитнес-ландшафте нет признаков эпистаза, это называется гладкий; плавный.

В крайнем случае, реципрокный знак эпистаза [23] возникает, когда два вредных гена полезны вместе. Например, производство одного токсина может убить бактерию, а производство одного экспортера токсина может тратить энергию, но производство того и другого может улучшить физическую форму за счет уничтожения конкурирующих организмов. Если в фитнес-ландшафте есть знаковый эпистаз, но нет реципрокного эпистаза, то это называется полугладкий. [24]

Эпистаз реципрокного знака также приводит к генетическое подавление при этом две вредные мутации вместе менее вредны, чем каждая по отдельности, то есть одна компенсирует другую. Этот термин может также относиться к эпистазу признаков, когда двойной мутант имеет фенотип, промежуточный между фенотипом одиночных мутантов, и в этом случае более тяжелый фенотип одиночного мутанта подавляется другой мутацией или генетическим состоянием. Например, в диплоидном организме гипоморфный (или частично потерявший функцию) мутантный фенотип можно подавить, выбив одну копию гена, который действует противоположным образом по тому же пути. В этом случае второй ген описывается как «доминантный супрессор» гипоморфного мутанта «доминантный», потому что эффект наблюдается, когда присутствует одна копия гена-супрессора дикого типа (т.е. даже в гетерозиготе). Для большинства генов фенотип гетерозиготной супрессорной мутации сам по себе будет диким типом (потому что большинство генов не гапло-недостаточны), так что фенотип с двойным мутантом (супрессия) занимает промежуточное положение между фенотипом одиночных мутантов.

При эпистазе реципрокных знаков приспособленность мутанта находится посередине экстремальных эффектов, наблюдаемых при эпистазе реципрокных знаков.

Когда две мутации жизнеспособны по отдельности, но смертельны в сочетании, это называется Синтетическая летальность или несвязанное несовпадение. [25]

Гаплоидные организмы Править

В гаплоидном организме с генотипами (по двум локусам) ab, Ab, аБ или AB, мы можем думать о различных формах эпистаза как влияющих на величину фенотипа при мутации индивидуально (Ab и aB) или в комбинации (AB).

Тип взаимодействия ab Ab аБ AB
Нет эпистаза (добавка) 0 1 1 2 AB = Ab + аБ + ab
Положительный (синергический) эпистаз 0 1 1 3 AB & gt Ab + аБ + ab
Отрицательный (антагонистический) эпистаз 0 1 1 1 AB & lt Ab + аБ + ab
Знак эпистаза 0 1 -1 2 AB имеет противоположный знак Ab или аБ
Реципрокный знак эпистаза 0 -1 -1 2 AB имеет знак, противоположный Ab а также аБ

Диплоидные организмы Править

Эпистаз у диплоидных организмов дополнительно осложняется наличием двух копий каждого гена. Эпистаз может происходить между локусами, но, кроме того, могут происходить взаимодействия между двумя копиями каждого локуса в гетерозиготах. Для двухлокусной, двухаллельной системы существует восемь независимых типов взаимодействия генов. [26]

Аддитивный локус Аддитивный локус B Доминирование А локус Локус доминирования B
аа аА AA аа аА AA аа аА AA аа аА AA
BB 1 0 –1 BB 1 1 1 BB –1 1 –1 BB –1 –1 –1
bB 1 0 –1 bB 0 0 0 bB –1 1 –1 bB 1 1 1
BB 1 0 –1 BB –1 –1 –1 BB –1 1 –1 BB –1 –1 –1
Аддитивный аддитивный эпистаз Добавка от Dominance Epistasis Доминирование аддитивного эпистаза Доминирование посредством доминирования эпистазиса
аа аА AA аа аА AA аа аА AA аа аА AA
BB 1 0 –1 BB 1 0 –1 BB 1 –1 1 BB –1 1 –1
bB 0 0 0 bB –1 0 1 bB 0 0 0 bB 1 –1 1
BB –1 0 1 BB 1 0 –1 BB –1 1 –1 BB –1 1 –1

Аддитивность Править

Это может быть случай, когда несколько генов действуют параллельно для достижения одного и того же эффекта. Например, когда организм нуждается в фосфоре, несколько ферментов, которые расщепляют различные фосфорилированные компоненты из окружающей среды, могут действовать аддитивно, увеличивая количество фосфора, доступного для организма. Однако неизбежно наступает момент, когда фосфор больше не является ограничивающим фактором для роста и размножения, и поэтому дальнейшие улучшения метаболизма фосфора имеют меньший эффект или не имеют никакого эффекта (отрицательный эпистаз). Некоторые наборы мутаций в генах также оказались аддитивными. [27] Сейчас считается, что строгая аддитивность является скорее исключением, чем правилом, поскольку большинство генов взаимодействуют с сотнями или тысячами других генов. [18] [19]

Эпистаз между генами Править

Эпистаз в геномах организмов возникает из-за взаимодействия между генами внутри генома. Это взаимодействие может быть прямым, если гены кодируют белки, которые, например, являются отдельными компонентами многокомпонентного белка (такого как рибосома), ингибируют активность друг друга, или если белок, кодируемый одним геном, модифицирует другой (например, фосфорилированием). Альтернативно взаимодействие может быть непрямым, когда гены кодируют компоненты метаболического пути или сети, пути развития, пути передачи сигналов или сети факторов транскрипции. Например, ген, кодирующий фермент, синтезирующий пенициллин, бесполезен для грибов без ферментов, которые синтезируют необходимые предшественники в метаболическом пути.

Эпистаз в генах Править

Подобно тому, как мутации в двух отдельных генах могут быть неаддитивными, если эти гены взаимодействуют, мутации в двух кодонах внутри гена могут быть неаддитивными. В генетике это иногда называют внутригенная комплементация когда одна вредная мутация может быть компенсирована второй мутацией в этом гене. Это происходит, когда аминокислоты в белке взаимодействуют. Из-за сложности фолдинга и активности белка аддитивные мутации редки.

Белки удерживаются в своей третичной структуре за счет распределенной внутренней сети кооперативных взаимодействий (гидрофобных, полярных и ковалентных). [28] Эпистатические взаимодействия происходят всякий раз, когда одна мутация изменяет локальное окружение другого остатка (либо непосредственно контактируя с ним, либо вызывая изменения в структуре белка). [29] Например, в дисульфидном мостике один цистеин не влияет на стабильность белка до тех пор, пока второй цистеин не присутствует в правильном месте, и в этот момент два цистеина образуют химическую связь, которая увеличивает стабильность белка. [30] Это можно было бы наблюдать как положительный эпистаз, когда вариант с двойным цистеином имел гораздо более высокую стабильность, чем любой из вариантов с одним цистеином. И наоборот, когда вводятся вредные мутации, белки часто демонстрируют мутационную устойчивость, в результате чего, когда стабилизирующие взаимодействия разрушаются, белок все еще функционирует, пока не достигнет некоторого порога стабильности, после чего дальнейшие дестабилизирующие мутации имеют большие пагубные эффекты, поскольку белок больше не может сворачиваться. Это приводит к отрицательному эпистазу, когда мутации, которые по отдельности имеют незначительный эффект, вместе имеют большой вредный эффект. [31] [32]

В ферментах структура белка ориентирует несколько ключевых аминокислот в точную геометрию, чтобы сформировать активный центр для выполнения химии. [33] Так как эти сети активных сайтов часто требуют кооперации нескольких компонентов, мутация любого из этих компонентов значительно снижает активность, и поэтому мутация второго компонента оказывает относительно незначительное влияние на уже инактивированный фермент. Например, удаление любого члена каталитической триады многих ферментов снизит активность до уровней, достаточно низких, чтобы организм стал нежизнеспособным. [34] [35] [36]

Гетерозиготный эпистаз Править

Диплоидные организмы содержат по две копии каждого гена. Если они разные (гетерозиготные / гетероаллельные), две разные копии аллеля могут взаимодействовать друг с другом, вызывая эпистаз. Иногда это называют аллельная комплементация, или межараллельное дополнение. Это может быть вызвано несколькими механизмами, например трансвекцией, когда энхансер одного аллеля действует в транс для активации транскрипции с промотора второго аллеля. С другой стороны, транс-сплайсинг двух нефункциональных молекул РНК может давать единственную функциональную РНК. Точно так же на уровне белка белки, которые функционируют как димеры, могут образовывать гетеродимер, состоящий из одного белка из каждого альтернативного гена, и могут проявлять свойства, отличные от свойств гомодимера одного или обоих вариантов.

Фитнес-ландшафты и возможность развития Править

В эволюционной генетике признак эпистаза обычно более значим, чем величина эпистаза. Это связано с тем, что величина эпистаза (положительного и отрицательного) просто влияет на то, насколько полезны мутации вместе, однако знаковый эпистаз влияет на то, являются ли комбинации мутаций полезными или вредными. [10]

Фитнес-ландшафт - это представление пригодности, где все генотипы расположены в 2D-пространстве, а приспособленность каждого генотипа представлена ​​высотой на поверхности. Его часто используют в качестве визуальной метафоры для понимания эволюции как процесса движения вверх от одного генотипа к следующему, более близкому, более подходящему генотипу. [18]

Если все мутации аддитивны, они могут быть получены в любом порядке и все равно будут давать непрерывную восходящую траекторию. Ландшафт идеально ровный, только с одним пиком (глобальным максимумом), и все последовательности могут развиваться вверх к нему за счет накопления полезных мутаций. в любом порядке. И наоборот, если мутации взаимодействуют друг с другом посредством эпистаза, ландшафт приспособленности становится трудным, поскольку эффект мутации зависит от генетического фона других мутаций. [37] В крайнем случае взаимодействия настолько сложны, что приспособленность «не коррелирует» с последовательностью генов, а топология ландшафта случайна. Это называется сложным ландшафтом приспособленности и имеет серьезные последствия для эволюционной оптимизации организмов. Если мутации вредны в одной комбинации, но полезны в другой, наиболее подходящие генотипы могут быть доступны только путем накопления мутаций. в одном конкретном порядке. Это увеличивает вероятность того, что организмы застрянут на локальных максимумах в ландшафте приспособленности, приобретя мутации в «неправильном» порядке. [32] [38] Например, вариант β-лактамазы TEM1 с 5 мутациями способен расщеплять цефотаксим (антибиотик третьего поколения). [39] Однако из 120 возможных путей к этому 5-мутантному варианту только 7% доступны для эволюции, так как остальные прошли через долины приспособленности, где комбинация мутаций снижает активность. Напротив, было показано, что изменения в окружающей среде (и, следовательно, формы фитнес-ландшафта) обеспечивают выход из локальных максимумов. [32] В этом примере отбор при изменении антибиотической среды привел к «воротной мутации», которая эпистатически положительно взаимодействовала с другими мутациями на эволюционном пути, эффективно пересекая «долину пригодности». Эта мутация-шлюз смягчила негативные эпистатические взаимодействия других индивидуально полезных мутаций, позволяя им лучше функционировать согласованно. Таким образом, сложные среды или выборки могут обходить локальные максимумы, обнаруженные в моделях, предполагающих простой положительный выбор.

Высокий эпистаз обычно считается сдерживающим фактором для эволюции, а улучшения высокоэпистатического признака считаются менее эволюционирующими. Это связано с тем, что при любом генетическом фоне очень мало мутаций будут полезными, хотя может потребоваться много мутаций, чтобы в конечном итоге улучшить признак. Отсутствие гладкого ландшафта затрудняет для эволюции достижение пиков фитнеса. В сильно пересеченных ландшафтах «фитнес-долины» блокируют доступ к некоторым генам, и даже если существуют гребни, обеспечивающие доступ, они могут быть редкими или чрезмерно длинными. [40] Более того, адаптация может перемещать белки в более опасные или труднопроходимые области фитнес-ландшафта. [41] Эти меняющиеся «территории приспособленности» могут замедлять эволюцию и представлять собой компромисс для адаптивных черт.

Разочарование адаптивной эволюции из-за сложных ландшафтов приспособленности было признано потенциальной силой для эволюции эволюционируемости. Майкл Конрад в 1972 году был первым, кто предложил механизм эволюции эволюционируемости, отметив, что мутация, которая сглаживает ландшафт приспособленности в других локусах, может способствовать производству полезных мутаций и путешествовать автостопом вместе с ними. [42] [43] Руперт Ридл в 1975 году предположил, что новые гены, которые производят те же фенотипические эффекты с единственной мутацией, как и другие локусы с реципрокным эпистазом знаков, будут новым средством для достижения фенотипа, который в противном случае слишком маловероятен в результате мутации. [44] [45]

Суровые эпистатические ландшафты фитнеса также влияют на траектории эволюции. Когда мутация имеет большое количество эпистатических эффектов, каждая накопленная мутация резко меняет набор доступных полезных мутаций. Следовательно, выбранная эволюционная траектория во многом зависит от того, какие ранние мутации были приняты. Таким образом, повторения эволюции от одной и той же начальной точки имеют тенденцию расходиться к разным локальным максимумам, а не сходиться к одному глобальному максимуму, как это было бы в гладком аддитивном ландшафте. [46] [47]

Эволюция пола Править

Считается, что отрицательный эпистаз и пол тесно взаимосвязаны. Экспериментально эта идея была проверена с использованием цифрового моделирования асексуальных и сексуальных популяций. Со временем сексуальные популяции движутся к более негативному эпистазу или снижению приспособленности на два взаимодействующих аллеля. Считается, что отрицательный эпистаз позволяет индивидуумам, несущим взаимодействующие вредоносные мутации, эффективно удаляться из популяций. Это удаляет эти аллели из популяции, в результате чего в целом популяция становится более подходящей. Эта гипотеза была предложена Алексеем Кондрашовым и иногда известна как гипотеза детерминированной мутации [48] ​​и также был протестирован с использованием искусственных генных сетей. [20]

Однако доказательства этой гипотезы не всегда были однозначными, и модель, предложенная Кондрашовым, подвергалась критике за допущение параметров мутации, далеких от реальных наблюдений. [49] Кроме того, в тех тестах, в которых использовались искусственные генные сети, отрицательный эпистаз обнаруживается только в более плотно связанных сетях [20], тогда как эмпирические данные показывают, что естественные генные сети слабо связаны, [50] и теория показывает, что отбор для надежность будет способствовать более редко подключенным и минимально сложным сетям. [50]

Регрессионный анализ Править

Количественная генетика фокусируется на генетической изменчивости из-за генетических взаимодействий. Любые два взаимодействия локусов с определенной частотой гена можно разложить на восемь независимых генетических эффектов с помощью взвешенной регрессии. В этой регрессии наблюдаемые генетические эффекты двух локусов рассматриваются как зависимые переменные, а «чистые» генетические эффекты используются как независимые переменные. Поскольку регрессия является взвешенной, распределение компонентов дисперсии будет изменяться в зависимости от частоты генов. По аналогии можно расширить эту систему до трех или более локусов или до цитоядерных взаимодействий [51]

Циклы двойных мутантов Править

При анализе эпистаза в гене можно использовать сайт-направленный мутагенез для генерации различных генов, а их белковые продукты могут быть проанализированы (например, на стабильность или каталитическую активность). Это иногда называют двойным мутантным циклом, и он включает производство и анализ белка дикого типа, двух одиночных мутантов и двойного мутанта. Эпистаз измеряется как разница между совокупными эффектами мутаций и суммой их индивидуальных эффектов. [52] Это можно выразить как свободную энергию взаимодействия. Ту же методологию можно использовать для исследования взаимодействий между более крупными наборами мутаций, но все комбинации должны быть получены и проанализированы. Например, существует 120 различных комбинаций из 5 мутаций, некоторые или все из которых могут указывать на эпистаз.

Статистический анализ связи Править

Вычислительное предсказание Править

Были разработаны многочисленные вычислительные методы для обнаружения и характеристики эпистаза. Многие из них полагаются на машинное обучение для обнаружения неаддитивных эффектов, которые могут быть упущены статистическими подходами, такими как линейная регрессия. Например, многофакторное снижение размерности (MDR) было разработано специально для непараметрического и безмодельного обнаружения комбинаций генетических вариантов, которые предсказывают фенотип, такой как статус болезни, в популяциях людей. [53] [54] Некоторые из этих подходов широко рассмотрены в литературе. [55] Еще совсем недавно было показано, что методы, использующие идеи теоретической информатики (преобразование Адамара [56] и сжатое зондирование [57] [58]) или вывод максимального правдоподобия [59], позволяют отличать эпистатические эффекты от общих неинформативных эффектов. линейность в структуре карты генотип-фенотип [60], в то время как другие использовали анализ выживаемости пациентов для выявления нелинейности. [61]


Полученные результаты

Предварительная обработка и оценка качества образца РНК-seq хозяина

Сначала мы исследовали экспрессию генов в биоптатах толстой кишки от 18 CF и 15 здоровых людей. В целом, образцы CF и здоровые имели сопоставимое количество считываний (в среднем 28 250 473 и 30 041 827 считываний, соответственно) со средним показателем качества выше 30 по всем образцам (дополнительный файл 2: рисунок S2). Последовательности были аннотированы для получения расчетного числа считываний и транскриптов на миллион килобаз (TPM) с использованием kallisto [19], в результате чего было получено 173 259 транскриптов, из которых 56 283 прошли фильтр среднего TPM больше 1 (TPM & gt 1). Хотя графики анализа главных компонентов (PCA) показали перекрытие между профилями экспрессии большинства образцов от CF и здоровых людей, он выявил два возможных выброса (образцы 1096 и 1117) (дополнительный файл 2: рисунок S3). Кроме того, пять основных транскриптов, управляющих ПК, имели митохондриальное происхождение (дополнительный файл 2: рисунок S4). Следовательно, чтобы уменьшить любую систематическую ошибку при идентификации дифференциально экспрессируемых генов, мы отфильтровали все митохондриальные транскрипты из данных. Мы дополнительно исследовали выбросы, используя оставшиеся стенограммы, вычислив расстояние Кука между образцами, и обнаружили, что два образца (1096 и 1117) все еще были выбросами (дополнительный файл 2: рисунок S5). Это было также очевидно на тепловой карте 20 наиболее высоко экспрессируемых генов (дополнительный файл 2: рисунок S6), где мы обнаружили альтернативный паттерн экспрессии для двух образцов по сравнению с остальными. Таким образом, две пробы CF с выбросами (1096 и 1117) были исключены из дальнейшего анализа.

Различно экспрессируются гены-хозяева в образцах CF и здоровых слизистых оболочек

Чтобы изучить различия в экспрессии генов, мы использовали счетчик считываний из оставшихся 16 CF и 15 здоровых образцов. Используя DESeq2, мы идентифицировали 1543 дифференциально экспрессируемых гена в q значение & lt 0,05 (поправка Бенджамини-Хохберга см. Дополнительный файл 2: Рисунок S8 для графика вулкана). Из 1543 дифференциально экспрессируемых генов у 919 (59%) была повышенная регуляция, а у 624 (41%) - пониженная регуляция у пациентов с МВ. Включение пола в качестве ковариаты в модель существенно не повлияло на результаты (было идентифицировано только 43 дополнительных дифференциально экспрессируемых гена), поэтому мы не включали пол в последующий анализ. Полный список дифференциально экспрессируемых генов, значимых при q значение & lt 0,05 доступно в дополнительном файле 3.

Мы визуализировали паттерн экспрессии пяти (трех с усиленной регуляцией и двух с пониженной регуляцией) случайно выбранных дифференциально экспрессируемых репрезентативных генов и CFTR, от генов, включенных в путь развития колоректального рака (рис. 1а). Мы отметили, что в соответствии с ожиданием изменений иммунитета слизистых оболочек, которые могут компенсировать снижение защитной функции слизи. LCN2 быть одним из лучших дифференциально экспрессируемых генов (q значение = 2,54E-08, критерий Вальда). LCN2 кодирует липокалин 2, который ограничивает рост бактерий за счет секвестрации железосодержащих бактериальных сидерофоров [41]. Однако ряд других ведущих генов вовлечены в основные процессы клеточной биологии и ранее были связаны с патогенезом рака и раком толстой кишки. Примеры включают RRS1 (q value = 6.16E-09), который кодирует гомолог белка рибосомного биогенеза, который способствует ангиогенезу и клеточной пролиферации, но подавляет апоптоз [42] КРТАП5-5 (q value = 4.89E-08), который кодирует связанный с кератином белок 5-5, белок, который играет важную роль в функции цитоскелета и способствует развитию различных злокачественных образований, включая клеточную подвижность и сосудистую инвазию [43] и ALDOB (q value = 2.64E-07), который кодирует альдолазу B, фермент, который способствует метаболическому репрограммированию, связанному с метастатическим раком [44]. Дополнительные примеры дифференциально экспрессируемых генов (изменение в логарифмическом масштабе> 0,5 и q значение & lt 0,05), например CDH3, TP53INP2, E2F1, CCND2, а также SERPINE1, также ранее было показано, что они играют прямую роль в развитии рака толстой кишки и пищеварительного тракта [45,46,47]. В то время как некоторые из этих генов участвуют в основных клеточных функциях, связанных с раком, таких как пролиферация и инвазия [45, 47,48,49,50], другие, например, BEST2, играют важную роль в барьерной функции кишечника и транспорте анионов [51]. Чтобы проверить признаки воспаления в наших данных, мы пересекли наши DEG (q значение & lt 0,05) с данными Hong et al. [52], которые сравнили регуляцию генов у пациентов с болезнью Крона (БК) (с воспалением и без него) и здоровых людей из контрольной группы. Из 43 генов, обогащенных у пациентов с БК с воспалением в их исследовании [52], мы обнаружили только 2 гена, SERPINE1 а также APOB которые совпадают с нашими DEG (точный тест Фишера, п значение = 1). В дополнение к генам, визуализированным на фиг. 1a, дополнительные случайно выбранные дифференциально экспрессируемые гены визуализируются в дополнительном файле 2: фиг. S12), показывая различия в паттернах экспрессии между образцами CF и здоровыми образцами.

Дифференциально экспрессируемые (DE) гены в организме хозяина. а Коробчатая диаграмма шести генов, которые являются частью пути рака желудочно-кишечного тракта (один из ключевых путей заболевания, на который влияет ген DE на q значение & lt 0,05 отсечки), демонстрируя дифференциальную экспрессию между здоровыми образцами и образцами CF. б Заболевания и функциональные пути, наиболее значительно обогащенные генами DE (q значение & lt 0,05), отсортированные по п значение (отсечка - log10 (п значение) & lt 5). Темно-серые полосы представляют пути, связанные с раком. c Сеть генов пути рака желудочно-кишечного тракта: гены с усиленной регуляцией представлены зеленым цветом, а гены с пониженной регуляцией - красным. Интенсивность цвета указывает на большую (более яркую) или более низкую (более тусклую) разницу в выражении лица. Фигуры представляют роль каждого белка (см. Легенду), а на рисунке также показана часть клетки, в которой они наиболее активны.

Затем мы выполнили дополнительный анализ, чтобы классифицировать функциональные пути и пути заболевания среди дифференциально экспрессируемых генов (q значение & lt 0,05) в IPA. Верхние канонические пути (дополнительный файл 2: рисунок S13) в основном отвечают за сигнальные и регуляторные функции, такие как EIF2 сигнализация (п значение = 3.32E-35), сигнализация mTOR (п значение = 3.83E-08) и регуляция хромосомной репликации (п значение = 1.60E − 06). Из 39 значительно обогащенных болезней и функциональных путей (п значение & lt 1.00E-05 (рис. 1b), 14 связаны с раком, включая рак желудочно-кишечного тракта (п значение = 2,61E − 06), рак брюшной полости (п значение = 9,23E-03), рак толстой кишки (п значение = 7.00E-05) и колоректальный рак (п значение = 8,63E-03). Кроме того, используя список дифференциально экспрессируемых генов, мы обнаружили, что промоторные последовательности обогащены сайтами связывания 96 потенциальных регуляторов транскрипции (п значение & lt 0,01 см. «Методы»). Ранее было показано, что многие из этих факторов транскрипции контролируют пути, связанные с раком. Например, MYCN а также КРАС активно участвуют в развитии нейробластомы и колоректального рака соответственно [53, 54]. NHF4A участвует в регуляции транскрипции многих аспектов морфогенеза и функции эпителиальных клеток, что связано с колоректальным раком [55]. CST5, который кодирует цитостатин D, является прямой мишенью для рецептора p53 и витамина D и способствует мезенхимально-эпителиальному переходу для подавления прогрессирования опухоли и метастазирования [56]. E2F3 является мощным регулятором клеточного цикла и апоптоза, который обычно не регулируется при онкогенезе [57].

Метаболическая сеть для дифференциально экспрессируемых генов, связанных с раком желудочно-кишечного тракта (ЖКТ), показана на рисунке 1c, иллюстрирующем взаимодействия между генами, которые активируются при CF (например, TP53INP1, SERPINE1, NCOR1, а также CAPN2) и подавлено в CF (E2F1, MED1, ECND2, а также AS3MT), подчеркивая клеточную локализацию продукта этих генов. Дополнительную генную сеть для колоректального рака можно найти в Дополнительном файле 2: Рисунок S14), где гены также расположены в той области клетки, где они наиболее активны. Мы обнаружили, что такие гены как BEST2 (участвует в переносе ионов) и RUVBL1 (участвующие в клеточном цикле, делении клеток и повреждении клеток) подавляются, в то время как гены, такие как TP53INP2 (участвует в регуляции транскрипции) и CDH3 (участвующие в сенсорной трансдукции) активируются. Учитывая прогнозируемую роль регуляции генов при колоректальном раке и нарушение регуляции путей, связанных с CRC, эти результаты могут помочь понять механизмы, контролирующие раннее начало рака толстой кишки при муковисцидозе.

Разница в составе микробиома между CF и здоровой слизистой оболочкой кишечника

Чтобы лучше понять потенциал взаимодействия измененной микробиоты с хозяином в толстой кишке, мы затем исследовали различия в составе микробиома слизистой оболочки между CF и здоровыми людьми. Мы использовали контроли с отрицательной последовательностью, чтобы убедиться, что на наши последующие результаты не повлияли какие-либо потенциальные загрязнители (см. «Методы»). Мы обнаружили значительную разницу между бета-разнообразием микробиома слизистой оболочки кишечника у пациентов с МВ по сравнению со здоровыми людьми в отношении невзвешенных показателей UniFrac и нефилогенетических показателей Брея-Кертиса (Adonis п значение = 0,001). Как видно на графике PCoA (рис. 2a), образцы были сгруппированы в зависимости от их болезненного состояния (CF или здоровые). Общее биоразнообразие микробиома слизистой оболочки было истощено CF по сравнению со здоровыми образцами, что было отображено значительным уменьшением альфа-разнообразия, измеренного с помощью Chao1 (п значение = 0,015, критерий суммы рангов Вилкоксона, рис. 2a) и наблюдаемые OTU (п значение = 0,024, критерий суммы рангов Вилкоксона, в дополнительном файле 2: рисунок S15)) показатели CF по сравнению со здоровыми контролями.

Различия между муковисцидозом (МВ) и здоровой микробиотой слизистой оболочки кишечника. а (слева) График анализа основных координат, основанный на расстоянии Брея-Кертиса, указывающий на разницу в бета-разнообразии между МВ и здоровым микробиомом слизистой оболочки кишечника. Оси представляют собой процентное отклонение по первым двум основным компонентам, а цвет образцов указывает на их статус мутации, т. Е. Здоровый, CF (другой) и CF (df508) (справа). Коробчатая диаграмма, отображающая разницу в альфа-разнообразии (показатель Chao1) между CF и здоровый микробиом кишечника. б Точечная диаграмма, показывающая значительно дифференциально обильные OTU (q value & lt 0.1), где OTU сгруппированы по родам вдоль у-оси и окрашены по типу. В Икс- ось указывает на log2-кратное изменение МВ по сравнению со здоровым в качестве исходного уровня. c Коробчатые диаграммы, показывающие относительную численность таксонов в процентах, демонстрирующие различную численность между МВ и здоровым микробиомом кишечника (q значение & lt 0,1). d Коробчатая диаграмма, показывающая градиентную тенденцию численности актинобактерий для трех генотипов - здорового, CF (другой) и CF (df508).

Мы оценили изменения численности микробов на различных таксономических уровнях между МВ и здоровым микробиомом слизистой оболочки кишечника с помощью phyloseq. Мы обнаружили 51 OTU, которые были значительно разнородны между CF и здоровыми людьми (q значение & lt 0.1, дополнительный файл 4). На разных таксономических рангах мы обнаружили 7 родов, 10 семейств, 4 порядка, 4 класса и 5 типов, дифференциально распространенные между CF и здоровыми образцами (q значение & lt 0,1 по тесту Вальда. Дополнительный файл 4). В целом, повышенная численность таксонов, преимущественно принадлежащих Firmicutes (в частности, Clostridium) и Fusobacteria, наблюдалась у лиц с МВ по сравнению со здоровыми людьми из контрольной группы, в то время как таксоны, принадлежащие к типам Bacteroidetes, Verrucomicrobia и Proteobacteria, показали заметное снижение у пациентов с МВ по сравнению со здоровым контролем (рис. 2b). В частности, наблюдалось увеличение численности класса Actinobacteria у лиц с МВ по сравнению со здоровым контролем (q значение = 0,079), а Бутирицимонас (q значение = 0,009), Ruminococcaceae (q значение = 0,081), и Суттерелла (q значение = 0,040) были обнаружены обедненными образцами CF (рис. 2c). Дополнительные примеры дифференциально распространенных таксонов между CF и здоровыми образцами можно найти в Дополнительном файле 2: Рисунок S16).

Затем мы проверили, действительно ли CFTR генотип, влияющий на тяжесть заболевания, связан с изменчивостью микробиома. В частности, мы предположили, что вариации в микробиоме коррелируют с количеством аллелей мутации DF508, делецией всего кодона в пределах CFTR это наиболее частая причина CF. Чтобы проверить это, мы выполнили тест отношения правдоподобия для выявления таксонов с различной численностью между тремя классами генотипов: CF-DF508 (гомозиготный по мутации DF508), CF-другой (одна или ноль копий мутации DF508) и здоровый (нет известные мутации в CFTR). Мы обнаружили градиентную тенденцию численности актинобактерий (q значение = 0,081), показывая увеличение численности с увеличением тяжести статуса мутации (рис. 2d).

Чтобы оценить потенциальные функциональные изменения в микробиоме, мы предсказали изобилие метаболических путей и ферментов, используя конвейер PICRUSt [31] и базу данных KEGG, и сравнили их на предмет различий между CF и здоровыми людьми. Было обнаружено, что семь предсказанных путей (как определено уровнем KEGG 3) в разной степени распространены между CF и здоровыми: бактериальные токсины были обогащены CF по сравнению со здоровыми, в то время как метаболизм пропаноата, рестрикционный фермент, биосинтез пантотената и КоА, метаболизм тиамина, аминокислоты- родственные ферменты и биосинтез аминоацил-тРНК были истощены при МВ по сравнению со здоровыми (q значение & lt 0,2 с использованием критерия суммы рангов Вилкоксона в дополнительном файле 2: рисунок S17).

Взаимодействие между генами хозяина, связанными с раком желудочно-кишечного тракта, и кишечными микробами

Чтобы исследовать взаимосвязь между генами-хозяевами и микробами в слизистой оболочке толстой кишки и их потенциальную роль в патогенезе рака желудочно-кишечного тракта у пациентов с МВ, мы рассмотрели корреляции между 250 дифференциально экспрессируемыми генами, обогащенными для рака ЖКТ, и 35 таксонами микробов (исчезли в роде или последний охарактеризованный уровень и отфильтрованный при относительной численности 0,1%, см. «Методы»). Используя корреляции Спирмена, мы обнаружили 50 значимых уникальных корреляций между генами и микробами в кишечнике (q value & lt 0.1), где величина корреляции (Spearman rho) находится в диапазоне от -0,77 до 0,79 (дополнительный файл 5). Интересно, что большинство таксонов, которые в значительной степени коррелировали с генами, также значительно различались по численности между CF и здоровыми людьми. Мы визуализировали все корреляции между численностью таксонов и экспрессией генов хозяина на рис. 3а. В частности, мы обнаружили некоторые значительные положительные корреляции ген-таксон (q значение & lt 0,05), между Бутирицимонас а также ЗНХИТ6 (Spearman rho = 0,76), Christensenellaceae и MDN1 (Spearman rho = 0,78), и Осциллоспира а также NUDT14 (Спирмен ро = 0,79). Несколько значимых отрицательных корреляций (q значение & lt 0,05), например между Christensenellaceae и TBX10 (Spearman rho = - 0,78), а также Ruminococcaceae и LCN2 (Spearman rho = - 0,77) также были обнаружены.

Взаимодействие между генами, связанными с колоректальным раком, и микробами слизистой оболочки кишечника. а График корреляции, отображающий корреляции между генами и микробами. Цвет и размер квадратов указывают на величину корреляции, звездочки указывают на значимость корреляции (** указывает q значение & lt 0,05, а * указывает q значение & lt 0,1). б Сеть, визуализирующая значимые корреляции между генами и микробами (сплошные края, q значение & lt 0,1) и значимые корреляции микроб-микроб (пунктирные края, SparCC | R | & gt = 0,1 и п значение & lt 0,05). Синие края указывают на положительную корреляцию, а красные края указывают на отрицательную корреляцию. Толщина кромки отражает силу корреляции. c Диаграммы рассеяния, изображающие образец группировки образцов муковисцидоза (красный) и здоровых (синий) образцов в нескольких репрезентативных корреляциях ген-микроб, где сила корреляции (Спирмен ро) и значимость (q) указывается вверху каждого графика

Чтобы охарактеризовать потенциальные микробно-микробные взаимодействия в нашем наборе данных, мы вычислили корреляции между микробами, которые значительно коррелировали (q value & lt 0.1) с генами с помощью SparCC (см. «Методы» и Дополнительный файл 5) [35]. Примечательные аспекты значимых корреляций между генами и микробами (q значение & lt 0,1) и значимые корреляции микроб-микроб (SparCC | R | & gt = 0,1 и псевдо-п значение & lt 0,05) графически представлены на фиг. 3b, где сплошные края обозначают корреляции ген-микроб, а пунктирные края обозначают корреляции микроб-микроб. Эта подсеть корреляций между микробами и микробами отображает коррелированные изменения численности в микробиоме как функцию их присутствия (рис. 3b, пунктирные края). Например, Билофила а также Бутирицимонас оба обеднены CF (q значение & lt 0,05), а численность двух родов также коррелирует между особями (SparCC R = 0,5, псевдо-п значение = 0,04). С другой стороны, было обнаружено, что Ruminococcaceae обеднены CF (q значение = 0,081), а Clostridium был обогащен CF (q значение = 0,0004), и этот обратный паттерн совместной встречаемости приводит к отрицательной корреляции между двумя таксонами среди участников исследования (SparCC R = -0,66, псевдо-п значение = 0). Кроме того, в подсети ген-микроб (рис. 3b, сплошные края) микробные узлы имеют в среднем больше краев по сравнению с генами, где Christensenellaceae и Clostridium сформировали отдельные хабы в сети. Это потенциально означает, что эти микробы и пути их развития являются общими для нескольких генов, связанных с раком ЖКТ. Отметить, Билофила, Clostridium, а также Псевдомонады в основном отрицательно коррелируют с генами рака желудочно-кишечного тракта, в то время как Гемофильный, Осциллоспира, Veillonella, Фузобактерии, а также Ацидаминококк только положительно коррелируют с генами рака ЖКТ (q значение & lt 0,1).

В дополнение к общей сети, рис. 3c изображает попарные корреляции между экспрессией гена хозяина и микробными таксонами, где оба ранее были связаны с CRC и, таким образом, могут представлять интерес. Например, LCN2, который, как известно, сверхэкспрессируется при CRC и других видах рака [58], отрицательно коррелирует с Ruminococcaceae (Spearman rho = -0,77, q значение = 0,040), который обнаружен обедненным CRC [59, 60]. Оба DUOX2 а также DUOXA2 обнаружены отрицательные корреляции с Christensenellaceae (Spearman rho & lt - 0,65, q значение & lt 0,1), а DUOXA2 положительно коррелирует с Veillonella (Спирмен ро = 0,70, q значение = 0,082). DUOX2 и его коэффициент созревания DUOXA2 отвечают за H2О2 продуцируется в толстой кишке человека и, как известно, активируется при воспалении желудочно-кишечного тракта [61, 62]. Christensenellaceae, наследуемый таксон [63], снижает численность в обычных аденомах [60], предшественниках CRC, тогда как Veillonella, который, как известно, является провоспалительным, обнаружен в CRC человека [64]. Таким образом, обнаружено, что образец группировки по образцам МВ и здоровых в этих репрезентативных корреляциях аналогичен известным ассоциациям при CRC и других злокачественных новообразованиях желудочно-кишечного тракта.


СОДЕРЖАНИЕ

Факторы транскрипции необходимы для регуляции экспрессии генов и, как следствие, обнаруживаются во всех живых организмах. Количество факторов транскрипции, обнаруженных в организме, увеличивается с размером генома, и более крупные геномы, как правило, содержат больше факторов транскрипции на ген. [12]

В геноме человека около 2800 белков, содержащих ДНК-связывающие домены, и 1600 из них предположительно функционируют как факторы транскрипции [3], хотя другие исследования показывают, что это меньшее количество. [13] Таким образом, примерно 10% генов в геноме кодируют факторы транскрипции, что делает это семейство самым большим семейством белков человека. Кроме того, гены часто фланкируются несколькими сайтами связывания для различных факторов транскрипции, и для эффективной экспрессии каждого из этих генов требуется совместное действие нескольких различных факторов транскрипции (см., Например, ядерные факторы гепатоцитов). Следовательно, комбинаторное использование подмножества примерно 2000 факторов транскрипции человека легко объясняет уникальную регуляцию каждого гена в геноме человека во время развития. [11]

Факторы транскрипции связываются либо с энхансерными, либо с промоторными областями ДНК, примыкающими к генам, которые они регулируют. В зависимости от фактора транскрипции транскрипция соседнего гена регулируется либо с повышением, либо с понижением. Факторы транскрипции используют множество механизмов для регуляции экспрессии генов. [14] Эти механизмы включают:

  • стабилизировать или блокировать связывание РНК-полимеразы с ДНК
  • катализируют ацетилирование или деацетилирование гистоновых белков. Фактор транскрипции может либо делать это напрямую, либо привлекать другие белки с этой каталитической активностью. Многие факторы транскрипции используют один из двух противоположных механизмов для регуляции транскрипции: [15]
      (HAT) активность - ацетилирует гистоновые белки, что ослабляет ассоциацию ДНК с гистонами, что делает ДНК более доступной для транскрипции, тем самым активируя активность транскрипции (HDAC) - деацетилирует гистоновые белки, что усиливает ассоциацию ДНК с гистонами, которые делают ДНК менее доступной для транскрипции, тем самым подавляя транскрипцию
  • Факторы транскрипции - одна из групп белков, которые считывают и интерпретируют генетический «план» в ДНК. Они связываются с ДНК и помогают запустить программу повышенной или пониженной транскрипции генов. Таким образом, они жизненно важны для многих важных клеточных процессов. Ниже приведены некоторые из важных функций и биологических ролей, в которых участвуют факторы транскрипции:

    Базальная регуляция транскрипции Править

    У эукариот для возникновения транскрипции необходим важный класс факторов транскрипции, называемый общими факторами транскрипции (GTF). [17] [18] [19] Многие из этих GTF на самом деле не связывают ДНК, а являются частью большого комплекса преинициации транскрипции, который напрямую взаимодействует с РНК-полимеразой. Наиболее распространенными GTF являются TFIIA, TFIIB, TFIID (см. Также TATA-связывающий белок), TFIIE, TFIIF и TFIIH. [20] Преинициативный комплекс связывается с промоторными областями ДНК выше гена, который они регулируют.

    Дифференциальное усиление транскрипции Править

    Другие факторы транскрипции по-разному регулируют экспрессию различных генов, связываясь с энхансерными участками ДНК, соседними с регулируемыми генами. Эти факторы транскрипции имеют решающее значение для обеспечения экспрессии генов в нужной клетке в нужное время и в нужном количестве, в зависимости от меняющихся требований организма.

    Развитие Править

    Многие факторы транскрипции у многоклеточных организмов участвуют в развитии. [21] Отвечая на стимулы, эти факторы транскрипции включают / выключают транскрипцию соответствующих генов, что, в свою очередь, позволяет изменять морфологию клеток или активность, необходимую для определения судьбы и дифференцировки клеток. Семейство факторов транскрипции Hox, например, важно для правильного формирования структуры тела у организмов, столь же разнообразных, как дрозофилы для людей. [22] [23] Другим примером является фактор транскрипции, кодируемый геном Y (SRY), определяющим пол, который играет важную роль в определении пола у людей. [24]

    Ответ на межклеточные сигналы Править

    Клетки могут общаться друг с другом, высвобождая молекулы, которые производят сигнальные каскады внутри другой рецептивной клетки. Если сигнал требует повышающей или понижающей регуляции генов в клетке-реципиенте, часто факторы транскрипции будут располагаться ниже по течению в сигнальном каскаде. [25] Передача сигналов эстрогена является примером довольно короткого сигнального каскада, который включает фактор транскрипции рецептора эстрогена: эстроген секретируется такими тканями, как яичники и плацента, пересекает клеточную мембрану клетки-реципиента и связывается рецептором эстрогена. в цитоплазме клетки. Затем рецептор эстрогена попадает в ядро ​​клетки и связывается с его участками связывания ДНК, изменяя регуляцию транскрипции связанных генов. [26]

    Реакция на окружающую среду Править

    Факторы транскрипции действуют не только ниже сигнальных каскадов, связанных с биологическими стимулами, но они также могут быть ниже сигнальных каскадов, участвующих в стимулах окружающей среды. Примеры включают фактор теплового шока (HSF), который активирует гены, необходимые для выживания при более высоких температурах, [27] фактор, индуцируемый гипоксией (HIF), который активирует гены, необходимые для выживания клеток в среде с низким содержанием кислорода [28], и связывание регуляторных элементов стеролов. белок (SREBP), который помогает поддерживать надлежащий уровень липидов в клетке. [29]

    Контроль клеточного цикла Править

    Многие факторы транскрипции, особенно те, которые являются протоонкогенами или супрессорами опухолей, помогают регулировать клеточный цикл и, таким образом, определяют, насколько большой станет клетка и когда она сможет разделиться на две дочерние клетки. [30] [31] Одним из примеров является онкоген Myc, который играет важную роль в росте клеток и апоптозе. [32]

    Патогенез Править

    Факторы транскрипции также можно использовать для изменения экспрессии генов в клетке-хозяине, чтобы способствовать патогенезу. Хорошо изученным примером этого являются эффекторы, подобные активаторам транскрипции (эффекторы TAL), секретируемые бактериями Xanthomonas. При введении в растения эти белки могут проникать в ядро ​​растительной клетки, связывать промоторные последовательности растений и активировать транскрипцию генов растений, которые способствуют бактериальной инфекции. [33] Эффекторы TAL содержат центральную область повтора, в которой существует простая взаимосвязь между идентичностью двух критических остатков в последовательных повторах и последовательными основаниями ДНК в целевом сайте эффектора TAL. [34] [35] Это свойство, вероятно, облегчает эволюцию этих белков, чтобы лучше конкурировать с защитными механизмами клетки-хозяина. [36]

    В биологии принято, что важные процессы имеют несколько уровней регулирования и контроля.Это также верно в отношении факторов транскрипции: факторы транскрипции не только контролируют скорость транскрипции, чтобы регулировать количество продуктов генов (РНК и белок), доступных клетке, но и сами факторы транскрипции регулируются (часто другими факторами транскрипции). Ниже приводится краткое описание некоторых способов регулирования активности факторов транскрипции:

    Синтез Править

    Факторы транскрипции (как и все белки) транскрибируются из гена на хромосоме в РНК, а затем РНК транслируется в белок. Любой из этих шагов можно регулировать, чтобы повлиять на продукцию (и, следовательно, активность) фактора транскрипции. Следствием этого является то, что факторы транскрипции могут регулировать сами себя. Например, в петле отрицательной обратной связи фактор транскрипции действует как собственный репрессор: если белок фактора транскрипции связывает ДНК своего собственного гена, он подавляет производство большего количества самого себя. Это один из механизмов поддержания низких уровней фактора транскрипции в клетке. [37]

    Ядерная локализация Править

    У эукариот факторы транскрипции (как и большинство белков) транскрибируются в ядре, но затем транслируются в цитоплазме клетки. Многие белки, которые активны в ядре, содержат сигналы ядерной локализации, которые направляют их в ядро. Но для многих факторов транскрипции это ключевой момент в их регуляции. [38] Важные классы факторов транскрипции, такие как некоторые ядерные рецепторы, должны сначала связать лиганд, находясь в цитоплазме, прежде чем они смогут переместиться в ядро. [38]

    Активация Править

    Факторы транскрипции могут быть активированы (или деактивированы) через их сигнальная область с помощью ряда механизмов, включая:

      Связывание - связывание лиганда может не только влиять на расположение фактора транскрипции в клетке, но и связывание лиганда может также влиять на то, находится ли фактор транскрипции в активном состоянии и способен ли связывать ДНК или другие кофакторы (см., например, ядерные рецепторы ). [39] [40] - Многие факторы транскрипции, такие как белки STAT, должны быть фосфорилированы, прежде чем они смогут связывать ДНК.
    • взаимодействие с другими факторами транскрипции (например, гомо- или гетеродимеризация) или корегуляторные белки

    Доступность сайта связывания ДНК Править

    У эукариот ДНК организована с помощью гистонов в компактные частицы, называемые нуклеосомами, в которых последовательности примерно из 147 пар оснований ДНК образуют

    1,65 оборачивается октамеров гистоновых белков. ДНК в нуклеосомах недоступна для многих факторов транскрипции. Некоторые факторы транскрипции, так называемые факторы-пионеры, все еще способны связывать свои сайты связывания ДНК на нуклеосомной ДНК. Для большинства других факторов транскрипции нуклеосома должна активно разворачиваться молекулярными моторами, такими как ремоделирующие хроматин. [41] В качестве альтернативы, нуклеосома может быть частично развернута под действием температурных колебаний, обеспечивая временный доступ к сайту связывания фактора транскрипции. Во многих случаях фактор транскрипции должен конкурировать за связывание с его сайтом связывания ДНК с другими факторами транскрипции и гистонами или белками негистонового хроматина. [42] Пары факторов транскрипции и других белков могут играть антагонистические роли (активатор против репрессора) в регуляции одного и того же гена.

    Доступность других кофакторов / факторов транскрипции Править

    Большинство факторов транскрипции не работают в одиночку. Многие большие семейства TF образуют сложные гомотипические или гетеротипические взаимодействия посредством димеризации. [43] Чтобы транскрипция гена произошла, ряд факторов транскрипции должен связываться с регуляторными последовательностями ДНК. Этот набор факторов транскрипции, в свою очередь, привлекает промежуточные белки, такие как кофакторы, которые позволяют эффективно привлекать преинициативный комплекс и РНК-полимеразу. Таким образом, чтобы один фактор транскрипции инициировал транскрипцию, все эти другие белки также должны присутствовать, и фактор транскрипции должен находиться в состоянии, в котором он может связываться с ними при необходимости. Кофакторы - это белки, которые модулируют действие факторов транскрипции. Кофакторы взаимозаменяемы между промоторами конкретных генов, белковый комплекс, занимающий промоторную ДНК, и аминокислотная последовательность кофактора определяют его пространственную конформацию. Например, определенные стероидные рецепторы могут обмениваться кофакторами с NF-κB, который является переключателем между воспалением и клеточной дифференцировкой, таким образом, стероиды могут влиять на воспалительный ответ и функцию определенных тканей. [44]

    Взаимодействие с метилированным цитозином Править

    Факторы транскрипции и метилированные цитозины в ДНК играют важную роль в регуляции экспрессии генов. (Метилирование цитозина в ДНК в основном происходит там, где за цитозином следует гуанин в последовательности ДНК от 5 'до 3', сайте CpG.) Метилирование сайтов CpG в промоторной области гена обычно подавляет транскрипцию гена [45], в то время как метилирование CpG в теле гена увеличивает экспрессию. [46] Ферменты ТЕТ играют центральную роль в деметилировании метилированных цитозинов. Деметилирование CpG в промоторе гена за счет активности фермента TET увеличивает транскрипцию гена. [47]

    Были оценены сайты связывания ДНК 519 факторов транскрипции. [48] ​​Из них 169 факторов транскрипции (33%) не имели динуклеотидов CpG в своих сайтах связывания, а 33 фактора транскрипции (6%) могли связываться с CpG-содержащим мотивом, но не проявляли предпочтения в отношении сайта связывания с либо метилированный, либо неметилированный CpG. Было 117 факторов транскрипции (23%), которым было запрещено связываться со своей связывающей последовательностью, если она содержала метилированный сайт CpG, 175 факторов транскрипции (34%) имели усиленное связывание, если их связывающая последовательность имела метилированный сайт CpG, и 25 транскрипционных факторов. факторы (5%) либо ингибировались, либо имели усиленное связывание в зависимости от того, где в последовательности связывания был расположен метилированный CpG.

    Ферменты TET не связываются специфически с метилцитозином, за исключением случаев, когда они задействованы (см. Деметилирование ДНК). Было показано, что множество факторов транскрипции, важных для дифференцировки клеток и спецификации клонов, включая NANOG, SALL4A, WT1, EBF1, PU.1 и E2A, рекрутируют ферменты TET в определенные геномные локусы (в первую очередь энхансеры) для воздействия на метилцитозин (mC) и преобразовать его в гидроксиметилцитозин hmC (и в большинстве случаев пометить их для последующего полного деметилирования в цитозин). [49] TET-опосредованное превращение mC в hmC, по-видимому, нарушает связывание 5mC-связывающих белков, включая белки MECP2 и MBD (Methyl-CpG-связывающий домен), облегчая ремоделирование нуклеосом и связывание факторов транскрипции, тем самым активируя транскрипцию этих белков. гены. EGR1 - важный фактор транскрипции в формировании памяти. Он играет важную роль в эпигенетическом репрограммировании нейронов мозга. Фактор транскрипции EGR1 рекрутирует белок TET1, который инициирует путь деметилирования ДНК. [50] EGR1 вместе с TET1 используется для программирования распределения сайтов метилирования в ДНК мозга во время развития мозга и при обучении (см. Эпигенетика обучения и памяти).

    Факторы транскрипции имеют модульную структуру и содержат следующие домены: [1]

    • ДНК-связывающий домен (DBD), которая прикрепляется к специфическим последовательностям ДНК (энхансеру или промотору. Необходимый компонент для всех векторов. Используется для управления транскрипцией промоторных последовательностей трансгена вектора), прилегающих к регулируемым генам. Последовательности ДНК, которые связывают факторы транскрипции, часто называют элементы ответа.
    • Домен активации (ОБЪЯВЛЕНИЕ), который содержит сайты связывания для других белков, таких как корегуляторы транскрипции. Эти сайты связывания часто называют функции активации (AFs), Домен трансактивации (TAD) или Трансактивационный доменTAD, но не смешивать с TAD топологически ассоциированным доменом. [51]
    • Необязательный сигнальная область (SSD) (например, лиганд-связывающий домен), который воспринимает внешние сигналы и, в ответ, передает эти сигналы остальной части транскрипционного комплекса, что приводит к повышающей или понижающей регуляции экспрессии генов. Кроме того, DBD и сигнально-чувствительные домены могут находиться на отдельных белках, которые связаны в пределах транскрипционного комплекса, чтобы регулировать экспрессию генов.

    ДНК-связывающий домен Править

    Часть (домен) фактора транскрипции, связывающая ДНК, называется его ДНК-связывающим доменом. Ниже приведен частичный список некоторых основных семейств ДНК-связывающих доменов / факторов транскрипции:

    Семья ИнтерПро Pfam SCOP
    основная спираль-петля-спираль [52] ИнтерПро: IPR001092 Pfam PF00010 SCOP 47460
    основная лейциновая молния (bZIP) [53] ИнтерПро: IPR004827 Pfam PF00170 SCOP 57959
    С-концевой эффекторный домен регуляторов двудольного ответа ИнтерПро: IPR001789 Pfam PF00072 SCOP 46894
    Коробка AP2 / ERF / GCC ИнтерПро: IPR001471 Pfam PF00847 SCOP 54176
    спираль-поворот-спираль [54]
    белки гомеодомена, которые кодируются генами гомеобокса, являются факторами транскрипции. Гомеодоменные белки играют решающую роль в регуляции развития. [55] [56] ИнтерПро: IPR009057 Pfam PF00046 SCOP 46689
    лямбда-репрессор ИнтерПро: IPR010982 SCOP 47413
    srf-подобный (фактор ответа сыворотки) ИнтерПро: IPR002100 Pfam PF00319 SCOP 55455
    парная коробка [57]
    крылатая спираль ИнтерПро: IPR013196 Pfam PF08279 SCOP 46785
    цинковые пальцы [58]
    * мультидоменный Cys2Его2 цинковые пальцы [59] ИнтерПро: IPR007087 Pfam PF00096 SCOP 57667
    * Zn2/ Cys6 SCOP 57701
    * Zn2/ Cys8 ядерный рецептор цинкового пальца ИнтерПро: IPR001628 Pfam PF00105 SCOP 57716

    Элементы ответа Править

    Последовательность ДНК, с которой связывается фактор транскрипции, называется сайтом связывания фактора транскрипции или элементом ответа. [60]

    Факторы транскрипции взаимодействуют со своими сайтами связывания, используя комбинацию электростатических (из которых водородные связи являются особым случаем) и сил Ван-дер-Ваальса. Из-за природы этих химических взаимодействий большинство факторов транскрипции связывают ДНК специфическим для последовательности образом. Однако не все основания в сайте связывания фактора транскрипции могут действительно взаимодействовать с фактором транскрипции. Кроме того, некоторые из этих взаимодействий могут быть слабее других. Таким образом, факторы транскрипции не связывают только одну последовательность, но способны связывать подмножество близкородственных последовательностей, каждая из которых имеет разную силу взаимодействия.

    Например, хотя консенсусным сайтом связывания для TATA-связывающего белка (TBP) является TATAAAA, фактор транскрипции TBP также может связывать аналогичные последовательности, такие как TATATAT или TATATAA.

    Поскольку факторы транскрипции могут связывать набор родственных последовательностей, а эти последовательности обычно короткие, потенциальные сайты связывания факторов транскрипции могут возникать случайно, если последовательность ДНК достаточно длинная. Однако маловероятно, что фактор транскрипции свяжет все совместимые последовательности в геноме клетки. Другие ограничения, такие как доступность ДНК в клетке или наличие кофакторов, также могут помочь определить, где на самом деле будет связываться фактор транскрипции. Таким образом, учитывая последовательность генома, все еще трудно предсказать, где фактор транскрипции действительно свяжется в живой клетке.

    Однако дополнительная специфичность распознавания может быть получена за счет использования более чем одного ДНК-связывающего домена (например, тандемных DBD в одном и том же факторе транскрипции или посредством димеризации двух факторов транскрипции), которые связываются с двумя или более соседними последовательностями ДНК.

    Факторы транскрипции имеют клиническое значение по крайней мере по двум причинам: (1) мутации могут быть связаны с конкретными заболеваниями и (2) они могут быть мишенями для лекарств.

    Заболевания Править

    Из-за их важной роли в развитии, межклеточной передаче сигналов и клеточном цикле некоторые заболевания человека были связаны с мутациями в факторах транскрипции. [61]

    Многие факторы транскрипции являются либо опухолевыми супрессорами, либо онкогенами, и, таким образом, их мутации или аберрантная регуляция связаны с раком. Известно, что три группы факторов транскрипции играют важную роль при раке человека: (1) семейства NF-kappaB и AP-1, (2) семейство STAT и (3) стероидные рецепторы. [62]

    Ниже приведены несколько наиболее изученных примеров:

    Состояние Описание Locus
    Синдром Ретта Мутации в факторе транскрипции MECP2 связаны с синдромом Ретта, нарушением психического развития. [63] [64] Xq28
    Диабет Редкая форма диабета, называемая MODY (диабет зрелого возраста у молодых), может быть вызвана мутациями ядерных факторов гепатоцитов (HNF) [65] или фактора-1 промотора инсулина (IPF1 / Pdx1). [66] несколько
    Вербальная диспраксия, связанная с развитием Мутации в факторе транскрипции FOXP2 связаны с онтогенетической вербальной диспраксией, заболеванием, при котором люди не могут производить точно скоординированные движения, необходимые для речи. [67] 7q31
    Аутоиммунные заболевания Мутации в факторе транскрипции FOXP3 вызывают редкую форму аутоиммунного заболевания, называемого IPEX. [68] Xp11.23-q13.3
    Синдром Ли-Фраумени Вызвано мутациями в супрессоре опухоли p53. [69] 17p13.1
    Рак молочной железы Семейство STAT имеет отношение к раку груди. [70] несколько
    Множественный рак Семья HOX вовлечена в различные виды рака. [71] несколько
    Остеоартроз Мутация или снижение активности SOX9 [72]

    Возможные мишени для наркотиков Править

    Примерно 10% прописываемых в настоящее время лекарств напрямую нацелены на класс ядерных рецепторов факторов транскрипции. [73] Примеры включают тамоксифен и бикалутамид для лечения рака груди и простаты соответственно, а также различные типы противовоспалительных и анаболических стероидов. [74] Кроме того, факторы транскрипции часто косвенно модулируются лекарствами через сигнальные каскады. Возможно, удастся напрямую воздействовать на другие менее изученные факторы транскрипции, такие как NF-κB, с помощью лекарств. [75] [76] [77] [78] Считается, что факторы транскрипции, не входящие в семейство ядерных рецепторов, труднее нацелить с помощью низкомолекулярных терапевтических средств, поскольку неясно, являются ли они «лекарственными», но прогресс был достигнут в отношении Pax2 [ 79] [80] и путь надреза. [81]

    Дупликации генов сыграли решающую роль в эволюции видов. Это особенно относится к факторам транскрипции. Как только они появляются в виде дубликатов, накопленные мутации, кодирующие одну копию, могут иметь место без отрицательного воздействия на регуляцию нижестоящих мишеней. Однако недавно были выяснены изменения специфичности связывания ДНК однокопийного фактора транскрипции LEAFY, который встречается у большинства наземных растений. В этом отношении фактор транскрипции с одной копией может претерпевать изменение специфичности через беспорядочный промежуточный продукт без потери функции. Подобные механизмы были предложены в контексте всех альтернативных филогенетических гипотез и роли факторов транскрипции в эволюции всех видов. [82] [83]

    Существуют различные технологии анализа факторов транскрипции. На геномном уровне обычно используются ДНК-секвенирование [84] и исследование баз данных [85]. Белковая версия фактора транскрипции обнаруживается с помощью специфических антител. Образец обнаруживается на вестерн-блоттинге. Используя анализ сдвига электрофоретической подвижности (EMSA), [86] можно определить профиль активации факторов транскрипции. Мультиплексный подход к профилированию активации - это система микросхем TF, в которой несколько различных факторов транскрипции могут быть обнаружены параллельно.

    Наиболее часто используемым методом определения сайтов связывания факторов транскрипции является иммунопреципитация хроматина (ChIP). [87] Этот метод основан на химической фиксации хроматина формальдегидом с последующим совместным осаждением ДНК и интересующего фактора транскрипции с использованием антитела, которое специфически нацелено на этот белок. Затем последовательности ДНК могут быть идентифицированы с помощью микроматрицы или высокопроизводительного секвенирования (ChIP-seq) для определения сайтов связывания факторов транскрипции. Если антитела к интересующему белку отсутствуют, удобной альтернативой может быть DamID. [88]

    Как более подробно описано ниже, факторы транскрипции можно классифицировать по их (1) механизму действия, (2) регуляторной функции или (3) гомологии последовательностей (и, следовательно, структурному сходству) в их ДНК-связывающих доменах.

    Механистический Править

    Существует два механистических класса факторов транскрипции:

      участвуют в образовании преинициационного комплекса. Наиболее распространенные сокращенно обозначаются как TFIIA, TFIIB, TFIID, TFIIE, TFIIF и TFIIH. Они распространены повсеместно и взаимодействуют с основной областью промотора, окружающей сайт (сайты) начала транскрипции всех генов класса II. [89]
    • Факторы восходящей транскрипции представляют собой белки, которые связываются где-то выше сайта инициации, чтобы стимулировать или репрессировать транскрипцию. Это примерно синонимы специфические факторы транскрипции, потому что они значительно различаются в зависимости от того, какие последовательности распознавания присутствуют в непосредственной близости от гена. [90]

    Функциональное редактирование

    Факторы транскрипции были классифицированы в соответствии с их регуляторной функцией: [11]

    • Я. конститутивно активный - постоянно присутствует во всех клетках - общие факторы транскрипции, Sp1, NF1, CCAAT
    • II. условно активный - требуется активация
      • II.A развивающий (специфично для клетки) - экспрессия строго контролируется, но после экспрессии не требует дополнительной активации - GATA, HNF, PIT-1, MyoD, Myf5, Hox, Winged Helix
      • II.B зависимый от сигнала - требуется внешний сигнал для активации
        • II.B.1 внеклеточный лиганд (эндокринный или паракринный) -зависимый - ядерные рецепторы
        • II.B.2 внутриклеточный лиганд (аутокринный) -зависимый - активируется небольшими внутриклеточными молекулами - SREBP, p53, орфанными ядерными рецепторами
        • II.B.3 рецептор-зависимая клеточная мембрана - сигнальные каскады вторичных мессенджеров, приводящие к фосфорилированию фактора транскрипции
          • II.B.3.a резидентные ядерные факторы - находятся в ядре независимо от состояния активации - CREB, AP-1, Mef2
          • II.B.3.b латентные цитоплазматические факторы - неактивные формы находятся в цитоплазме, но при активации перемещаются в ядро ​​- STAT, R-SMAD, NF-κB, Notch, TUBBY, NFAT

          Структурное редактирование

          Факторы транскрипции часто классифицируются на основе сходства последовательностей и, следовательно, третичной структуры их ДНК-связывающих доменов: [91] [10] [92] [9]


          СОДЕРЖАНИЕ

          Большая часть раннего понимания транскрипции пришла от бактерий [2], хотя степень и сложность регуляции транскрипции выше у эукариот. Бактериальная транскрипция регулируется тремя основными элементами последовательности:

            представляют собой элементы ДНК, которые могут связывать РНК-полимеразу и другие белки для успешного инициирования транскрипции непосредственно перед геном. распознают белки-репрессоры, которые связываются с участком ДНК и ингибируют транскрипцию гена.
        • Элементы положительного контроля, которые связываются с ДНК и вызывают более высокие уровни транскрипции. [3]
        • Хотя эти средства регуляции транскрипции также существуют у эукариот, ландшафт транскрипции значительно более сложен как из-за количества задействованных белков, так и из-за присутствия интронов и упаковки ДНК в гистоны.

          Транскрипция основного бактериального гена зависит от силы его промотора и присутствия активаторов или репрессоров. В отсутствие других регуляторных элементов сродство промоторной последовательности к РНК-полимеразам варьируется, что приводит к продукции различных количеств транскрипта. Вариабельная аффинность РНК-полимеразы к различным промоторным последовательностям связана с областями консенсусной последовательности перед сайтом начала транскрипции. Чем больше нуклеотидов промотора согласуется с консенсусной последовательностью, тем сильнее сродство промотора к РНК-полимеразе. [4]

          В отсутствие других регуляторных элементов состояние бактериального транскрипта по умолчанию должно находиться в состоянии «включено», что приводит к продукции некоторого количества транскрипта. Это означает, что регуляция транскрипции в виде белковых репрессоров и элементов положительного контроля может увеличивать или уменьшать транскрипцию. Репрессоры часто физически занимают место промотора, закрывая связывание РНК-полимеразы. В качестве альтернативы репрессор и полимераза могут связываться с ДНК одновременно с физическим взаимодействием между репрессором, предотвращающим открытие ДНК для доступа к минус-цепи для транскрипции. Эта стратегия контроля отличается от эукариотической транскрипции, базальное состояние которой должно быть отключено и где кофакторы, необходимые для инициации транскрипции, сильно зависят от генов. [8]

          Сигма-факторы - это специализированные бактериальные белки, которые связываются с РНК-полимеразами и управляют инициацией транскрипции. Сигма-факторы действуют как медиаторы транскрипции, специфичной для последовательности, так что один сигма-фактор может использоваться для транскрипции всех генов домашнего хозяйства или набора генов, которые клетка желает экспрессировать в ответ на некоторые внешние стимулы, такие как стресс. [9]

          Помимо процессов, регулирующих транскрипцию на стадии инициации, синтез мРНК также контролируется скоростью элонгации транскрипции. [10] Паузы РНК-полимеразы возникают часто и регулируются факторами транскрипции, такими как NusG и NusA, транскрипционно-трансляционным сопряжением и вторичной структурой мРНК. [11] [12]

          Дополнительная сложность создания эукариотической клетки ведет к усложнению регуляции транскрипции. У эукариот есть три РНК-полимеразы, известные как Pol I, Pol II и Pol III. Каждая полимераза имеет определенные цели и активности и регулируется независимыми механизмами. Существует ряд дополнительных механизмов, с помощью которых можно контролировать активность полимеразы. Эти механизмы в целом можно разделить на три основные области:

          • Контроль доступа полимеразы к гену. Это, пожалуй, самый широкий из трех механизмов контроля. Сюда входят функции ферментов ремоделирования гистонов, факторов транскрипции, энхансеров и репрессоров, а также многих других комплексов.
          • Продуктивное удлинение транскрипта РНК. Как только полимераза связывается с промотором, ей требуется другой набор факторов, чтобы позволить ей выйти из комплекса промотора и начать успешную транскрипцию РНК.
          • Прекращение действия полимеразы. Было обнаружено, что ряд факторов контролирует, как и когда происходит терминация, которая будет определять судьбу транскрипта РНК.

          Все три системы работают сообща, интегрируя сигналы от клетки и соответствующим образом изменяя программу транскрипции.

          В то время как в прокариотических системах базальное состояние транскрипции можно рассматривать как неограничивающее (то есть «включено» в отсутствие модифицирующих факторов), эукариоты имеют ограничительное базальное состояние, которое требует привлечения других факторов для генерации транскриптов РНК. Это различие в значительной степени связано с уплотнением генома эукариот путем наматывания ДНК на гистоны с образованием структур более высокого порядка. Это уплотнение делает промотор гена недоступным без помощи других факторов ядра, и, таким образом, структура хроматина является общим местом регуляции. Подобно сигма-факторам у прокариот, общие факторы транскрипции (GTF) представляют собой набор факторов у эукариот, которые необходимы для всех событий транскрипции. Эти факторы ответственны за стабилизацию связывающих взаимодействий и открытие спирали ДНК, чтобы позволить РНК-полимеразе получить доступ к матрице, но, как правило, не обладают специфичностью к различным промоторным сайтам. [13] Большая часть регуляции генов происходит через факторы транскрипции, которые либо рекрутируют, либо ингибируют связывание общего аппарата транскрипции и / или полимеразы. Это может быть достигнуто посредством тесного взаимодействия с коровыми элементами промотора или с помощью элементов-энхансеров, находящихся на большом расстоянии.

          Как только полимераза успешно связывается с матрицей ДНК, ей часто требуется помощь других белков, чтобы покинуть стабильный промоторный комплекс и начать удлинение зарождающейся цепи РНК. Этот процесс называется ускользанием от промотора и представляет собой еще один шаг, на котором регуляторные элементы могут действовать, ускоряя или замедляя процесс транскрипции. Точно так же факторы белка и нуклеиновой кислоты могут связываться с комплексом элонгации и модулировать скорость, с которой полимераза перемещается по матрице ДНК.

          На уровне состояния хроматина Править

          У эукариот геномная ДНК сильно уплотнена, чтобы можно было поместить ее в ядро. Это достигается путем наматывания ДНК на октамеры белка, называемые гистонами, что влияет на физическую доступность частей генома в любой момент времени. Значительные части заглушаются за счет модификаций гистонов и, таким образом, недоступны для полимераз или их кофакторов. Наивысший уровень регуляции транскрипции происходит за счет перестройки гистонов, чтобы обнажить или изолировать гены, потому что эти процессы обладают способностью делать недоступными целые области хромосомы, например, то, что происходит при импринтинге.

          Перестройке гистонов способствуют посттрансляционные модификации хвостов основных гистонов. Широкий спектр модификаций может быть сделан с помощью таких ферментов, как гистоновые ацетилтрансферазы (HAT), гистоновые метилтрансферазы (HMT) и гистоновые деацетилазы (HDAC), среди других. Эти ферменты могут добавлять или удалять ковалентные модификации, такие как метильные группы, ацетильные группы, фосфаты и убиквитин. Модификации гистонов служат для набора других белков, которые могут либо увеличивать уплотнение хроматина и секвестрирующих элементов промотора, либо увеличивать расстояние между гистонами и обеспечивать ассоциацию факторов транскрипции или полимеразы на открытой ДНК. [14] Например, триметилирование H3K27 с помощью поликомбического комплекса PRC2 вызывает уплотнение хромосом и молчание генов. [15] Эти модификации гистонов могут быть созданы клеткой или унаследованы эпигенетическим способом от родителя.

          На уровне метилирования цитозина Править

          Регуляция транскрипции примерно на 60% промоторов контролируется метилированием цитозинов в динуклеотидах CpG (где за 5 ’цитозином следуют 3’ гуаниновые или CpG-сайты). 5-метилцитозин (5-mC) представляет собой метилированную форму цитозина основания ДНК (см. Рисунок). 5-mC - эпигенетический маркер, обнаруживаемый преимущественно в сайтах CpG. В геноме человека встречается около 28 миллионов динуклеотидов CpG. [16] В большинстве тканей млекопитающих в среднем от 70% до 80% цитозинов CpG метилированы (образуя 5-метилCpG или 5-mCpG). [17] Метилированные цитозины в 5’-цитозин-гуанин-3 ’последовательностях часто встречаются группами, называемыми CpG-островами. Около 60% промоторных последовательностей имеют островок CpG, в то время как только около 6% последовательностей энхансера имеют островок CpG. [18] CpG-островки составляют регуляторные последовательности, так как если CpG-островки метилированы в промоторе гена, это может снизить или заглушить транскрипцию гена. [19]

          Метилирование ДНК регулирует транскрипцию гена посредством взаимодействия с белками метилсвязывающего домена (MBD), такими как MeCP2, MBD1 и MBD2. Эти белки MBD наиболее сильно связываются с сильно метилированными островками CpG. [20] Эти белки MBD имеют как метил-CpG-связывающий домен, так и домен репрессии транскрипции. [20] Они связываются с метилированной ДНК и направляют или направляют белковые комплексы с ремоделированием хроматина и / или гистон-модифицирующей активностью на метилированные CpG-островки. Белки MBD обычно репрессируют локальный хроматин, например, катализируя введение репрессивных гистоновых меток или создавая общую репрессивную среду хроматина посредством ремоделирования нуклеосом и реорганизации хроматина. [20]

          Факторы транскрипции - это белки, которые связываются со специфическими последовательностями ДНК, чтобы регулировать экспрессию гена. Последовательность связывания фактора транскрипции в ДНК обычно составляет около 10 или 11 нуклеотидов. Как было обобщено в 2009 году, Vaquerizas et al. указали, что существует около 1400 различных факторов транскрипции, кодируемых в геноме человека генами, которые составляют около 6% всех генов, кодирующих белок человека. [21] Около 94% сайтов связывания факторов транскрипции (TFBS), которые связаны с сигнально-чувствительными генами, встречаются в энхансерах, в то время как только около 6% таких TFBS встречаются в промоторах. [22]

          Белок EGR1 представляет собой особый фактор транскрипции, который важен для регуляции метилирования CpG-островков. Сайт связывания фактора транскрипции EGR1 часто находится в последовательностях энхансера или промотора. [23] Существует около 12000 сайтов связывания EGR1 в геноме млекопитающих, и около половины сайтов связывания EGR1 расположены в промоторах, а половина - в энхансерах. [23] Связывание EGR1 с его сайтом связывания ДНК-мишени нечувствительно к метилированию цитозина в ДНК. [23]

          В то время как в нестимулированных клетках обнаруживаются лишь небольшие количества белка фактора транскрипции EGR1, трансляция EGR1 гена в белок через час после стимуляции резко повышается. [24] Экспрессия белков фактора транскрипции EGR1 в различных типах клеток может стимулироваться факторами роста, нейротрансмиттерами, гормонами, стрессом и травмой. [24] В мозге, когда нейроны активируются, происходит активация белков EGR1, и они связываются (рекрутируют) уже существующие ферменты TET1, которые высоко экспрессируются в нейронах. Ферменты ТЕТ могут катализировать деметилирование 5-метилцитозина. Когда факторы транскрипции EGR1 доставляют ферменты TET1 к сайтам связывания EGR1 в промоторах, ферменты TET могут деметилировать метилированные островки CpG на этих промоторах. После деметилирования эти промоторы могут затем инициировать транскрипцию своих генов-мишеней. Сотни генов в нейронах по-разному экспрессируются после активации нейронов за счет рекрутирования EGR1 TET1 на метилированные регуляторные последовательности в их промоторах. [23]

          Метилирование промоторов также изменяется в ответ на сигналы. Три метилтрансферазы ДНК млекопитающих (DNMT1, DNMT3A и DNMT3B) катализируют присоединение метильных групп к цитозинам в ДНК. В то время как DNMT1 является «поддерживающей» метилтрансферазой, DNMT3A и DNMT3B могут осуществлять новое метилирование. Также существуют две изоформы белка сплайсинга, полученные из DNMT3A ген: белки ДНК-метилтрансферазы DNMT3A1 и DNMT3A2. [25]

          Изоформа сплайсинга DNMT3A2 ведет себя как продукт классического раннего гена и, например, быстро и временно продуцируется после активации нейронов. [26] То, что изоформа ДНК-метилтрансферазы DNMT3A2 связывает и добавляет метильные группы к цитозинам, по-видимому, определяется посттрансляционными модификациями гистонов. [27] [28] [29]

          С другой стороны, активация нейронов вызывает деградацию DNMT3A1, сопровождаемую снижением метилирования по крайней мере одного оцененного целевого промотора. [30]

          Через факторы транскрипции и энхансеры Править

          Факторы транскрипции Править

          Факторы транскрипции - это белки, которые связываются со специфическими последовательностями ДНК, чтобы регулировать экспрессию данного гена. В геноме человека насчитывается около 1400 факторов транскрипции, и они составляют около 6% всех генов, кодирующих белок человека. [21] Сила факторов транскрипции заключается в их способности активировать и / или подавлять широкий репертуар нижестоящих генов-мишеней. Тот факт, что эти факторы транскрипции работают комбинаторно, означает, что только небольшая часть генома организма кодирует факторы транскрипции. Факторы транскрипции действуют через множество механизмов. По одному механизму метилирование CpG влияет на связывание большинства факторов транскрипции с ДНК - в некоторых случаях отрицательно, а в других положительно. [31] Кроме того, часто они находятся в конце пути передачи сигнала, который функционирует, чтобы изменить что-то в факторе, например, его субклеточную локализацию или его активность. Посттрансляционные модификации факторов транскрипции, расположенных в цитозоле, могут вызывать их перемещение в ядро, где они могут взаимодействовать со своими соответствующими энхансерами. Другие факторы транскрипции уже находятся в ядре и модифицированы для обеспечения взаимодействия с факторами транскрипции партнеров. Некоторые посттрансляционные модификации, которые, как известно, регулируют функциональное состояние факторов транскрипции, включают фосфорилирование, ацетилирование, сумоилирование и убиквитилирование. Факторы транскрипции можно разделить на две основные категории: активаторы и репрессоры. В то время как активаторы могут прямо или косвенно взаимодействовать с основным аппаратом транскрипции посредством связывания энхансера, репрессоры преимущественно рекрутируют корепрессорные комплексы, что приводит к репрессии транскрипции за счет конденсации хроматина в энхансерных областях. Также может случиться так, что репрессор может функционировать посредством аллостерической конкуренции против детерминированного активатора, подавляя экспрессию гена: перекрывающиеся ДНК-связывающие мотивы как для активаторов, так и для репрессоров вызывают физическую конкуренцию за место связывания. Если репрессор имеет более высокое сродство к своему мотиву, чем активатор, транскрипция будет эффективно блокироваться в присутствии репрессора. Жесткий регуляторный контроль достигается за счет очень динамичной природы факторов транскрипции. Опять же, существует множество различных механизмов для контроля активности фактора транскрипции. Эти механизмы включают контроль над локализацией белка или контроль над тем, может ли белок связывать ДНК. [32] Примером этого является белок HSF1, который остается связанным с Hsp70 в цитозоле и перемещается в ядро ​​только при клеточном стрессе, таком как тепловой шок. Таким образом, гены, находящиеся под контролем этого фактора транскрипции, останутся нетранскрибируемыми, если клетка не подвергнется стрессу. [33]

          Усилители Править

          Энхансеры или цис-регуляторные модули / элементы (CRM / CRE) представляют собой некодирующие последовательности ДНК, содержащие несколько сайтов связывания активатора и репрессора. Энхансеры имеют длину от 200 п.о. до 1 т.п.н. и могут располагаться проксимально, на 5’-выше промотора, или внутри первого интрона регулируемого гена, или дистально, в интронах соседних генов или межгенных областях вдали от локуса. Посредством образования петель ДНК активные энхансеры связываются с промотором в зависимости от специфичности промотора основного ДНК-связывающего мотива. [34] Дихотомия промотор-энхансер обеспечивает основу для функционального взаимодействия между факторами транскрипции и основным аппаратом транскрипции, чтобы запустить ускользание РНК Pol II от промотора. В то время как можно было подумать, что соотношение энхансер-промотор составляет 1: 1, исследования генома человека предсказывают, что активный промотор взаимодействует с 4-5 энхансерами. Точно так же энхансеры могут регулировать более одного гена без ограничения сцепления и, как говорят, «пропускают» соседние гены, чтобы регулировать более отдаленные. Хотя и нечасто, регуляция транскрипции может включать элементы, расположенные в хромосоме, отличной от той, где находится промотор. Проксимальные энхансеры или промоторы соседних генов могут служить платформами для рекрутирования более дистальных элементов. [35]

          Активация и реализация Enhancer Править

          Повышенная экспрессия генов у млекопитающих может инициироваться, когда сигналы передаются промоторам, связанным с генами. Цис-регуляторные последовательности ДНК, расположенные в областях ДНК, удаленных от промоторов генов, могут иметь очень большое влияние на экспрессию генов, при этом некоторые гены подвергаются до 100-кратному увеличению экспрессии из-за такой цис-регуляторной последовательности. [36] Эти цис-регуляторные последовательности включают энхансеры, глушители, инсуляторы и связывающие элементы. [37] Среди этой совокупности последовательностей энхансеры и связанные с ними белки факторов транскрипции играют ведущую роль в регуляции экспрессии генов. [38]

          Энхансеры - это последовательности генома, которые являются основными регулирующими генами элементами. Энхансеры управляют программами экспрессии генов, специфичных для определенного типа клеток, чаще всего путем обхода больших расстояний, чтобы оказаться в физической близости с промоторами своих генов-мишеней. [39] При исследовании нейронов коры головного мозга было обнаружено 24 937 петель, доставляющих энхансеры к промоторам. [36] Множественные энхансеры, каждый часто на десятках или сотнях тысяч нуклеотидов, удаленных от своих генов-мишеней, замыкаются на промоторах своих генов-мишеней и координируются друг с другом, чтобы контролировать экспрессию их общего гена-мишени. [39]

          На схематической иллюстрации в этом разделе показан энхансер, который зацикливается и находится в непосредственной физической близости с промотором целевого гена. Петля стабилизируется димером соединительного белка (например, димером CTCF или YY1), при этом один член димера прикреплен к его мотиву связывания на энхансере, а другой член прикреплен к его мотиву связывания на промоторе (представленном красные зигзаги на иллюстрации). [40] Некоторые белки факторов транскрипции, специфичные для клеточных функций (в 2018 году Lambert et al. Указали, что в клетке человека имеется около 1600 факторов транскрипции [41]), как правило, связываются со специфическими мотивами на энхансере [22] и небольшой комбинацией этих энхансеров. Связанные факторы транскрипции, когда они приближаются к промотору петлей ДНК, регулируют уровень транскрипции целевого гена. Медиатор (коактиватор) (комплекс, обычно состоящий из примерно 26 белков во взаимодействующей структуре) передает регуляторные сигналы от энхансерных ДНК-связанных факторов транскрипции непосредственно ферменту РНК-полимеразы II (РНКП II), связанному с промотором. [42]

          Энхансеры, когда они активны, обычно транскрибируются с обеих цепей ДНК с РНК-полимеразами, действующими в двух разных направлениях, производя две эРНК, как показано на рисунке. [43] Неактивный энхансер может быть связан с неактивным фактором транскрипции.Фосфорилирование фактора транскрипции может активировать его, и этот активированный фактор транскрипции может затем активировать энхансер, с которым он связан (см. Маленькую красную звездочку, представляющую фосфорилирование фактора транскрипции, связанного с энхансером, на иллюстрации). [44] Активированный энхансер начинает транскрипцию своей РНК перед активацией промотора, чтобы инициировать транскрипцию матричной РНК из своего гена-мишени. [45]

          Нормативный ландшафт Править

          Инициирование, завершение и регуляция транскрипции опосредуются «петлей ДНК», которая объединяет промоторы, энхансеры, факторы транскрипции и факторы процессинга РНК, чтобы точно регулировать экспрессию генов. [46] Захват конформации хромосомы (3C) и недавние методы Hi-C предоставили доказательства того, что активные области хроматина «уплотнены» в ядерных доменах или телах, где усилена регуляция транскрипции. [47] Конфигурация генома важна для близости энхансера и промотора. Решения о судьбе клеток опосредуются высокодинамичными геномными реорганизациями на интерфазе, чтобы модульно включать или выключать целые генные регуляторные сети посредством коротких и дальних реаранжировок хроматина. [48] ​​Связанные исследования демонстрируют, что геномы многоклеточных животных разделены на структурные и функциональные единицы вокруг мегабазы, называемой топологическими ассоциативными доменами (TAD), содержащей десятки генов, регулируемых сотнями энхансеров, распределенных в больших геномных областях, содержащих только некодирующие последовательности. Функция TAD заключается в перегруппировке энхансеров и промоторов, взаимодействующих вместе в одном большом функциональном домене, вместо того, чтобы распространять их в разных TAD. [49] Однако исследования развития мышей указывают на то, что два соседних TAD могут регулировать один и тот же кластер генов. Наиболее актуальное исследование эволюции конечностей показывает, что TAD в 5 'кластере генов HoxD в геномах четвероногих управляет его экспрессией в зародышах зачатков дистальных конечностей, давая рост руке, в то время как рука, расположенная на 3' стороне, делает это в проксимальный зачаток конечности, дающий начало руке. [50] Тем не менее, неизвестно, являются ли TAD адаптивной стратегией для усиления регуляторных взаимодействий или эффектом ограничений на эти же взаимодействия. Границы TAD часто состоят из генов домашнего хозяйства, тРНК, других высокоэкспрессируемых последовательностей и коротких вкрапленных элементов (SINE). Хотя эти гены могут использовать преимущество своего пограничного положения для повсеместной экспрессии, они не связаны напрямую с образованием краев TAD. Специфические молекулы, идентифицированные на границах TAD, называются инсуляторами или архитектурными белками, потому что они не только блокируют утечку экспрессии энхансера, но также обеспечивают точную компартментализацию цис-регуляторных входов в целевой промотор. Эти инсуляторы представляют собой ДНК-связывающие белки, такие как CTCF и TFIIIC, которые помогают рекрутировать структурных партнеров, таких как когезины и конденсины. Локализация и связывание архитектурных белков с соответствующими сайтами связывания регулируется посттрансляционными модификациями. [51] ДНК-связывающие мотивы, распознаваемые архитектурными белками, либо занимают много места и находятся на расстоянии около мегабаз друг от друга, либо имеют низкую занятость внутри TAD. Сайты с высокой занятостью обычно консервативны и статичны, в то время как сайты внутри TAD динамичны в соответствии с состоянием клетки, поэтому сами TAD разделены на субдомены, которые можно назвать субдоменами от нескольких kb до длинных TAD (19). Когда сайты архитектурного связывания находятся на расстоянии менее 100 т.п.н. друг от друга, белки-медиаторы представляют собой архитектурные белки, которые взаимодействуют с когезином. Для subTAD размером более 100 т.п.н. и границ TAD CTCF является типичным изолятором, взаимодействующим с когезией. [52]

          О прединициативном комплексе и побеге промотора Править

          У эукариот рибосомная рРНК и тРНК, участвующие в трансляции, контролируются РНК-полимеразой I (Pol I) и РНК-полимеразой III (Pol III). РНК-полимераза II (Pol II) отвечает за производство информационной РНК (мРНК) внутри клетки. В частности, для Pol II, большая часть регуляторных контрольных точек в процессе транскрипции происходит при сборке и ускользании из комплекса пре-инициации. Ген-специфическая комбинация факторов транскрипции будет рекрутировать TFIID и / или TFIIA в основной промотор с последующей ассоциацией TFIIB, создавая стабильный комплекс, на котором могут собираться остальные общие факторы транскрипции (GTF). [53] Этот комплекс относительно стабилен и может пройти несколько раундов инициации транскрипции. [54] После связывания TFIIB и TFIID, Pol II остальные GTF могут собираться. Эта сборка отмечена посттрансляционной модификацией (обычно фосфорилированием) C-концевого домена (CTD) Pol II посредством ряда киназ. [55] CTD представляет собой большой неструктурированный домен, отходящий от субъединицы RbpI Pol II, и состоит из множества повторов гептадной последовательности YSPTSPS. TFIIH, геликаза, которая остается связанной с Pol II на протяжении транскрипции, также содержит субъединицу с киназной активностью, которая фосфорилирует серины 5 в гептадной последовательности. Точно так же как CDK8 (субъединица массивного мультипротеинового комплекса-медиатора), так и CDK9 (субъединица фактора элонгации p-TEFb) обладают киназной активностью по отношению к другим остаткам на CTD. [56] Эти события фосфорилирования способствуют процессу транскрипции и служат сайтами рекрутирования для механизма процессинга мРНК. Все три из этих киназ отвечают на восходящие сигналы, и неспособность фосфорилировать CTD может привести к остановке полимеразы на промоторе.

          У позвоночных большинство промоторов генов содержат островок CpG с многочисленными сайтами CpG. [57] Когда многие промоторные сайты CpG гена метилированы, ген заглушается. [58] Колоректальный рак обычно имеет от 3 до 6 мутаций водителя и от 33 до 66 мутаций автостопщика или пассажира. [59] Однако подавление транскрипции может иметь большее значение, чем мутации, в развитии рака. Например, при колоректальном раке от 600 до 800 генов транскрипционно подавляются метилированием CpG-островков (см. Регуляцию транскрипции при раке). Репрессия транскрипции при раке также может происходить за счет других эпигенетических механизмов, таких как измененная экспрессия микроРНК. [60] При раке груди репрессия транскрипции BRCA1 может происходить чаще за счет сверхэкспрессии микроРНК-182, чем за счет гиперметилирования промотора BRCA1 (см. Низкая экспрессия BRCA1 при раке груди и яичников).


          Программное обеспечение DEcode и предварительно обученные модели транскриптомов для конкретных тканей и людей доступны на www.differentialexpression.org, https://github.com/stasaki/DEcode и в нашей капсуле Code Ocean (https://doi.org/ 10.24433 / CO.0084803.v1). DEcode находится под лицензией BSD 3-Clause.

          Ли, Т. и Янг, Р. Регуляция транскрипции и ее неправильная регуляция при заболеваниях. Клетка 152, 1237–1251 (2013).

          Lambert, S.A. et al. Факторы транскрипции человека. Клетка 172, 650–665 (2018).

          Glisovic, T., Bachorik, J. L., Yong, J. & amp Dreyfuss, G. РНК-связывающие белки и посттранскрипционная регуляция генов. FEBS Lett. 582, 1977–1986 (2008).

          Бартель, Д. П. МикроРНК: распознавание мишеней и регуляторные функции. Клетка 136, 215–233 (2009).

          Schoenfelder, S. & amp Fraser, P. Дальнодействующие контакты энхансера и промотора в контроле экспрессии генов. Nat. Преподобный Жене. 20, 437–455 (2019).

          Смит, З. Д. и Мейсснер А. Метилирование ДНК: роли в развитии млекопитающих. Nat. Преподобный Жене. 14, 204–220 (2013).

          Roundtree, I. A., Evans, M. E., Pan, T. & amp He, C. Динамические модификации РНК в регуляции экспрессии генов. Клетка 169, 1187–1200 (2017).

          Avsec, Ž. и другие. Репозиторий Kipoi ускоряет обмен сообществом и повторное использование прогностических моделей для геномики. Nat. Biotechnol. 37, 592–600 (2019).

          Либбрехт, М. В. и Нобл, В. С. Приложения машинного обучения в генетике и геномике. Nat. Преподобный Жене. 16, 321–332 (2015).

          Джаганатан К. и др. Прогнозирование склейки на основе первичной последовательности с помощью глубокого обучения. Клетка 176, 535–548 (2019).

          Zhou, J. et al. Предсказание ab initio различных эффектов на экспрессию и риск заболевания на основе последовательностей глубокого обучения. Nat. Genet. 50, 1171–1179 (2018).

          Алипанахи Б., Делонг А., Вейраух М. Т. и Фрей Б. Дж. Предсказание специфичности последовательности ДНК- и РНК-связывающих белков с помощью глубокого обучения. Nat. Biotechnol. 33, 831–838 (2015).

          Евшин, И., Шарипов, Р., Валеев, Т., Кел, А. и Колпаков, Ф. GTRD: база данных сайтов связывания факторов транскрипции, идентифицированных с помощью экспериментов ChIP-seq. Nucleic Acids Res. 45, D61 – D67 (2017).

          Zhu, Y. et al. POSTAR2: расшифровка логики посттранскрипционной регуляции. Nucleic Acids Res. 47, D203 – D211 (2019).

          Агарвал В., Белл Г. В., Нам Дж. И Бартель Д. П. Предсказание эффективных сайтов-мишеней микроРНК в мРНК млекопитающих. электронная жизнь 4, e05005 (2015).

          Melé, M. et al. Геномика человека. Человеческий транскриптом в тканях и индивидуумах. Наука 348, 660–665 (2015).

          Шрикумар, А., Гринсайд, П. и Кундаже, А. Изучение важных функций посредством распространения различий в активации. В Материалы 34-й Международной конференции по машинному обучению, Труды исследований в области машинного обучения Vol. 70 (редакторы Precup, D. & amp Teh, Y. W.) 3145–3153 (ICML, 2017).

          Лундберг, С. М. и Ли, С. Единый подход к интерпретации прогнозов модели. Adv. Neural Inf. Процесс. Syst. 30, 4765–4774 (2017).

          Чонг, Дж. А. и др. REST: белок-глушитель млекопитающих, который ограничивает экспрессию гена натриевого канала в нейронах. Клетка 80, 949–957 (1995).

          Императо, М. Р., Коши, П., Обье, Н. и Бонифер, С. Ось RUNX1-PU.1 в контроле кроветворения. Int. J. Hematol. 101, 319–329 (2015).

          Соарес, Э. и Чжоу Х. Основная регулирующая роль p63 в развитии эпидермиса и заболеваниях. Клетка. Мол. Life Sci. 75, 1179–1190 (2018).

          Ватт А.Дж., Гаррисон В.Д. и Дункан С.А. HNF4: центральный регулятор дифференцировки и функции гепатоцитов. Гепатология 37, 1249–1253 (2003).

          Лефтерова, М. И., Хоконссон, А. К., Лазар, М. А. и Мандруп, С. PPARγ и глобальная карта адипогенеза и не только. Тенденции Эндокринол. Метаб. 25, 293–302 (2014).

          Ge, Z., Quek, B.L., Beemon, K. L. & amp Hogg, J. R. Связывающий белок 1 полипиримидинового тракта защищает мРНК от распознавания нонсенс-опосредованным путем распада мРНК. электронная жизнь 5, e11155 (2016).

          Wang, Y. et al. N Модификация 6-метиладенозина дестабилизирует регуляторы развития в эмбриональных стволовых клетках. Nat. Cell Biol. 16, 191–198 (2014).

          Lek, M. et al. Анализ генетической изменчивости, кодирующей белок, у 60 706 человек. Природа 536, 285–291 (2016).

          Goh, K. et al. Сеть болезней человека. Proc. Natl Acad. Sci. Соединенные Штаты Америки 104, 8685–8690 (2007).

          Ардли, К. Г. и др. Пилотный анализ экспрессии генотипа в тканях (GTEx): регуляция многотканевых генов у людей. Наука 348, 648–660 (2015).

          Гамазон, Э. Р. и др. Метод ассоциации на основе генов для картирования признаков с использованием эталонных данных транскриптома. Nat. Genet. 47, 1091–1098 (2015).

          Герстбергер С., Хафнер М. и Тушл Т. Перепись РНК-связывающих белков человека. Nat. Преподобный Жене. 15, 829–845 (2014).

          Гайтери, К., Дин, Ю., Френч, Б., Ценг, Г. С. и Сибилль, Е. За пределами модулей и узлов: потенциал сетей коэкспрессии генов для исследования молекулярных механизмов сложных заболеваний мозга. Гены поведения мозга. 13, 13–24 (2014).

          Кроу М., Лим Н., Баллоуз С., Павлидис П. и Гиллис Дж. Предсказуемость дифференциальной экспрессии генов человека. Proc. Natl Acad. Sci. Соединенные Штаты Америки 116, 6491–6500 (2019).

          Бергстра, Дж., Комер, Б., Элиасмит, К., Яминс, Д. и Кокс, Д. Д. Hyperopt: библиотека Python для выбора модели и оптимизации гиперпараметров. Comput. Sci. Discov. 8, 014008 (2015).

          Короткевич Г., Сухов В. и Сергушичев А. Анализ быстрого пополнения набора генов. Препринт на bioRxiv https://www.biorxiv.org/content/10.1101/060012v2 (2019).

          Liberzon, A. et al. База данных молекулярных сигнатур (MSigDB). Коллекция наборов генов. Cell Syst. 1, 417–425 (2015).

          Мерико Д., Иссерлин Р., Стюкер О., Эмили А. и Бадер Г. Д. Карта обогащения: сетевой метод визуализации и интерпретации обогащения набора генов. PLoS ONE 5, e13984 (2010).

          Dawes, R., Lek, M. & amp; Cooper, S.T. Набор инструментов информатики для открытия генов определяет гены-кандидаты для необъяснимого бесплодия и пренатальной или младенческой смертности. NPJ Genom. Med. 4, 8–11 (2019).

          Смит, К. Л., Блейк, Дж. А., Кадин, Дж. А., Ричардсон, Дж. Э. и Булт, С. Дж. База данных генома мышей (MGD) -2018: база знаний для лабораторных мышей. Nucleic Acids Res. 46, D836 – D842 (2018).

          Koscielny, G. et al. Веб-портал Международного консорциума по фенотипированию мышей, единая точка доступа для нокаутных мышей и связанных данных фенотипирования. Nucleic Acids Res. 42, D802 – D809 (2014).

          Черняк, А. и др. Составление карты зависимости от рака. Клетка 170, 564–576 (2017).

          Кулешов М.В. и др. Enrichr: обновление веб-сервера для комплексного анализа обогащения набора генов 2016 г. Nucleic Acids Res. 44, W90 – W97 (2016).

          Chen, E. Y. et al. Enrichr: интерактивный и совместный инструмент анализа пополнения списка генов HTML5. BMC Bioinformatics 14, 128 (2013).

          Кларк, Д. Дж. Б. и др. eXpression2Kinases (X2K) Web: связывание сигнатур экспрессии с вышестоящими клеточными сигнальными сетями. Nucleic Acids Res. 46, W171 – W179 (2018).

          Ritchie, M.E. et al. Limma проводит анализ дифференциальной экспрессии для секвенирования РНК и исследований на микрочипах. Nucleic Acids Res. 43, e47 (2015).

          Робин, X. et al. pROC: пакет с открытым исходным кодом для R и S + для анализа и сравнения кривых ROC. BMC Bioinformatics 12, 77 (2011).

          Канехиса, М. и Гото, С. КЕГГ: Киотская энциклопедия генов и геномов. Nucleic Acids Res. 28, 27–30 (2000).


          Вступление

          hnRNPH и F управляют альтернативно сплайсированными событиями (ASE) путем связывания с трактами G, расположенными в непосредственной близости к сайтам сплайсинга 5 & # x02032 или 3 & # x02032 (ss), причем G-триплеты являются основным мотивом распознавания [1], [2], [3], [4], [5]. hnRNPH и F могут либо усиливать, либо ингибировать альтернативно сплайсированный экзон, и величина эффекта зависит от длины трактов G, интронного и экзонного положения и силы 5 & # x02032 ss [6], [7] , [8], [9], [10]. Мы показали, что hnRNPH / F регулируют соотношение основного протеолипидного белка миелина (PLP) / DM20 преимущественно за счет усиления отбора сайта сплайсинга DM20 5 & # x02032 через длинные тракты G, расположенные в экзоне 3B непосредственно ниже DM20 5 & # x02032ss [11 ], [12], [13]. В отличие от других ASE, hnRNPH и F осуществляют новую синергическую регуляцию альтернативно сплайсированного PLP, и их функция не является избыточной [12].

          Альтернативный сплайсинг PLP является зависимым от дифференцировки событием в олигодендроцитах (OL), продуцирующих миелин клетках центральной нервной системы (ЦНС). Эндогенная экспрессия hnRNPH и F высока в клетках-предшественниках олигодендроцитов (OPC) и снижается в дифференцированных OL in vitro в то время, когда отношение PLP / DM20 увеличивается [12]. Кроме того, siRNA-опосредованный нокдаун hnRNPH / F увеличивает соотношение PLP / DM20 в линии клеток олигодендроцитов, клеток Oli-neu [12]. Подавление hnRNPH / F временно связано с переходом клеток-предшественников олигодендроцитов в дифференцированный OL, предполагая, что hnRNPH / F может вносить широкий вклад в индуцированные дифференцировкой изменения в сплайсинге и экспрессии генов, которые происходят как часть программы дифференцировки OL.

          Многие превосходные полногеномные исследования охарактеризовали роль G трактов в сплайсинге [6], [7], [14]. Глобальный анализ опосредованной hnRNPH / F регуляции альтернативного сплайсинга в масштабе всего генома был проведен в Т-клетках 293 человека [15] и для относительно небольшого числа генов, связанных преимущественно с апоптозом и раком, в раковых клетках [16]. В этом исследовании мы стремились изучить глобальное влияние hnRNPH / F-опосредованной регуляции событий сплайсинга в олигодендроцитах и ​​определить, регулируются ли гены, участвующие в прогрессировании клонов OL с помощью hnRNPH / F.

          С этой целью мы выполнили транскриптомный анализ всего генома на уровне гена и экзона в клетках Oli-neu, обработанных siRNA, которые нацелены на hnRNPH / F по сравнению с необработанными клетками, с использованием платформ массива экзонов Affymetrix. Уровни экспрессии генов и регулируемые экзоны были идентифицированы с помощью алгоритма EASANA [17], [18]. Биоинформатические анализы были выполнены для определения структурных свойств G-трактов, таких как длина, расстояние и положение, которые коррелируют с эффектом усиления или подавления hnRNPH / F. Экспрессия генов, участвующих в сигнальных путях, регулируется hnRNPH / F. Гены, которые регулируют переход OPC в OL, по-разному экспрессируются в hnRNPH / F молчащих Oli-neu клетках. Эти изменения были подтверждены при разработке OL. in vivo.

          Это первый полногеномный анализ событий сплайсинга и генов, дифференциально регулируемых hnRNPH / F при OL, и первое сообщение о том, что hnRNPH / F регулируют гены, участвующие в переходе от OPC к OL.


          Для получения дополнительной информации о типах вариантов генов:

          Национальный институт исследования генома человека предлагает говорящий глоссарий генетических терминов. Этот ресурс включает определения, схемы и подробные аудиоописания нескольких вариантов генов, перечисленных выше.

          Краткое объяснение различных типов вариантов доступно на yourgenome.org, службе Wellcome Trust.


          Смотреть видео: 10x Genomics для анализа одиночных клеток и пространственной экспрессии генов. Григорий Аникин (August 2022).