Информация

11.3: Секвенирование всего генома - Биология

11.3: Секвенирование всего генома - Биология



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Необходимость сборки

Учитывая, что длина одного отдельного считывания секвенирования составляет где-то между 45 и 700 пар оснований, мы сталкиваемся с проблемой определения последовательности более длинных фрагментов, таких как хромосомы во всем геноме человека (3 x 109 п.н.). Очевидно, нам нужно разбить геном на более мелкие фрагменты. Для этого есть две разные стратегии:

  1. клон за клоном, при котором сначала создается физическая карта, затем секвенирование, и
  2. полногеномное секвенирование с дробовиком, которое сначала не требует физической карты.

Физическое отображение

Физическая карта - это представление генома, состоящего из клонированных фрагментов ДНК. Таким образом, карта состоит из физических объектов (фрагментов ДНК), а не абстрактных понятий, таких как частоты сцепления и гены, составляющие генетическую карту (Рисунок ( PageIndex {1} )). Обычно можно сопоставить генетические и физические карты, например, путем идентификации клона, который содержит определенный молекулярный маркер. Связь между физическими и генетическими картами позволяет идентифицировать гены, лежащие в основе конкретных мутаций, с помощью клонирования на основе карты вызова процесса.

Для создания физической карты большие фрагменты генома клонируются в плазмидные векторы или в более крупные векторы, называемые бактериальными искусственными хромосомами (BAC). BAC могут содержать фрагменты размером примерно 100 КБ. Набор ВАС, полученных в результате реакции клонирования, будет избыточным, что означает, что разные клоны будут содержать ДНК из одной и той же части генома. Из-за этой избыточности полезно выбрать минимальный набор клонов, которые представляют весь геном, и упорядочить эти клоны в соответствии с последовательностью исходной хромосомы. Обратите внимание, что все это нужно делать, не зная полной последовательности каждого BAC. Поэтому создание физической карты может полагаться на методы, связанные с саузерн-блоттингом: ДНК с концов одного ВАС используется в качестве зонда для поиска клонов, содержащих ту же последовательность. Затем предполагается, что эти клоны перекрывают друг друга. Набор перекрывающихся клонов называется контиг.

Клон-за-клоновое секвенирование

Физическое картирование клонированных последовательностей когда-то считалось предпосылкой для секвенирования генома. Процесс начнется с разбиения генома на части размером с ВАС, упорядочения этих ВАС в карту, а затем разбиения каждого ВАС на серию более мелких клонов, которые обычно затем также картируются. В конце концов, будет идентифицирован минимальный набор клонов меньшего размера, каждый из которых был достаточно мал, чтобы его можно было секвенировать (рисунок ( PageIndex {8} )). Поскольку порядок клонов относительно полной хромосомы был известен до секвенирования, полученная информация о последовательности могла быть легко собрана в одну полную хромосому в конце проекта. Таким образом, секвенирование клон за клоном сводит к минимуму количество реакций секвенирования, которые необходимо проводить, и делает сборку последовательности простой и надежной. Однако недостатком этой стратегии является утомительный процесс построения физической карты до любого упорядочивания.

Секвенирование всего генома

Эта стратегия разбивает геном на фрагменты, достаточно малые для секвенирования, а затем собирает их заново, просто ища перекрытия в последовательности каждого фрагмента. Это позволяет избежать трудоемкого процесса создания физической карты (Рисунок ( PageIndex {2} )). Однако он требует гораздо большего числа реакций секвенирования, чем метод клон за клоном, потому что в подходе дробовика нет способа избежать секвенирования избыточных фрагментов. Также возникает вопрос о возможности сборки полных хромосом на основе простого перекрытия последовательностей множества мелких фрагментов. Это особенно проблема, когда размер фрагментов меньше, чем длина повторяющейся области ДНК. Тем не менее, этот метод сейчас успешно продемонстрирован при почти полном секвенировании многих крупных геномов (рис, человека и многих других). Это текущая стандартная методология.

Однако сборки из дробовика редко могут заполнить полные геномы. Например, геном человека основывался на сочетании последовательности дробовика и физического картирования для получения непрерывной последовательности для длины каждого плеча каждой хромосомы. Обратите внимание, что из-за очень повторяющейся природы центромерной и теломерной ДНК проекты секвенирования редко включают эти гетерохроматические, бедные генами области.

Геномный анализ

Собранный геном - это цепочка из миллионов A, C, G, T. Какие из них представляют собой нуклеотиды, кодирующие белки, и какие из них представляют другие особенности генов и их регуляторных элементов? Процесс геном аннотация полагается на компьютеры для определения таких функций, как стартовые и стоп-кодоны, интроны, экзоны и сайты сплайсинга. Однако некоторые из прогнозов, сделанных этими программами, являются полностью точными, и большинство из них необходимо проверить экспериментально для любого гена особой важности или интереса.


Смотреть видео: Константин Северинов. Введение в молекулярную биологию. Лекция 1: Клетки, Гены, ДНК. (August 2022).