Информация

Трансмиссивность варианта вируса: эмпирические данные или форма шипового белка?

Трансмиссивность варианта вируса: эмпирические данные или форма шипового белка?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Во-первых, я не занимаюсь биологией или медициной. Поскольку в наши дни мы ждем, что ученые скажут нам, является ли индийский вариант SARS Cov 2 более передаваемым, чем исходный вирус, мне приходят в голову следующие два вопроса:

  1. Подтверждают ли ученые увеличение трансмиссивности на основании эмпирических данных?
  2. Могут ли ученые узнать, насколько передается этот вариант, исходя из того, насколько хорошо белок спайка связывается с рецепторами клетки, например, путем моделирования трехмерной складчатой ​​формы спайка на основе его кода в геноме?

Обычно на основе (1). Чтобы процитировать сайт:

Варианты, вызывающие наибольшее беспокойство, могут:

  • распространяться быстрее,
  • уклоняться от естественного или связанного с вакцинами иммунитета,
  • вызвать более тяжелое заболевание,
  • уклоняться от обнаружения доступными тестами, или
  • менее поддаются лечению.

Если вы посмотрите на особенности, которые, по их словам, они ищут в вариантах, то первое, что они упоминают, - это «более быстрое распространение» - единственный способ определить это - это посмотреть на генетику и то, как часто вариант появляется в сравнении с предыдущий момент времени. Пункт 2 можно увидеть только при тестировании - заражаются ли люди, перенесшие инфекцию, снова? Список 3 - посмотрите на тяжесть заболевания у пациентов.

Я уверен, что теперь вы уловили суть дела; надзор - это ответ - все эмпирические данные.

(2) может помочь, а может и не помочь, все, что он говорит, - это потенциальное сродство к рецептору, что является лишь одной частью трансмиссивности. Фактически, нам обычно нужно дождаться появления варианта (нет смысла гнаться за каждым; каждая инфекция будет иметь ту или иную форму варианта в некоторых продуцируемых вирионах - они существуют как квазивиды), прежде чем начнется моделирование. Кроме того, моделирование - довольно плохой метод определения того, будет ли вирус связываться с рецептором. Ознакомьтесь с этой статьей и убедитесь, что многие представители семейства Mustelid плохо связываются при моделировании, но на самом деле они легко заражаются SARS-CoV-2.

На передачу вируса влияют многие другие факторы, такие как титр вируса у пациента, количество вирусных частиц, выделяемых в каждой капле / аэрозоле, выживаемость частиц в воздухе / капле / аэрозоле и т. Д.

Вот хорошая статья от PNAS, в которой рассматриваются биологические особенности трансмиссивности на основе статистического / модельного анализа. Хотя это специально не касается SARS-CoV-2, оно охватывает ряд функций, которые рассматриваются для увеличения передачи вирусов в целом.


Трансмиссивность варианта вируса: эмпирические данные или форма шипового белка? - Биология

После нескольких месяцев передачи от человека к человеку возникли различные линии передачи SARS-CoV-2.

Номенклатура обсуждается, но названия линий PANGO: B.1.1.7, B.1.351 и P.1.

Эти клоны демонстрируют ряд аминокислотных изменений, особенно в S-белке.

B.1.1.7, B.1.351 и P.1 могут быть более передаваемыми, их влияние на тяжесть заболевания не определено.

Некоторые мутации в B.1.351 и P.1 могут влиять на связывание антител или эффективность вакцины.


Вступление

31 декабря 2019 года Страновой офис Всемирной организации здравоохранения (ВОЗ) в Китае был проинформирован о случаях пневмонии неизвестной этиологии, выявленных в городе Ухань, провинция Хубэй 1,2. К 11–12 января 2020 года китайские власти идентифицировали новую одноцепочечную РНК с положительной оболочкой. Бетакоронавирус, с геномом длиной 30 000 нуклеотидов, принадлежащих к Coronaviridae семья, связанная с коронавирусом тяжелого острого респираторного синдрома (SARS-CoV), который вызвал глобальную вспышку в 2002–2004 годах 3. Первоначально названный nCoV-2019 (новый коронавирус 2019 г.), вирус, вероятно, возник в результате нескольких событий рекомбинации у летучих мышей и ящеров 4, а затем был занесен в человеческую популяцию посредством зоонозных передач 1,5, позже он был переименован в SARS-CoV-2, и признан этиологическим агентом коронавирусной болезни 2019 (COVID-19) 6. Эпидемиологические исследования и филогенетический анализ оперативно подтвердили передачу SARS-CoV-2 от человека к человеку воздушным путем 3,7. После его распространения по всему миру ВОЗ объявила вспышку чрезвычайной ситуацией в области общественного здравоохранения, имеющей международное значение, 30 января 2020 года и пандемией 11 марта 2020 года. По состоянию на 16 декабря 2020 года SARS-CoV-2 распространился. в 216 стран с почти 74 миллионами подтвержденных случаев и более 1,6 миллиона смертельных исходов 8.


Результаты и обсуждение

Эпидемиологический обзор эпидемии SARS-CoV-2 в Италии

Италия была одной из первых и наиболее пострадавших стран в мире. К 31 октября 2020 года Министерство здравоохранения и Департамент гражданской защиты Италии сообщили о 1,38 млн случаев заболевания, связанных с SARS-CoV-2, и 49 261 случаях смерти 9. Первые подтвержденные завезенные случаи относятся к 30 января 2020 года, когда у двух туристов из Ухани, Китай, в Риме был выявлен SARS-CoV-2 (рис. & # X000a0 1a). 17 февраля 2020 года правительство Италии подтвердило первый случай заболевания, приобретенный на месте, в небольшом городе на севере Италии (Кодоньо, регион Ломбардия) 10. Три дня спустя первая смерть от COVID-19 в Италии, 78-летнего мужчины, была зарегистрирована в городе Падуя. Поскольку эпидемия быстро распространилась по стране, сделав Италию одной из основных горячих точек SARS-CoV-2 11, итальянское правительство объявило чрезвычайную ситуацию в области общественного здравоохранения национального значения, что позволило ввести ограничительные меры для ограничения новых инфекций 12. Стремясь сгладить эпидемическую кривую, меры изоляции фазы I были впервые введены 7 марта 2020 года в 11 муниципалитетах Северной Италии, где имело место большинство случаев заболевания, и распространены к 11 марта на всю страну (рис. . & # x000a0 1a). Описанная как самая большая изоляция в истории Европы 13, мобильность граждан была ограничена, за исключением «обоснованных» причин, связанных с работой или здоровьем. Универсальная маска требовалась всегда на открытом воздухе. Школы, университетские мероприятия, общественные / культурные мероприятия и спортивные соревнования также были приостановлены по всей стране, а также несущественная коммерческая деятельность. Границы с другими государствами были закрыты, а общественный транспорт внутри страны был ограничен или остановлен.

а Хронология основных событий после первых подтвержденных случаев заражения SARS-CoV-2 в Италии. б Эпидемическая кривая, показывающая прогрессирование ежедневно регистрируемого числа вирусных инфекций в Италии с начала эпидемии в марте (черная) и изменения в Re оценки за тот же период (зеленый), с указанием фаз блокировки внизу. c Карта кумулятивных случаев SARS-CoV-2 на 100000 жителей в Италии до октября 2020 года.

По мере того, как количество ежедневных вирусных инфекций уменьшалось, меры общественного здравоохранения постепенно смягчались в рамках Фазы II (4 мая), которая позволяла посещать членов семьи, проживающих в том же регионе, и возобновления некоторых деловых операций, а также Фазы III (15 июня ), что позволило вновь открыть предприятия и возобновить поездки внутри страны, но оставило в силе маскирующие мандаты и запреты на крупномасштабные собрания. Значительное замедление числа заражений с начала мая 2020 года (рис. & # X000a0 1b) подтвердило эффективность ограничений фазы I.

После периода, казалось бы, стабильного эпидемического спада, когда в период с июня по август 2013 года было выявлено очень мало новых случаев, в стране обрушилась новая волна эпидемии, в результате чего заболеваемость стала выше, чем раньше. Наложение зарегистрированной эпидемической кривой и динамических оценок эффективного числа репродуктивных органов, Reна протяжении трех основных периодов (первая волна, спад, вторая волна) итальянской эпидемии выявила интересную закономерность (рис. & # x000a0 1b). Re обеспечивает меру среднего числа вторичных инфекций, вызванных одним инфицированным человеком: растущая эпидемия обычно характеризуется: Re& # x02009 & # x0003e & # x020091, а Re& # x02009 & # x0003c & # x020091 указывает на отсутствие роста. Как и ожидалось, Re значения были оценены как & # x0003e2 в начале экспоненциального распространения SARS-CoV-2 в Италии, и быстро упали до значений & # x0003c1 после начала мер по блокировке фазы I. Тем не менее, в период с конца июня по конец августа, в период изоляции этапов II и III, Re значения показали колеблющееся поведение с прогрессивно более высокими пиками (& # x0003e1), несмотря на неизменно низкое количество вновь обнаруживаемых инфекций. Поскольку в сентябре число случаев инфицирования и госпитализаций начало расти, Re временно снизился почти до 1, чтобы снова увеличиться к середине октября, как раз перед началом нового экспоненциального роста инфицированных случаев, который продолжается в настоящее время. Действительно, к 31 октября все регионы Италии, хотя и с разной скоростью, были поражены эпидемией (рис. # X000a0 1c). Быстрое увеличение числа пациентов с COVID-19, нуждающихся в госпитализации в первые месяцы 2020 года, а также Re колебания в период спада эпидемии предполагают, что вирус тайно циркулировал среди необнаруженных кластеров передачи. За это время, возможно, были тысячи легких или бессимптомных инфекций среди необнаруженных (скрытых) резервуаров, которые предшествовали каждой фазе экспоненциального роста каждой эпидемической волны 14,15. Действительно, резкое возрождение случаев после ослабления строгих мер общественного здравоохранения (например, приказов о пребывании дома), которые временно ограничили распространение эпидемии, также наблюдалось в нескольких других европейских странах (например, в Великобритании, Франции и Германии, среди прочих).

Филогенетическая реконструкция итальянской эпидемии SARS-CoV-2

Для дальнейшего исследования мы объединили эпидемиологические данные с филодинамическим анализом 714 вирусных последовательностей, доступных в настоящее время у итальянских пациентов, взятых в период с 30 января по 1 октября 2020 г. (см. Методы). Динамика вирусной популяции оценивалась с использованием непараметрических объединяющих оценок эффективного размера популяции (Ne) с течением времени (мера вирусного разнообразия, представляющая количество разнообразных геномов, вносящих вклад в следующее поколение), учитывая набор правдоподобных историй эволюции с максимальным правдоподобием (ML), выведенных из данных вирусных последовательностей. Хотя отчетливые закономерности можно было наблюдать в Ne оценки, все реконструкции согласны с увеличением Ne до конца марта 2020 года, что соответствует росту числа зарегистрированных случаев (дополнительный рисунок & # x000a01). Модель наилучшего соответствия (т. Е. Набор деревьев с наибольшим правдоподобием, log L& # x02009 & # x0003e & # x02009 & # x0221249,120) также свидетельствует об устойчивом, непрерывном снижении Ne до октября (дополнительный рис. & # x000a01, образец A), что, возможно, отражает влияние мер изоляции на вирусную популяцию. В качестве Ne связано с генетическим разнообразием вирусов, эта закономерность может указывать на то, что, несмотря на быстрый рост случаев заболевания в конце лета, вирусная популяция сохраняла более низкое разнообразие по сравнению с предыдущими месяцами эпидемии. Это согласуется с сокращением завоза вирусов, вероятно, в результате глобальных вмешательств в области общественного здравоохранения, таких как запреты на поездки. Два альтернативных паттерна, выведенные из деревьев, аналогичных по значению вероятности модели наилучшего соответствия, демонстрируют либо аналогичную тенденцию к снижению с последующим заметным увеличением Ne между сентябрем и октябрем (модель B), или более медленное, но устойчивое увеличение Ne с апреля по октябрь (образец C). Обе реконструкции согласуются с увеличением вирусного Ne, что соответствует экспоненциальному росту инфекций SARS-CoV-2 во время второй волны эпидемии. Вместе с предполагаемыми колебаниями Re Значения после первой эпидемической волны анализы предполагают сохранение сложной динамики передачи на протяжении всего периода эпидемического спада, включая необнаруженных бессимптомных или слабо затронутых лиц. Даже учитывая Ne значений, полученных из деревьев машинного обучения с более низкой вероятностью, мы приходим к аналогичному выводу: общее сокращение Ne после апреля, но повторяющиеся колебания во время рецессии и второй эпидемической волны (дополнительный рис. & # x000a01, черные кривые).

Лонгитюдное сравнение моделей распространения SARS-CoV-2 с течением времени между различными регионами Италии показывает, что предварительная фаза блокировки характеризовалась экспоненциальным ростом числа ежедневно подтвержденных случаев COVID-19 и смертей, с наибольшей заболеваемостью на Северо-Западе, с последующим значительным снижением во всех регионах в результате мер изоляции (дополнительный рис. & # x000a02). К концу августа 2020 года эпидемиологические данные также показывают рост и устойчивую передачу инфекции в Южном и Островном регионах, возможно, за счет межрегионального распространения через небольшие семейные / социальные сети. Эти регионы являются основным туристическим направлением для итальянцев, и большинство ограничений на международные поездки все еще действовали во время фазы III 16. Пропорция родословных и региональное распределение в разных частях страны указывают на несколько независимых событий-основателей (рис. & # X000a0 2b). Например, линия A, преобладающая на Сицилии, была обнаружена в эпидемиологически связанных цепях передачи, которые, по-видимому, связаны с иммигрантами, прибывшими из Северной Африки во время последней фазы III 17. Интересно, что количество циркулирующих линий менялось с течением времени (дополнительный рис. & # X000a03). Подлиния B.2 была первой, идентифицированной в январе, что ознаменовало первичное внедрение завозных случаев из Китая (показано на рис. & # X000a0 2). В период с февраля по апрель дополнительные под-линии, такие как.

а Частота линий и суб-линий передачи SARS-CoV-2 среди итальянских макрорегионов. б Распределение наиболее распространенной линии и под-линии по всей стране.

B.1, B.1.1 и B.1.5 возникли в Северной и Центральной Италии, эпицентре первой эпидемической волны, что, вероятно, отражает последующие завозы 18. В начале Фазы II блокировки в мае, после которого произошло резкое сокращение случаев, только B.1. и B.1.1 подсети были обнаружены. В период эпидемического спада с июня по июль несколько суб-линий снова сосуществовали. Однако в последующей второй волне доминировали B.1.1 (сентябрь) и B.1. (Октябрь) (Дополнительный рис. & # X000a03). Поскольку меры фазы II и III разрешали внутрирегиональные и затем межрегиональные поездки, соответственно, в то время как границы стран оставались в основном закрытыми (за исключением европейских стран, участвующих в Шенгенском соглашении), вполне вероятно, что в ходе первой волны эпидемии возникла неоднородность от первоначальных событий-основателей, связанных с международными путешествиями, а затем распространившихся через мобильность внутри государства во время эпидемического спада. Однако такие выводы на основе последовательностей следует интерпретировать с осторожностью из-за присущей им систематической ошибки выборки в полноразмерных геномах SARS-CoV-2, которые в настоящее время доступны у итальянских пациентов, что может повлиять на результаты и ограничить их обобщаемость 18.

В нашем наборе данных последовательностей только Ломбардия (Северо-Запад, наиболее пострадавший регион на данный момент) предоставила надежное количество вирусных геномов (п& # x02009 = & # x02009405), что, в свою очередь, приблизительно соответствует одному геному, доступному на каждые 450 положительных случаев. Абруццо в Центральной Италии - второй наиболее представленный регион с точки зрения доступных геномов (п& # x02009 = & # x0200987), в то время как многие другие регионы, включая Лигурию (северо-запад), Умбрию (центральную) и Калабрию (юг), не представлены полностью (рис. & # x000a0 3a), что влияет на нашу способность характеризовать -глубокая молекулярная эпидемиология SARS-CoV-2 на региональном уровне.

а Карта Италии с указанием количества последовательностей генома SARS-CoV-2 по регионам. Размер кружков указывает количество новых геномов, доступных с начала эпидемии в Италии. б Дерево максимального правдоподобия с временным разрешением для 1421 последовательности SARS-CoV-2, включая 714 из Италии (красные кружки). c Хордовая диаграмма расчетной численности миграционных потоков между географическими районами. d Частота предполагаемого географического происхождения для выявленных кластеров передачи, включающих Италию и происходящих в период с января по октябрь 2020 года. е Частота итальянских последовательностей (выборка с января по октябрь), классифицированных как некластеризованные (серый) или принадлежащих к кластерам с итальянским (белый) или неитальянским происхождением (черный).

Тем не менее, паттерны эволюции вирусов, предполагаемые филогенезом, полезны для подтверждения эпидемиологических данных, проверки гипотез относительно факторов, влияющих на динамику эпидемии, и оценки вмешательств в области общественного здравоохранения, таких как приказы о сохранении дома. С этой целью мы провели временную шкалу лучших деревьев 100 & # x02009ML из всех доступных полных геномов SARS-CoV-2 от итальянских пациентов и сделали вывод о наиболее вероятном расположении каждого внутреннего узла (предковой последовательности) в деревьях (подробности см. В разделе «Методы»). ). Общие топологии предполагаемых деревьев были очень похожи, и линейная регрессия генетических расстояний от корней до кончиков в зависимости от дат выборки указала на достаточный временной сигнал в данных последовательности (дополнительный рисунок & # x000a04). Хотя скорость эволюции SARS-CoV-2 в Италии была несколько ниже (1,44 & # x02009 & # x000d7 & # x0200910 & # x0221204 нуклеотидных замен / сайт / год), чем значения, полученные для всемирной эпидемии 19,20, самый последний общий предок (TMRCA ) доступных итальянских последовательностей в период со 2 января по 26 января (в среднем 14 января) 2020 года, что соответствует дате первого подтвержденного случая (30 января). Точно так же корневой узел (источник) масштабированного по времени дерева ML, включающего как итальянские (п& # x02009 = & # x02009714) и всемирные справочные последовательности (п& # x02009 = & # x020091421) был размещен в Китае (вероятность 99,8%) с TMRCA, датированным началом декабря 2019 года, в соответствии с доступными эпидемиологическими данными 21,22, что дополнительно подтверждает наш вывод о филогенезе. На дереве (рис. & # X000a0 3b) последовательно показано большинство итальянских последовательностей, перемежающихся со штаммами вирусов, собранных в других странах. Эта закономерность, как и наблюдаемая в другом месте 23, подтверждает, что появлению штаммов SARS-CoV-2 во время первой волны эпидемии в первую очередь способствовало воздействие путешествий во время фазы перед блокировкой, а не межрегиональное распространение. Согласно оценке миграционных потоков, мы дополнительно изучили потенциальную роль Италии как экспортера SARS-CoV-2.Количество переходов между состояниями в Италию и из Италии (рис. & # X000a0 3c) в значительной степени зависит от количества и характера последовательностей, которые включены из других мест. Независимо от набора данных и в соответствии с эпидемиологической информацией большинство географических источников интродукции относятся к Европе (рис. & # X000a0 3c). Хорошо поддерживаемые (значения начальной загрузки & # x0003e90%) предполагаемые кластеры передачи внутри филогении были идентифицированы на основе заранее определенного порога генетической дистанции, способного обнаружить эпидемиологически связанные последовательности (см. Методы). Кластеры, содержащие по крайней мере одну итальянскую последовательность, были сочтены интересными для оценки временных и пространственных источников передачи. Временное происхождение каждого кластера было выведено из оцененного часами возраста MRCA всех последовательностей, принадлежащих кластеру. Пространственное происхождение было выведено с использованием совместной вероятностной реконструкции состояния предков с учетом известной страны выборки вершинных узлов (выбранных последовательностей) в дереве. Как и ожидалось, количество (хорошо поддерживаемых) кластеров, сформированных в ходе эпидемии, в значительной степени зависело от количества одновременных выборок (рис. & # X000a0 3d), что ограничивает выводы относительно скорости формирования кластеров с течением времени. Предполагаемое географическое происхождение каждого кластера отражало распределение образцов среди эталонных последовательностей, в основном ограниченных Европой и Северной Америкой. Однако после апреля кластеры передачи можно было отследить только до Италии, что свидетельствует о высокой степени локализации передачи после реализации мер по блокировке на Этапе I. Затем каждая итальянская последовательность была классифицирована либо как некластерная (то есть без кластера с какой-либо другой последовательностью с начальной загрузкой & # x0003e90%), либо принадлежащая локальному (полностью итальянскому) кластеру. Итальянские последовательности в хорошо поддерживаемых кластерах, включая и происходящие из неитальянских штаммов, были классифицированы как принадлежащие к кластерам & # x0201coutside & # x0201d. Наконец, каждый хорошо поддерживаемый кластер, для которого одна страна не могла быть назначена с вероятностью & # x0003e90% в качестве страны происхождения этого кластера, также считался внешним (хотя и неизвестным по происхождению) кластером. Это выявило четкие закономерности между январем, февралем & # x02013-июлем и августом (рис. & # X000a0 3e). Все итальянские кадры, полученные в январе, принадлежали к кластерам иностранного происхождения, что демонстрирует влияние внешних интродукций до того, как были введены ограничения. Преобладающая фракция была быстро заменена последовательностями, принадлежащими к кластерам местного происхождения и некластеризованным последовательностям, что предполагает потенциальную недостаточную выборку. В сентябре месяце, когда нарастала вторая волна эпидемии, в основном преобладали последовательности местного происхождения без последовательностей иностранного происхождения. Доля последовательностей, отобранных в августе (75%), находилась за пределами 95% доверительного интервала (

50%) для фракции в оставшиеся месяцы, подчеркивая значительный вклад локальной передачи в последовательностях, отобранных в сентябре. Однако конкретный мутационный профиль итальянских последовательностей (рис. & # X000a0 4a) относительно Уханьской ссылки (<"type": "entrez-nucleotide", "attrs": <"text": "NC_045512", " term_id ":" 1798174254 "," term_text ":" NC_045512 ">> NC_045512) также предоставили некоторые доказательства недавно импортированных штаммов во время блокировки на Фазе III, когда запреты на поездки начали ослабляться. В частности, 97,34% (п& # x02009 = & # x02009695) доступных последовательностей несли мутацию, кодирующую замену аминокислоты D614G (геномная координата: 23403& # x02009А& # x02009 & # x0003e & # x02009грамм) в белке Spike SARS-CoV-2, а оставшиеся 2,66% (п& # x02009 = & # x0200919) последовательности отображали нуклеотидную последовательность, кодирующую дикий тип D614. Мутация D614G была связана с более высокой инфекционностью и большей трансмиссивностью без влияния на исходы тяжести заболевания 24 & # x0201326, хотя некоторые из этих результатов недавно были подвергнуты сомнению 27. Частота полиморфизма D614G среди регионов Италии с течением времени (рис. & # X000a0 4b) показывает, что G614 быстро стал доминирующим во время первой волны эпидемии и оставался единственным, обнаруженным в доступных последовательностях в течение первых двух фаз блокировки. После этого варианты D614 вновь появились после ослабления мер фазы III на Сицилии (островная Италия), возможно, из-за эпидемиологически связанных цепочек передачи, связанных с иммиграционным потоком из Северной Африки 17, сценарий, подкрепленный линией A SARS-CoV-2. распространенность в этом регионе (рис. & # x000a0 2b).

а Варианты карт наиболее распространенных мутаций, сопоставленных с геномами SARS-CoV-2. Наиболее распространенные мутации, определяемые как мутации, присутствующие в & # x0003e90% геномов в этой группе (черные линии). б& # x02013е Изменение частоты мутации D614G в белке Spike в регионах Италии во время фаз эпидемии. Регионы Италии окрашены в соответствии с доминантной мутацией D614G. Белый цвет представляет собой недостающие геномные данные из нескольких регионов Италии во время фаз эпидемии.

Агентное моделирование стохастической модели итальянской эпидемии

Результаты кластерного анализа указывают на то, что локальная передача инфекции поддерживалась относительно небольшими цепочками передачи в течение месяцев с небольшим количеством сообщений о случаях заболевания и в начале второй волны. Это наблюдение предполагает, что возобновление эпидемии было связано с ослаблением мер изоляции, что привело к увеличению местной передачи, а не к большому количеству повторных интродукций вируса в страну. Такой сценарий также подтверждается исследованиями, показывающими значительное сокращение числа иностранных туристов (около & # x0221265,9%), но увеличение, хотя и небольшое (1,1%), внутреннего туризма в летний сезон после ограничений на межрегиональные поездки. путешествия были расслаблены 16. Чтобы выяснить, может ли повышенная мобильность объяснить вторую волну случаев заболевания в Италии, мы провели моделирование эпидемии на основе стохастических агентов. Данные о мобильности для трех различных видов транспорта (пешеходный, общественный и личный), полученные из отчетов Apple о тенденциях мобильности, использовались в качестве прокси для количества людей, с которыми контактирует инфицированный человек, которое может варьироваться в зависимости от время (см. Методы). Поскольку количество госпитализаций также резко снизилось (и оставалось низким) после первого всплеска случаев, также была проверена роль удаления инфицированных людей из популяции посредством госпитализации, что позволило пропорциональной вероятности выхода инфицированного человека из симуляции. стандартизированной частоте госпитализаций (также меняющейся во времени). Смоделированное количество активных инфекций с течением времени с использованием только данных о мобильности, только данных о госпитализации и их комбинации затем сравнивали с данными эмпирических случаев. В то время как все три модели показали одинаковый уровень новых инфекций во время первой волны эпидемии (дополнительный рис. & # X000a05), изменяющаяся во времени скорость удаления, основанная на частоте госпитализаций (без данных о мобильности), вызвала продолжающийся экспоненциальный рост инфекций (рис. & # x000a0 5a). Как и в эмпирических данных, изменяющееся во времени количество контактов, основанное на мобильности, вызывало две отдельные волны, которые были наиболее похожи на эпидемическую кривую (рис. & # X000a0 5b). Модель, учитывающая как мобильность, так и частоту госпитализаций, вызвала первую волну слишком большой величины, а вторую волну - слишком раннюю по происхождению, чем предыдущая модель (рис. & # X000a0 5c). Модель, включающая только данные о мобильности, привела к наименьшей средней абсолютной ошибке (рис. & # X000a0 5d), создав первую волну аналогичного времени и величины и отложенную вторую волну, что ближе к эмпирическим данным эпидемиологии (рис. & # X000a0 1b). ).

а Вероятность удаления инфицированного человека была пропорциональна эмпирической частоте госпитализации при моделировании активных инфицированных случаев в течение одного года (синий). б Количество людей, с которыми контактирует инфицированный человек, было пропорционально эмпирически определенному количеству людей, использующих ходьбу, а также общественные и личные виды транспорта в качестве основных средств передвижения при моделировании активных инфицированных случаев в течение одного года ( синий). c Показатели госпитализации (как в A) и данные о мобильности (как в B) были объединены при моделировании активных инфицированных случаев в течение одного года (синий). В а& # x02013c, оранжевый представляет количество эмпирически наблюдаемых инфекций. d Абсолютная ошибка была рассчитана для каждой временной точки собранных наблюдений между моделируемыми инфекциями с использованием только частоты госпитализаций (красный), только данных о мобильности (синий) и комбинации (фиолетовый). Средняя абсолютная ошибка рассчитывалась как усредненная ошибка по 1000 моделированиям. Моделирование предполагало однократное внешнее введение.

Хотя результаты показывают, что данные о мобильности могут воспроизводить модели эпидемических волн в Италии, мы не можем исключить дополнительные факторы, которые могли сыграть роль в задержке второй эпидемической волны, не полностью улавливаемые нашим моделированием, такие как сохранение ограничительных мер, различные & # x0201ctypes & # x0201d подвижности между первой и второй волнами, или более высокие температуры летом 28,29.

Сочетая филодинамический анализ вирусных генетических и эпидемиологических данных, мы показываем, как взаимосвязь между вмешательством общественного здравоохранения и изменяющейся динамикой передачи SARS-CoV-2 в Италии может объяснить колебания между периодами относительно стабильного эпидемического спада и резкого возрождения, как это происходит в настоящее время. наблюдается. Этой схеме & # x0201crubberbanding & # x0201d или & # x0201csnapping back & # x0201d после снятия ограничений общественного здравоохранения, к сожалению, последовали несколько других европейских стран. В целом, мы показываем критическую роль, которую играют небольшие кластеры передачи, действующие как & # x0201спрятанные резервуары & # x0201d во время эпидемического спада после агрессивных мер изоляции, в поддержании циркуляции SARS-CoV-2 на низком уровне в Италии, что в конечном итоге вызвало новую волну эпидемии. . Однако, несмотря на постоянное согласие между различными анализами вирусных филогенетических и эпидемиологических данных, необходимо признать ограничения нашей работы. Доступность большого количества вирусных последовательностей, собранных в течение длительного периода времени и достаточно репрезентативных для текущей эпидемии, имеет решающее значение для оперативного геномного надзора, а также оценки и планирования эффективных и своевременных стратегий контроля. Количество итальянских полных геномов SARS-CoV-2, которые в настоящее время хранятся в общедоступных базах данных, составляет очень небольшую долю (0,05%) от задокументированного числа подтвержденных случаев в Италии, а смещение выборки по регионам, по-разному затронутым эпидемией, еще больше ограничивает обобщаемость полученные результаты. Более того, наше определение предполагаемых кластеров передачи (см. Методы) не требует отбора проб и включения всех штаммов, участвующих в цепи передачи, хотя оно позволяет обнаруживать монофилетические клады, которые, вероятно, включают последовательности, эпидемиологически связанные через цепь передачи, хотя не прямо. Тем не менее, эпидемиологические наблюдения, подтвержденные филодинамическим анализом на основе имеющихся последовательностей, показали целостную картину. Первая волна эпидемии в Италии, по-видимому, в значительной степени была связана с проникновением извне, что привело к возникновению крупных кластеров передачи, сопровождающихся большим количеством инфекций. Последующая реализация трехэтапной общенациональной стратегии изоляции значительно снизила число инфекций и госпитализаций летом 2020 года. Тем не менее, когда мобильность увеличилась, а социальное дистанцирование уменьшилось из-за постепенного ослабления мер изоляции, внезапно наблюдался всплеск инфекционных случаев, за которым следовали незамедлительно. по новым госпитализациям. Наша агентная математическая модель резюмирует это явление, дополнительно подтверждая гипотезу о том, что небольшие скопления, наблюдаемые в летнее время, действовали, по сути, как «скрытые резервуары», которые, вероятно, слились после увеличения мобильности и сокращения мер социального дистанцирования. Это, в свою очередь, послужило «искрой» для внезапного роста инфекций, наблюдавшегося в конце лета, что привело к последующей второй волне экспоненциального роста. Другими словами, движущие силы динамики передачи SARS-CoV-2 сместились с высоких уровней передачи в сообществе, вероятно, с участием массовых суперраспространителей, в начале итальянской эпидемии, к поддержке меньшими кластерами семьи / социальных сетей на более поздних этапах эпидемии. К сожалению, это также предполагает, что никакое количество вмешательств на уровне сообществ может быть недостаточным для сдерживания эпидемии, пока люди не соблюдают меры индивидуального уровня, такие как использование масок, гигиена рук и социальное дистанцирование. Новые меры изоляции, вероятно, принесут лишь временное облегчение, как это уже произошло в первые месяцы эпидемии в Италии и многих других странах. Действительно, в настоящее время ведутся важные дебаты о развертывании вакцины, учитывая финансовые и материально-технические ограничения, требующие очень длительного поэтапного развертывания на основе политики приоритизации. В этом контексте наши результаты показывают, что скрытые резервуары передачи могут продолжать поддерживать локальные вспышки до конца 2021 года, поскольку внедрение вакцины, вероятно, займет месяцы, прежде чем будет достигнут необходимый порог коллективного иммунитета. В конечном итоге наша способность успешно обуздать текущую пандемию может быть связана с нашей способностью определять количество и структуру таких резервуаров в социальном и поведенческом контексте конкретных регионов.


Репозиторий Zenodo https://doi.org/10.5281/zenodo.4593885 включает код для воспроизведения всех представленных здесь рисунков и результатов.

Chan, K. K., Tan, T. J. C., Narayanan, K. K. & amp Procko, E. Сконструированный рецептор-ловушка для SARS-CoV-2 широко связывает варианты последовательности белка S. Sci. Adv. 7, eabf1738 (2021 г.).

Starr, T. N. et al. Глубокое мутационное сканирование домена связывания рецептора SARS-CoV-2 выявляет ограничения на сворачивание и связывание ACE2. Клетка 182, 1295–1310.e20 (2020).

Gu, H. et al. Адаптация SARS-CoV-2 у мышей BALB / c для тестирования эффективности вакцины. Наука 369, 1603–1607 (2020).

Пикок, Т. П., Голдхилл, Д. Х., Чжоу, Дж., Байон, Л. и Фризе, Р. Сайт расщепления фурином шипового белка SARS-CoV-2 является ключевым детерминантом передачи из-за усиленной репликации в клетках дыхательных путей. Препринт на https://doi.org/10.1101/2020.09.30.318311 (2020).

Bal, A. et al. Скрининг делеций H69 и V70 в спайковом белке SARS-CoV-2 с помощью диагностического анализа RT-PCR показывает низкую распространенность в Лионе, Франция. Препринт на https://doi.org/10.1101/2020.11.10.20228528 (2020).

Консорциум COVID-19 Genomics UK (COG-UK). Интегрированная сеть геномного эпиднадзора за SARS-CoV-2 национального масштаба. Ланцетный микроб 1, E99 – E100 (2020).

Пибус О. Г. и Рамбо А. Эволюционный анализ динамики вирусных инфекционных заболеваний. Nat. Преподобный Жене. 10, 540–550 (2009).

Волц, Э. М., Коэлли, К. и Бедфорд, Т. Филодинамика вирусов. PLoS Comput. Биол. 9, е1002947 (2013).

Hodcroft, E. B. et al. Возникновение и распространение варианта SARS-CoV-2 в Европе летом 2020 года. Препринт на https://doi.org/10.1101/2020.10.25.20219063 (2020).

Bi, Q. et al. Эпидемиология и передача COVID-19 в 391 случае и 1286 их близких контактах в Шэньчжэне, Китай: ретроспективное когортное исследование. Lancet Infect. Дис. 20, 911–919 (2020).

Mishra, S. et al. Модель COVID-19 для местных властей Великобритании. Препринт на https://doi.org/10.1101/2020.11.24.20236661 (2020).

Kemp, S. et al. Повторяющееся возникновение и передача делеции спайка SARS-CoV-2 ΔH69 / V70. Препринт на https://doi.org/10.1101/2020.12.14.422555 (2020).

du Plessis, L. et al. Установление и динамика происхождения эпидемии SARS-CoV-2 в Великобритании. Наука 371, 708–712 (2021).

Исследователи исследования РЕАКТ и соавт. Возрождение SARS-CoV-2 в Англии: обнаружение антигенным надзором сообщества. Препринт на https://doi.org/10.1101/2020.09.11.20192492 (2020).

Райли, С. и др. Промежуточный отчет 9 раунда РЕАКТ-1: тенденция к снижению SARS-CoV-2 в Англии в феврале 2021 года, но все еще с высокой распространенностью. Препринт на https://doi.org/10.1101/2021.02.18.21251973 (2021 г.).

Леунг, К., Шум, М. Х., Леунг, Г. М., Лам, Т. и. Ву, Дж. Т. Ранняя оценка трансмиссивности мутантных штаммов N501Y SARS-CoV-2 в Соединенном Королевстве, октябрь-ноябрь 2020 г. Euro Surveill. 26, 2002106 (2021).

Дэвис, Н. Г. и др. Предполагаемая трансмиссивность и влияние линии B.1.1.7 SARS-CoV-2 в Англии. Препринт на https://doi.org/10.1101/2020.12.24.20248822 (2020).

Тегалли, H. et al. Появление варианта SARS-CoV-2 связано с мутациями в спайковом гликопротеине. Природа https://doi.org/10.1038/s41586-021-03402-9 (2021 г.).

Sabino, E.C. et al. Возрождение COVID-19 в Манаусе, Бразилия, несмотря на высокую распространенность серотипа. Ланцет 397, 452–455 (2021).


Относительная инфекционность нового британского варианта SARS-CoV-2

Очевидный быстрый рост в Англии нового варианта вируса SARS-CoV-2, вызывающего COVID-19, привел к ужасным предупреждениям со стороны тех, кто консультирует правительство Великобритании. Их совет предполагал только то, что новый вариант был более трансмиссивным (более заразным), а не более опасным (вызывающим более серьезное заболевание). Тем не менее, это привело к быстрым (многие сказали бы, паническим) действиям сначала правительства Великобритании, а затем правительств многих других стран. Правительство Великобритании ввело дополнительные ограничения на свободу людей смешиваться и перемещаться, в то время как другие страны запретили путешественникам въезд в Великобританию. Многие миллионы людей в Великобритании были вынуждены отменить свои планы на рождественские каникулы в очень короткие сроки, в дополнение к дальнейшему ограничению их свобод после этого. В этой статье я исследую, насколько оправдан совет, который привел к этим разрушительным действиям правительства.

Новый штамм B.1.1.7 и его распространение в Великобритании

Правительственное агентство Великобритании Public Health England (PHE) назвало новый вариант VUI-202012/01, а теперь VUC-202012/01, но я буду называть его научным названием, присвоенным его происхождению, B.1.1.7 (Rambaut и др.) [1], или так же, как & # 8220новый вариант & # 8221. Линия включает 8 аминокислотных изменений (6 мутаций и 2 делеции) [2] в гене важного белка-шипа, а также 9 аминокислотных замен [3] в генах других белков. Линия иногда упоминается просто по имени самой известной мутации, которой она обладает, N501Y, но этого следует избегать, поскольку есть другие варианты, которые также имеют эту мутацию.

Рамбаут и др. сказать о новом происхождении следующее:

Линия B.1.1.7 несет большее, чем обычно, количество вирусных генетических изменений. Накопление 14 замен аминокислот, специфичных для клонов, до его обнаружения на сегодняшний день является беспрецедентным в глобальных данных по вирусному геному для пандемии COVID-19.

Они также идентифицируют, в частности, три мутации (включая N501Y) как подозреваемые в потенциальных биологических эффектах.

B.1.1.7 был впервые обнаружен у SARS-CoV-2, секвенированного из образца, взятого на юго-востоке Англии 20 сентября 2020 года, с тех пор, когда кластер случаев быстро вырос и распространился на другие места. В Великобритании существует гораздо больше геномов SARS-CoV-2, чем в любой другой стране, и больше, чем в остальной Европе вместе взятых, поэтому тот факт, что B.1.17 был впервые обнаружен в Великобритании, не обязательно означает, что он возник там. Линия также была обнаружена в нескольких других странах и теперь вполне может быть широко распространена.

Рост линии B.1.1.7 в Великобритании можно отслеживать по данным секвенирования, загруженным в GISAID. Я использовал средство обработки COVID-CG [4], чтобы выбрать ежедневные последовательности & # 8217s со всеми восемью мутациями гена шипа B1.1.7. [5] Поскольку дневные данные были зашумленными, а несколько последовательностей датировались после 12 декабря 2020 года, я взял 7-дневные скользящие средние с центром до 9 декабря. На рис. 1 показана результирующая пропорция всех последовательностей UK, представленных линией B.1.1.7 с момента ее первого появления. Следует отметить, что доля последовательностей, не относящихся к B.1.1.7, представленных областями, в которых B.1.1.7 впервые стала заметной, могла со временем увеличиваться, в результате чего показанный рост преувеличивал скорость роста в отдельных областях. или в Великобритании в целом.

Рисунок 1. Доля всех геномов SARS-CoV-2, секвенированных в Великобритании, приходится на линию B.1.1.7.

Более высокая скорость роста B.1.1.7

В отчете PHE, опубликованном 21 декабря 2020 г. [6], представлены эпидемиологические данные о скорости роста B.1.1.7 по сравнению с линиями, не относящимися к B.1.1.7. Используя прокси-маркер для B.1.1.7 [7], они смогли использовать данные из значительной части программы тестирования UK & # 8216pillar 2 & # 8217. Это обеспечило гораздо больший набор данных, чем у секвенированных геномов SARS-CoV-2, и позволило стратифицировать еженедельные данные для каждой из 42 областей NHS & # 8220STP & # 8221. Рисунок 2 воспроизводит рисунок 1 документа PHE, который показывает мультипликативное преимущество в недельных темпах роста случаев B.1.1.7 (отношение B.1.1.7 к неделям, не относящимся к B.1.1.7). т+1 случай, разделенный на неделю т случаи). Ось абсцисс - прокси B.1.1.7, тест на ген S. отрицательный. Указанная неделя является базовой неделей, поэтому желтые точки отражают отношение случаев на неделе 49 (неделя, заканчивающаяся 5 декабря) к случаям недели 48.

Фигура 2. Анализ эмпирических данных мультипликативного преимущества в недельных темпах роста. Каждая точка представляет собой соотношение еженедельных темпов роста между B.1.17 [VOC] и не-B.1.1.7 для области STP NHS England за неделю, на основе данных компонента 2, показанных на рисунке S1 отчета PHE. Цвета и формы различают календарные недели. Числа выше 1 показывают мультипликативное преимущество. Синяя линия представляет собой среднее значение для конкретной частоты, а серая линия - 95% огибающая. Разброс на низких частотах в значительной степени отражает статистический шум из-за низкого счета.

Когда новый вариант представляет собой небольшую долю от общего числа случаев (менее

25%, скажем), используемый прокси менее удовлетворителен, да и разброс тоже большой. Тем не менее, среднее мультипликативное преимущество (отношение) на основе прокси-сервера варианта & # 8217 в недельном росте заметно не зависит от его относительной распространенности. Это поддерживает методологию PHE & # 8217s, хотя данные за 48-ю неделю предполагают, что мультипликативное преимущество может снизиться, если вариант составит более

25% от общего числа случаев. PHE вычисляет на основе этих данных среднее мультипликативное преимущество в недельном росте 1,51 для B.1.1.7. Предполагая фиксированный интервал генерации 6,5 дней, они конвертируют это в число воспроизводства (Rt) мультипликативное преимущество 1,47 для B.1.1.7 по сравнению с другими вариантами.

PHE также оценил влияние B.1.1.7 на Rt с использованием геномных данных (секвенирования) для тех же областей и недель. Они оценили аддитивный эффект на Rt 0,57 или 0,74, когда эффект мог варьироваться в зависимости от области. PHE также оценил влияние на Rt с использованием прокси-данных S-гена теста ПЦР, скорректированных на специфичность (что плохо, когда отрицательная доля S-гена низкая). Их оценки аддитивного влияния на Rt используя эти данные, было 0,52 или 0,60, когда эффект мог варьироваться в зависимости от области. Используя байесовскую регрессионную модель, они оценили эффект 0,56. Однако, поскольку ожидается, что любое биологическое различие в инфекционности вызовет мультипликативный эффект на Rt, а также Rt варьировалось в течение периода анализа, предполагаемый аддитивный эффект на Rt менее полезен и менее точен, чем мультипликативная оценка. Кроме того, все эти оценки включают более сложные статистические модели, дополнительные допущения и оценки других переменных. Поэтому я предпочитаю их предполагаемое мультипликативное преимущество 1,51 (для еженедельного роста до преобразования в Rt scale), который напрямую выводится из базовых данных. Это эквивалентно преимуществу логарифмического дневного темпа роста 0,059.

Другие свидетельства более быстрого роста B.1.1.7

Заседание комитета NERVTAG [8], который консультирует правительство по поводу угрозы, исходящей от новых и появляющихся респираторных вирусов, по новому варианту состоялось 18 декабря 2020 года. Протокол [9] относится к оценке геномных данных вируса. темп роста на 71% выше, чем у других вариантов, ни один из документов, рассмотренных комитетом, не содержал такой оценки. Из протокола следующей встречи 21 декабря 2020 года [10] явствует, что это была одна из нескольких недокументированных оценок, сделанных членом NERVTAG профессором Нилом Фергюсоном из Имперского колледжа. Альтернативная оценка регрессии, которую он, по-видимому, представил, показала, что линия B.1.1.7 имела Rt На 0,39 выше, чем у невариантных линий с начала ноября до начала декабря. Предположительно, это оценка аддитивного эффекта, которая заметно ниже оценок PHE & # 8217, полученных с использованием того же метода. Две другие оценки, указанные в протоколе как принадлежащие профессору Фергюсону, на самом деле являются слегка искаженными версиями оценки PHE мультипликативного коэффициента. Rt преимущество 1,47 для B.1.1.7.

В протоколах следующего заседания NERVTAG 21 декабря также упоминается оценка Лондонской школы гигиены и тропической медицины, согласно которой B.1.1.7 был на 56% более передаемым (мультипликативное преимущество 1,56 дюйма). Rt ценить). Эта оценка задокументирована в препринте (Davies et al. [11]). Авторы используют субъективный байесовский метод для подбора очень сложной модели с множеством вероятностных параметров, некоторые из которых фиксированы, а другие - оценены. Это далеко не надежный и, вполне возможно, изначально необъективный метод оценки относительной скорости передачи. Более того, похоже, что они используют менее информативные данные, географически сгруппированные только по 7 регионам NHS, а не (как используется PHE) по 42 областям STP NHS. Использование менее информативных данных означает, что, даже если бы они использовали надежный метод, их оценки, как ожидается, будут по своей сути менее надежными, чем оценка PHE. Диапазоны неопределенности их оценок - которые включают 99% + доверительный интервал от 1,49x до 1,57x для региона Юго-Востока [12] - кажутся довольно нереалистично узкими, учитывая существующие существенные неопределенности. Это ставит под сомнение реалистичность их оценок.

Наконец, встреча NERVTAG 21 декабря также рассмотрела филогенетическую оценку Эдинбургского университета (Эндрю Рамбо), основанную на генетических последовательностях из Кента и Лондона, которая Rt было 1,57 или 1,72 в зависимости от используемого временного окна. Поскольку нет сравнительного Rt оценка для вариантов, отличных от B.1.1.7, упоминается в протоколе собрания, из этого невозможно сделать вывод об оценке относительной скорости передачи нового варианта.

Я пришел к выводу, что другие доказательства, рассмотренные NERVTAG, менее надежны и менее полезны, чем оценка PHE мультипликативного преимущества при недельном росте 1,51.

Почему более быстрый рост B.1.1.7 не обязательно должен быть связан с увеличением передаваемость

Хотя доказательства того, что линия B.1.1.7 росла быстрее, чем другие линии в Англии за два месяца или около того до начала / середины декабря, кажутся надежными, нельзя вывести биологические свойства вируса только на основе ограниченных эпидемиологических данных. Очевидное быстрое распространение этого нового варианта может быть связано с эффектами основателя и событиями суперраспространения, а не или в дополнение к повышенной трансмиссивности (более высокая инфекционность).

В этом отношении поучительно рассмотреть две другие линии / варианты, которые также имели период исключительно быстрого роста и, в одном случае, полностью доминировали в большинстве стран.

Группа G: мутация гена шипа D614G

Мутация D614G возникла в начале эпидемии, появившись в Европе в феврале, и вариант G614, несомненно, распространился в большинстве мест быстрее, чем D614. Во многих странах, областях и городах он превратился из меньшинства инфекций в доминирующий вариант в течение месяца или около того. С июля 2020 года на его долю приходилось почти 100% новых случаев инфицирования в большинстве стран и на всех континентах.

В свете того, что D614G становится и остается таким доминирующим, неудивительно, что статья в августе (Korber et al. [13]) утверждал, что мутация D614G увеличивает трансмиссивность, ссылаясь на несколько свидетельств:

  • постоянство увеличения [частоты G614] по географическим регионам.
  • форма D614 не сохранялась во многих местах, где форма G614 была занесена в продолжающуюся устойчивую эпидемию D614, как можно было бы ожидать, если бы обе формы имели одинаковую вероятность размножения.
  • Увеличение частоты G614 часто продолжалось и после введения национальных приказов о домохозяйствах [блокировок], когда количество серийных повторных посылок от путешественников, вероятно, значительно сократилось.

В дополнение к этому эпидемиологические данные, тАвторы также отметили, что повышенная трансмиссивность G614 согласуется с другими исследованиями, которые предполагают связь с повышенной инфекционностью. in vitro[14] [15], и с их собственным выводом о связи с более высокой вирусной нагрузкой. in vivo. Более того, в другой статье (Li, Q et al [16]) сообщается о более высокой антигенности G614.

Большинство аргументов Корбера также справедливо применимы к свидетельствам, предполагающим, что B.1.1.7 может быть более передаемым. Однако в более поздней статье в Nature (van Dorp et al. [17]) не было обнаружено & # 8220 доказательств значительно большего числа трансмиссивных линий SARS-CoV-2 из-за повторяющихся мутаций & # 8221, включая D614G (B.1.1.7 имел к концу периода исследования не выявлено). Это показывает, что даже после того, как новый штамм стал доминирующим, выводы о его относительной трансмиссивности, сделанные на основании эпидемиологических и косвенных биологических данных, могут оказаться неверными.

Вариант 20A.EU1: спайковая мутация A222V

Вариант 20A.EU1, который включает мутацию гена шипа A222V, появился в Испании в начале лета 2020 года. Он быстро распространился в другие европейские страны, где обычно рос быстрее, чем варианты, отличные от 20A.EU1. На рис. 3 показан логарифмический дневной темп роста последовательностей с мутацией A222V в Великобритании по сравнению с последовательностями без нее в течение двух месяцев до середины сентября. За этот период отношение новых последовательностей A222V к новым последовательностям, отличным от A222V, выросло с менее 0,02 до 0,67. Средний логарифмический дневной темп роста составил 0,061 - недельное мультипликативное преимущество 1,53 - практически без тенденции. Это мультипликативное преимущество фактически идентично оценке PHE 1,51 для B.1.1.7 с использованием данных с середины октября до середины декабря.

Рисунок 3. Логарифмический дневной темп роста 7-дневного скользящего среднего новых последовательностей с мутацией A222V в Великобритании по сравнению с последовательностями без нее в течение двух месяцев до 12 сентября 2020 года.

Однако осенью относительная частота новых последовательностей A222V перестала расти в ряде стран, не достигнув - как это сделал D614G - полного и постоянного доминирования (Рисунок 4). В Великобритании вариант A20.EU1 достиг примерно 70% всех новых последовательностей к концу октября, но с тех пор его относительная частота снизилась, как и в Бельгии, Германии и Швейцарии.

Рисунок 4. Доля еженедельных новых последовательностей SARS-CoV-2 в течение 2020 года в десяти европейских странах, которые имеют мутацию A222V (подразумевая, что они являются вариантом A20.EU1)

Несмотря на быстрый рост варианта 20A.EU1 во многих европейских странах летом и / или осенью, в препринте от ноября 2020 года о 20A.EU1 был сделан вывод: & # 8220 Мы не находим доказательств повышенной трансмиссивности этого варианта, но вместо этого демонстрируем, как рост заболеваемости в Испании, возобновление поездок по Европе и отсутствие эффективного скрининга и сдерживания могут объяснить вариант «успех» [18].

Завышение влияния на Rt возможной повышенной проницаемости

Предположим, что более высокие темпы роста линии B.1.1.7 на сегодняшний день были связаны с более высокой трансмиссивностью, какое влияние это окажет на текущее количество воспроизводств, Rt? Это будет зависеть от того, что Rt есть и на среднем интервале генерации и его распределении вероятностей. Чем больше интервал генерации, тем выше Rt требуется для получения заданной скорости роста. В публикации PHE от 21 декабря их оценка мультипликативного преимущества в недельном темпе роста (1,51) преобразована в мультипликативное преимущество в Rt 1,47 при фиксированном интервале генерации 6,5 дней: 1,47 = 1,51 ^ (6,5 / 7).

Однако формула преобразования PHE & # 8217s не оправдана по двум причинам:

  • интервал генерации не фиксирован и
  • недавние оценки среднего интервала генерации значительно ниже 6,5 дней.

Большинство оценок интервала между поколениями (период от заражения одного человека до заражения им другого человека) на самом деле являются оценками серийного интервала (периода от появления симптома у одного человека до появления симптомов у человека, которого они заразили), поскольку время заражения не наблюдается. Интервал генерации может быть достоверно оценен путем объединения вероятностных оценок серийного интервала и инкубационного периода (от инфекции до появления симптомов). Однако простая обработка вероятностной оценки последовательного интервала как представляющая распределение интервалов генерации, как это обычно делается, является неудовлетворительной.

PHE не дает никаких источников для своего предположения о 6,5-дневном интервале генерации, но они могли следовать за командой Имперского колледжа, которая использовала (в Flaxman et al. [19]) период генерации со средним значением 6,5 дней, заявив, что он был оценен Би и др. [20]. Фактически, Bi et al. оценили последовательный интервал, а не интервал генерации, и установили гамма-распределение вероятностей со средним значением 6,3 дня. Однако их данные включали случаи, когда инфицированный человек не отделялся от других до тех пор, пока не проявился симптом. Bi et al. обнаружили, что если инфицированный человек был изолирован менее чем через три дня после появления симптомов, что обычно имеет место в Великобритании сейчас, средний серийный интервал составлял всего 3,6 дня.

Knight и Mishra (2020) [21] показывают, что во избежание переоценки серийного интервала его необходимо подогнать под распределение вероятностей, которое, в отличие от гамма-распределения, используемого Би и др., Допускает отрицательные значения (которые наблюдаются в незначительная часть случаев). Они рассматривают ряд оценок, рассмотренных в обзорной статье инкубационного периода и серийного интервала, выбирая единственную оценку серийного интервала, основанную на отрицательном разрешающем распределении вероятностей, которое имело большой размер выборки (почти в десять раз больше, чем в Bi et al.), а также оценка инкубационного периода, основанная на самой большой выборке. Их итоговая оценка интервала генерации имеет среднее значение 3,99 дня и стандартное отклонение 2,96 дня [22].

Davies et al. говорят, что их сложная байесовская модель, которая оценила мультипликативное преимущество 1,56 в Rt значение с использованием довольно длинного интервала генерации, хуже подходит, когда они используют более короткий интервал. Однако кажется вероятным, что основная причина, по которой они плохо соответствуют относительному росту в новом варианте во время блокировки с более коротким интервалом генерации, заключается в том, что их модель сильно переоценивает эффект ноябрьской блокировки. [23]

Используя оценочное распределение Найта и Мишры для интервала поколений и правильную формулу преобразования, [24] оценка PHE мультипликативного преимущества линии B.1.1.7 при недельной скорости роста 1,51 соответствует мультипликативному преимуществу в Rt из 1,25. [25] Это всего лишь половина мультипликативного преимущества 1,47, оцененного PHE. [26] Это означает, что потребуются менее обширные и строгие меры для предотвращения экспоненциального роста инфекций с учетом появления B.1.1.7, чем подразумевается оценкой PHE мультипликативного преимущества 1,47 в Rt, даже если наблюдаемое мультипликативное преимущество в недельном темпе роста B.1.1.7 до середины декабря полностью вызвано его более высокой передаваемостью.

Новый южноафриканский вариант

Новая линия SARS-CoV-2, которая также включает в себя мутацию гена шипа N501Y и ряд других мутаций (отличающихся от мутаций в B.1.1.7), недавно появилась в Южной Африке, как описано Тегалли и др. [ 27], которые называют его 501Y.V2. Они говорят, что геномные данные, показывающие быстрое вытеснение других линий, предполагают, что эта линия может быть связана с повышенной трансмиссивностью. Однако имеющихся на данный момент ограниченных данных недостаточно, чтобы оправдать алармистские комментарии министра здравоохранения Великобритании о том, что «этот новый вариант вызывает серьезное беспокойство, потому что он еще более передается и, по-видимому, мутировал дальше, чем новый вариант, обнаруженный в Великобритания »[28]. Как заявил профессор молекулярной вирусологии из Ноттингемского университета, данная мутация наблюдалась и раньше, мы не знаем, влияет ли она на трансмиссивность вируса, и нам следует избегать паники на этом этапе. [29]

Выводы

Примеры G clade и 20A.EU1 иллюстрируют это очевидно сильное эпидемиологическое свидетельство более высокой скорости роста нового варианта в течение значительного периода времени, даже когда оно приводит к очевидному постоянному доминированию, и несмотря на то, что оно сопровождается доказательствами, предполагающими, что вариант связан с более высокие вирусные нагрузки не позволяют сделать обоснованный вывод о том, что вариант имеет более высокую трансмиссивность, чем существующие варианты. Такие данные могут свидетельствовать о более высокой трансмиссивности, но не демонстрируют ее достоверно.

Несмотря на это, комитет NERVTAG 18 декабря с умеренной уверенностью пришел к выводу, что новый вариант & # 8220 демонстрирует существенное повышение проницаемости по сравнению с другими вариантами & # 8221, и на своем заседании 21 декабря пошел дальше и выразил высокую уверенность в том, что & # 8220B.1.1. 7 может распространяться быстрее, чем другие варианты вируса SARS-CoV-2, циркулирующие в настоящее время в Великобритании - 8221. Признавая, что основная причина более быстрого распространения неясна, предложенные ими причинные факторы связаны исключительно с более высокой трансмиссивностью. Это неудивительно, учитывая, что уверенные выводы NERVTAG & # 8217 не подтверждаются фактами, что ряд экспертов в Великобритании и других странах оспаривают их [30] или выражают противоположные мнения, [31] [32] [33] Неудивительно, что основные средства массовой информации неверно сообщают, что доказано, что B.1.1.7 обладает значительно повышенной передаваемостью.

Я утверждал, что оценка PHE преимущества мультипликативного недельного роста в 1,51 для B.1.1.7 по нескольким причинам более надежна и точна, чем другие доступные оценки. Я показал, что, даже если бы более высокий рост на сегодняшний день B.1.1.7 был полностью обусловлен повышенной передаваемостью, это соответствовало бы мультипликативному преимуществу в Rt всего 1,25, что вдвое меньше преимущества, рассчитанного PHE с использованием неподходящей формулы преобразования.

На сегодняшний день нет никаких доказательств того, что B.1.1.7 более вирулентен, чем существующие штаммы, или что он будет устойчив к разработанным вакцинам. По мнению экспертов, ни то, ни другое не соответствует действительности. [34]

Эти результаты означают, что в настоящее время B.1.1.7, по-видимому, не представляет серьезного увеличения угрозы, исходящей от SARS-CoV-2, даже в худшем случае, когда более высокая наблюдаемая скорость его роста полностью связана с повышенной способностью к передаче. В лучшем случае окажется, что его более высокая скорость роста ни в какой степени не связана с повышенной трансмиссивностью, как сейчас, как представляется, в случае G clade и варианта 20A.EU1.

Соответственно, трудно увидеть, что введение радикальных мер по замедлению передачи, дальнейшее снижение экономической активности, социальной активности и свободы людей оправдано имеющимися данными о зарождающейся линии B.1.1.7.

Однако по мере появления дополнительных данных они могут усилить или ослабить аргументы в пользу того, что появление B.1.1.7 представляет собой серьезное событие. Важно, чтобы власти Великобритании начали публиковать на ежедневной основе на уровне местных властей или на более высоком уровне все доступные данные о случаях нового штамма, на что указывает прокси & # 8216S, отрицательный по гену & # 8217, и любой другой метод. . В настоящее время они не раскрывают эту информацию, что не позволяет независимым исследователям должным образом своевременно оценивать и, при необходимости, оспаривать, какие выводы могут быть ошибочными. Более того, крайне желательно, чтобы ни один отчет или исследование, связанные с SARS-CoV-2 или COVID-19, в дальнейшем не рассматривались правительством или его советниками, если они не сопровождаются ссылкой, по которой доступны все используемые данные.

Николас Льюис 29 декабря 2020 г.

[1] Rambaut, A et al: Предварительная геномная характеристика зарождающейся линии SARS-CoV-2 в Великобритании, определяемая новым набором спайковых мутаций. Консорциум геномики COVID-19, Великобритания, сеть ARTIC, 19 декабря 2020 г. -by-a-new-set-of-spike-mutations / 563

[2] Мутации N501Y, A570D, P681H, T716I, S982A и D1118H плюс делеции HV69-70 и Y144.

[3] Мутации T1001I, A1708D и I2230T плюс делеция SGF3675-3677 в гене ORF1ab, мутации R52I и Y73C плюс кодон Q27stop в гене D3L Orf8 и S235F в гене N. Также существует 6 синонимичных (не изменяющих аминокислоты) мутаций: 5 в ORF1ab (C913T, C5986T, C14676T, C15279T, C16176T) и 1 в гене M (T26801C).

[5] Только общее количество ежедневных последовательностей с каждой мутацией доступно через COVID-CG, но количество каждой из восьми спайковых мутаций, появляющихся каждый день (р & gt0.999, за исключением 0.991 для делеции HV69-70, которая иногда встречается в других штаммах), что означает, что они имеют чрезвычайно высокую совместимость. Я взял минимальное количество каждый день для восьми спайковых мутаций в качестве подсчета для последовательностей B.1.1.7. Включение данных о мутациях без спайков кажется ненужным, совпадение всех спайковых мутаций B.1.1.7 со всеми мутациями ORF1ab B.1.1.7 почти идеально, за исключением A1708D, который, по-видимому, отсутствует примерно в 1% случаев, когда все 11 других спайковых мутаций и Присутствуют мутации ORF1ab.

[7] Результат ПЦР TaqPath отрицательный по гену S, положительный по N и ORF1ab.

[8] NERVTAG: Консультативная группа по новым и возникающим угрозам респираторных вирусов.

[11] Дэвис, Н.Г. и др.: Оценка трансмиссивности и тяжести нового варианта SARS-CoV-2, вызывающего озабоченность, 202012/01 в Англии. Центр математического моделирования инфекционных заболеваний, Лондонская школа гигиены и тропической медицины, обновлено 23 декабря 2020 г. https://cmmid.github.io/topics/covid19/reports/uk-novel-variant/2020_12_23_Transmissibility_and_severity_of_VOC_202012_01_indf_England.png

[12] Рисунок 1A Дэвиса и др., Крайняя правая панель.

[13] Корбер Б. и др. Отслеживание изменений в спайке SARS-CoV-2: свидетельство того, что D614G увеличивает инфекционность вируса COVID-19. Cell 182, 812.e19–827.e19 (2020). https://doi.org/10.1016/j.cell.2020.06.043, 20 августа 2020 г.

[14] Zhang, L. et al. Мутация D614G в шиповом белке SARS-CoV-2 вызывает шеддинг S1 и увеличивает инфекционность. Препринт на https://doi.org/10.1101/2020.06.12.148726, 12 июня 2020 г.

[15] Юрковецкий Л. и др. Структурный и функциональный анализ варианта белка-шипа D614G SARSCoV-2. Ячейка 183, 739.e8–751.e8 https://doi.org/10.1016/j.cell.2020.09.032, октябрь 2020 г.

[16] Li, Q. et al. Влияние мутаций SARS-CoV-2 на вирусную инфекционность и антигенность. Cell 182, 1284.e9–1294.e https://doi.org/10.1016/j.cell.2020.07.012, сентябрь 2020 г.

[17] van Dorp, L et al., Нет доказательств повышенной трансмиссивности в результате повторяющихся мутаций SARS-CoV-2. Nature, ноябрь 2020 г. https://doi.org/10.1038/s41467-020-19818-2

[18] Ходкрофт, Б.Х. и др.: Возникновение и распространение варианта SARS-CoV-2 в Европе летом 2020 г. medRxiv 27 ноября 2020 г. https://doi.org/10.1101/2020.10.25.20219063

[19] Флаксман, С., Мишра, С., Ганди, А. и др. Оценка воздействия нефармацевтических вмешательств на COVID-19 в Европе. Nature 584, 257–261 (2020). https://doi.org/10.1038/s41586-020-2405-7

[20] Би, К. и другие. Эпидемиология и передача COVID-19 в Шэньчжэне, Китай: анализ 391 случая и 1286 их близких контактов. medRxiv (2020) https://doi.org/10.1101/2020.03.03.20028423

[21] Найт, Дж. И Мишра, С .: Оценка эффективного числа репродукций с использованием времени генерации в сравнении с серийным интервалом, применительно к COVID-19 в районе Большого Торонто, Канада. Моделирование инфекционных заболеваний 5 (2020) 889e896, ноябрь 2020 г. https://doi.org/10.1016/j.idm.2020.10.009

[22] Найт и Мишра аппроксимируют свою оценку интервала генерации с помощью гамма-распределения. В отличие от последовательного интервала, интервал генерации не может быть отрицательным, поэтому здесь подходит гамма-распределение.

[23] Они говорят, что плохое соответствие с более коротким интервалом между поколениями было связано с тем, что он предсказал, что новый штамм должен уменьшиться в относительной частоте во время ноябрьской блокировки. Как пишут: & # 8220Когда рт & lt 1 для обоих вариантов, более короткое время генерации является селективным недостатком, поскольку заражение этим вариантом снижается быстрее по сравнению с вариантом с таким же рт но передача в более длительном масштабе времени. & # 8221 Однако это верно только в том случае, если рт был ниже 1 во время блокировки, тогда как их рис. 1E показывает, что в действительности рт оставался на уровне 1 или чуть выше 1 во время блокировки. Это согласуется с данными о мобильности Davies et al. Рис. 1C, который показывает небольшую разницу между непосредственно перед началом и концом блокировки. Общий рт 1 означает, что относительная частота инфекций с более трансмиссивным вариантом будет увеличиваться, как это произошло, а не уменьшаться. Кроме того, сложность их модели означает, что плохая подгонка может быть частично или полностью вызвана другими причинами, такими как длинный интервал генерации, компенсирующий неверно оцененный другой параметр, или особый способ, которым они представляли укороченный интервал генерации.

[24] Валлинга Дж. И Липсич М. (2007). Как интервалы между поколениями определяют взаимосвязь между темпами роста и репродуктивной численностью. Труды Королевского общества B: Биологические науки, 274 (1609), 599-604. https://doi.org/10.1098/rspb.2006.3754 Использование их уравнения 2.9 в сочетании с производящей функцией момента гамма-распределения.

[25] Оценка мультипликативного преимущества предполагает, что Rt для других штаммов - 1,0, предполагаемое мультипликативное преимущество - это медленно убывающая функция от Rt для других штаммов.

[26] То же самое примерно верно для 95% доверительного интервала PHE для Rt коэффициент 1,34–1,59, что при преобразовании таким же образом соответствует Rt диапазон соотношений 1,19–1,30.


Выпуск 29: Внедрение вакцины в США: гонка против вирусных вариантов

Уровень вакцинации COVID-19 в США продолжает расти, и почти три миллиона американцев получают прививку ежедневно. По данным Центров США по контролю и профилактике заболеваний (CDC), по состоянию на 29 марта 37% населения США старше 18 получили хотя бы одну дозу вакцины.

Но внедрение высокоэффективных вакцин происходит на фоне роста числа случаев COVID-19 в стране, в значительной степени вызванного более распространенным вариантом B.1.1.7, который впервые был идентифицирован как причина роста числа случаев заболевания в Великобритании. Режиссер Рошель Валенски предупредит о «надвигающейся гибели» в начале этой недели.

Чтобы представить все это в перспективе, редактор HVP Кристен Джилл Аббуд недавно поговорила с Эриком Тополем, исполнительным вице-президентом Scripps Research и директором и основателем Scripps Research Translational Institute. Тополь ведет хронику эпидемиологии и науки о пандемии COVID-19 и пытается контролировать ее в своем аккаунте в Twitter (@EricTopol), а недавно стал соавтором комментария в Природа о необходимости создания вариантно-устойчивых вакцин против COVID-19.

Отредактированная версия беседы отображается ниже.

Как вы думаете, как сегодня США реагируют на COVID?

В последнее время количество вакцин стало огромным. У нас было три дня введения более 3,3 миллиона доз вакцины в день, что поразительно. Очевидно, было бы лучше, если бы мы могли сделать это с самого начала - тогда у нас было бы все в наличии и мы использовали бы наши лучшие боеприпасы против вариантов. Но хотя с вакцинацией все идет хорошо, мы просто не можем сделать достаточно быстро, чтобы построить стену защиты от этого вируса.

Мы наблюдаем рост числа случаев заболевания во многих частях страны. Мичиган действительно выглядит мрачно с точки зрения роста числа случаев заболевания, и теперь весь северо-восток США выглядит не лучшим образом. Все они подпитываются британским вариантом. Хотя в Нью-Йорке и Нью-Джерси могут быть некоторые случаи варианта «Нью-Йорк», это не вариант суперпредставителя. Вариант Великобритании вызывает наибольшее беспокойство, потому что он очень легко распространяется и, следовательно, обгонит другие варианты, о которых мы знаем сегодня. Вариант B.1.1.7 в конечном итоге будет ответственен за все инфекции в США, так что это нас очень беспокоит. В конечном итоге мы победим, но чем раньше мы сможем ввести больше вакцин, это поможет нам изменить ситуацию.

Другое преимущество, которое у нас есть, заключается в том, что около 100 миллионов человек в США болеют COVID, и многие из них - это те же люди, которые не получат вакцину и не будут носить маски. Эти люди, которые, вероятно, имеют некоторый уровень естественного иммунитета, не учитываются во многих расчетах относительно того, когда мы можем увидеть очень сильное сдерживание вируса, которого у нас никогда не было в этой стране с самого начала пандемия.

А как насчет варианта B.1.351, впервые обнаруженного в Южной Африке? Представляет ли это угрозу для наших нынешних вакцин?

Это худший из всех известных нам сегодня вариантов, если вы посмотрите, как он может уклоняться от иммунных ответов таким образом, что вакцины могут потерять эффективность. Но испытания вакцин Johnson & amp Johnson и Novavax в Южной Африке показывают, что эти вакцины сохранили эффективность против варианта B.1.351. В Южной Африке они не работали так хорошо, как в других местах, но это было довольно близко. И все in vitro лабораторные исследования показывают, что вакцины с мРНК должны очень хорошо работать против этого варианта.

В будущем может появиться вариант, сочетающий худшие черты вариантов B.1.1.7 и B.1.351, но мы этого еще не видели. Может быть, мы туда и направимся.

Ожидаете ли вы, что потребуются ревакцинации для повышения эффективности существующих вакцин против этих или будущих вариантов SARS-CoV-2?

Вполне возможно, что мы могли бы прожить несколько лет без ревакцинации существующих вакцин против COVID-19. SARS-CoV-1, который является наиболее близким вирусом, циркулировал в 2003 году, и есть люди, 17 лет спустя, у которых все еще есть действительно отличные антитела и Т-клетки против этого вируса. Подготовка ускорителей, которые сейчас ведутся Moderna и другими компаниями, больше в качестве меры предосторожности. На самом деле вопрос заключается в том, сможем ли мы разработать вакцину против коронавируса, которая является наиболее привлекательным путем к многолетней защите от вируса и в высшей степени выполнима.

Ожидаете ли вы, что SARS-CoV-2 станет эндемическим?

Непонятно, покажет время. Это зависит от того, что происходит в мире. Вирус все еще бушует во многих местах - уровень инфицирования резко растет - и это глобальная история. Если мы не будем обнимать вирус, он будет развиваться. Тенденции, которые мы наблюдаем сейчас во всем мире, неблагоприятны, но если вы посмотрите на то, что происходит в Израиле, это совсем другая история. В Израиле этот вирус практически подавили. Но вопрос в следующем: может ли мир имитировать то, что произошло в стране с девятью миллионами человек с естественными границами и агрессивными кампаниями вакцинации? Есть еще 7,6 миллиарда человек, которых мы должны защитить.

Как вы думаете, что еще нужно делать США, чтобы вакцины от COVID-19 были доступны во всем мире?

Я настаивал на том, чтобы мы отправляли все наши избыточные вакцины, потому что у нас их избыток - 300 миллионов доз вакцины AstraZeneca, 100 миллионов или более доз вакцины J & ampJ и еще 100 миллионов доз вакцины Novavax. У нас есть 500 или 600 миллионов доз вакцины, которые мы никогда не будем использовать. У нас достаточно вакцины для всех в стране, и мы не собираемся заставлять всех ее принимать. Просто вакцины Moderna и Pfizer у нас достаточно для населения США.

Я действительно не понимаю задержки с выпуском этих доз вакцины. Прямо сейчас вы хотите попытаться вакцинировать остро нуждающиеся страны, и в них нет недостатка. Есть много горячих зон, которым мы могли бы помочь. Я не слышал никаких оправданий, чтобы не выпускать эти вакцины. Это не национальная проблема, это глобальная и планетарная проблема. Чем больше мы помогаем другим странам, тем больше мы помогаем себе.

Что мы теперь знаем о способности лицензированных вакцин против COVID предотвращать распространение вируса в дополнение к предотвращению заболеваний?

Данные об этом очень обнадеживают - похоже, что распространение вируса действительно хорошо сдерживается. Лучшие данные, которые у нас есть, относятся как к вакцинам Moderna, так и к Pfizer, для других вакцин это больше неизвестно.

Как искусственный интеллект (ИИ) использовался для понимания этой пандемии или борьбы с ней?

ИИ в целом разочаровал в этой пандемии - на самом деле он не оказал того влияния, которое я хотел бы видеть, что, вероятно, отражает то, что мы все еще находимся на раннем этапе истории ИИ. Это действительно способствовало ускорению выпуска одного препарата COVID, барицитиниба, который получил разрешение на экстренное использование в сочетании с ремдесивиром. Искусственный интеллект также использовался для прогнозирования того, кто заболеет COVID, кто получит наибольшую выгоду от вакцинации и т. Д., Но я не видел ничего действительно важного. Но это не значит, что ИИ не будет больше вносить вклад в будущее. ИИ, если его правильно использовать, мог бы спрогнозировать пандемию. Для меня точное определение пандемии до того, как она случится, - это то, чего мы ждем с помощью ИИ. И мы можем туда добраться.

Интервью Кристен Джилл Аббуд


COVID-19 и SARS-CoV-2. Моделируя настоящее, глядя в будущее

С декабря 2019 года тяжелый острый респираторный синдром, вызванный коронавирусом 2 (SARS-CoV-2), вызвал вспышку легочной болезни, которая вскоре стала глобальной пандемией, известной как COronaVIrus Disease-19 (COVID-19). Новый коронавирус имеет примерно 82% общего генома с геномом, вызвавшим вспышку 2003 года (SARS CoV-1). Оба коронавируса также имеют один и тот же клеточный рецептор, который является рецептором ангиотензинпревращающего фермента 2 (ACE2). Несмотря на это сходство, новый коронавирус распространился шире, быстрее и смертоноснее, чем предыдущий. Многие исследователи из разных дисциплин использовали различные инструменты моделирования для анализа воздействия этой пандемии в глобальном и локальном масштабах. Сюда входит широкий спектр подходов - детерминированных, основанных на данных, стохастических, агентных и их комбинаций - для прогнозирования развития эпидемии, а также последствий нефармацевтических вмешательств, направленных на прекращение или смягчение ее воздействия на мир. численность населения.Эти модели должны отражать физические сложности современного общества. Это включает в себя множество способов социальных контактов - (мультиплексные) сети социальных контактов, (многослойные) транспортные системы, метапопуляции и т. Д. - которые могут выступать в качестве основы для распространения вируса. Но моделирование не только играет фундаментальную роль в анализе и прогнозировании эпидемиологических переменных, но также играет важную роль в поиске лекарств от болезни и в предотвращении заражения с помощью новых вакцин. Необходимость быстро и эффективно отвечать на вопросы: Могут ли существующие лекарства работать против SARS CoV-2? а также можно ли вовремя разработать новые вакцины? требует использования физического моделирования белков, взаимодействия белков с ингибиторами, виртуального скрининга лекарств против вирусных мишеней, прогнозирования иммуногенности малых пептидов, моделирования вакциномики и дизайна вакцины, и это лишь некоторые из них. Здесь мы рассматриваем эти три основные области исследования моделирования против SARS CoV-2 и COVID-19: (1) эпидемиология (2) перепрофилирование лекарств и (3) дизайн вакцины. Поэтому мы собираем наиболее актуальную существующую литературу о стратегиях моделирования против вируса, чтобы помочь разработчикам моделей ориентироваться в этой быстрорастущей литературе. Мы также следим за будущими вспышками, где разработчики моделей могут найти наиболее подходящие стратегии, используемые в чрезвычайной ситуации, как текущие, чтобы помочь в борьбе с будущими пандемиями.


Использованная литература

Булл, Дж. Дж. И Лоринг, А. С. Теория и эмпиризм в эволюции вирулентности. PLOS Pathog. 10, е1004387 (2014). Этот обзор дает представление о том, как теория вирулентности может быть объединена с эмпирическими данными и что необходимо для лучшего понимания взаимосвязи между вирулентностью и трансмиссивностью..

McMahon, D. P. et al. Повышенная вирулентность нового вирусного генотипа как фактор гибели пчел. Proc. Биол. Sci. 283, 20160811 (2016).

Пауэр Р. А., Паркхилл Дж. И де Оливейра Т. Исследования ассоциации микробного генома: уроки человеческого GWAS. Nat. Преподобный Жене 18, 41–50 (2017).

Ансари, М.А. и др. Анализ «геном-геном» подчеркивает влияние врожденной и адаптивной иммунной системы человека на вирус гепатита С. Nat. Genet. 49, 666 (2017).

Yang, J. et al. Беспристрастное параллельное обнаружение вирусных патогенов в клинических образцах с использованием метагеномного подхода. J. Clin. Microbiol. 49, 3463–3469 (2011).

Shi, M. et al. Новое определение виросферы беспозвоночных. Природа 540, 539–543 (2016).

Shi, M. et al. История эволюции РНК-вирусов позвоночных. Природа 556, 197–202 (2018).

Stern, A. et al. Эволюционный путь вирулентности РНК-вируса. Клетка 169, 35–46 (2017). Это исследование является ярким примером изложенного здесь аналитического подхода. Авторы используют филогенетику и экспериментальные исследования для описания эволюционных путей, по которым штаммы OPV становятся патогенными, и предлагают основу для дизайна вакцины..

Росси, С. Л., Эбель, Г. Д., Шан, К., Ши, П.-Й. & amp Vasilakis, N. Мутировал ли вирус Зика, вызывая серьезные вспышки? Trends Microbiol. https://doi.org/10.1016/j.tim.2018.05.007 (2018).

Ализон, С. и Лайон, С. Сотрудничество паразитов внутри хозяина и эволюция вирулентности. Proc. Биол. Sci. 278, 3738–3747 (2011).

Керр, П. Дж. И др. Вирус миксомы и лепорипоксвирусы: эволюционная парадигма. Вирусы 7, 1029–1061 (2015).

Эбихара, Х. и др. Молекулярные детерминанты вирулентности вируса Эбола у мышей. PLOS Pathog. 2, e73 (2006).

Jimenez-Guardeño, J. M. et al. PDZ-связывающий мотив белка оболочки коронавируса тяжелого острого респираторного синдрома является определяющим фактором вирусного патогенеза. PLOS Pathog. 10, е1004320 (2014).

Kataoka, C. et al. Роль аминокислотного остатка 145 VP1 энтеровируса 71 в вирусной пригодности и патогенезе на модели яванского макака. PLOS Pathog. 11, e1005033 (2015).

Сонг, Х., Санти, Н., Эвенсен, О. и Вахария, В. Н. Молекулярные детерминанты вирулентности вируса инфекционного некроза поджелудочной железы и адаптации клеточных культур. J. Virol. 79, 10289–10299 (2005).

Ураки, Р. и др. Детерминанты вирулентности пандемического вируса гриппа A (H1N1) 2009 на мышиной модели. J. Virol. 87, 2226–2233 (2013).

Лю, Дж. И др. Обратная инженерия полевых изолятов вируса миксомы демонстрирует, что некоторые нарушения работы генов или потеря функции не объясняют изменений вирулентности, наблюдаемых в полевых условиях. J. Virol. 91, e01289–17 (2017).

О, Д. Ю. и Хёрт, А. С. Использование хорьков в качестве модели на животных для исследования противовирусной эффективности гриппа. Передний. Microbiol. 7, 80 (2016).

Dudas, G. et al. Геномы вирусов выявляют факторы, которые способствовали распространению и поддержанию эпидемии Эболы. Природа 544, 309–315 (2017).

Фариа, Н. Р. и др. Установление эпидемии и скрытая передача вируса Зика в Бразилии и Америке. Природа 546, 406–410 (2017).

Холмс, Э. К., Дудас, Г., Рамбаут, А. и Андерсен, К. Г. Эволюция вируса Эбола: выводы из эпидемии 2013–2016 гг. Природа 358, 193–200 (2016).

Hadfield, J. et al. Nextstrain: отслеживание эволюции патогенов в реальном времени. Биоинформатика https://doi.org/10.1093/bioinformatics/bty407 (2018).

Лэссиг, М. и uksza, М. Можем ли мы прочитать будущее по дереву? электронная жизнь 3, е05060 (2014).

Неер, Р. А., Рассел, К. А. и Шрейман, Б. И. Прогнозирование эволюции по форме генеалогических деревьев. электронная жизнь 3, e03568 (2014).

Longdon, B. et al. Причины и последствия изменений вирулентности после смены хозяина патогена. PLOS Pathog. 11, e1004728 (2015). Это исследование сочетает экспериментальную межвидовую передачу и филогенетику, чтобы выявить природу эволюции вирулентности вируса дрозофилы. Результаты показывают, что уровни вирулентности можно было предсказать исходя из филогении хозяина..

Walter, S. et al. Дифференциальные паттерны инфекции и недавнее эволюционное происхождение гепацивирусов лошадей у ​​ослов. J. Virol. 91, e01711 – e01716 (2016).

Leroy, E. M. et al. Летучие мыши как резервуары вируса Эбола. Природа 438, 575–566 (2005).

Allocati, N. et al. Передача болезней летучих мышей: возбудители зоонозов из водоемов диких животных в популяции людей. Cell Death Dis. 2, 16048 (2016).

Truyen, U., Evermann, J. F., Vieler, E. & amp Parrish, C. R. Эволюция собачьего парвовируса включала потерю и увеличение диапазона кошачьих хозяев. Вирусология 215, 186–189 (1996).

Allison, A. B. et al. Эволюция специфичного для хозяина парвовируса в природе повторяется адаптацией in vitro к различным видам хищников. PLOS Pathog. 10, e1004475 (2014).

Геогеган, Дж. Л., Сеньор, А. М., Ди Джиаллонардо, Ф. и Холмс, Е. С. Вирусологические факторы, которые увеличивают трансмиссивность возникающих вирусов человека. Proc. Natl Acad. Sci. Соединенные Штаты Америки 113, 4170–4175 (2016).

Андерсон Р. М. и Мэй Р. М. Коэволюция хозяев и паразитов. Паразитология 85, 411–426 (1982).

Булл, Дж. Дж. Вирулентность. Эволюция 48, 1423–1437 (1994).

Эберт, Д. в Эволюция здоровья и болезней (изд. Стернс, С. С.) 161–172 (Oxford Univ. Press, Oxford, 1999).

Эберт Д. и Булл Дж. Дж. Оспаривание модели компромисса для эволюции вирулентности: возможно ли управление вирулентностью? Trends Microbiol. 11, 15–20 (2003).

Эвальд, П.В. Эволюция инфекционных заболеваний. (Oxford Univ. Press, Oxford, 1994).

Рид, А. Ф. Эволюция вирулентности. Trends Microbiol. 2, 73–76 (1994).

Furió, V. et al. Связь между приспособленностью внутри хозяина и вирулентностью в вирусе везикулярного стоматита: корреляция с частичным разделением. J. Virol. 86, 12228–12236 (2012).

Лион, С. и Метц, Дж. А. Дж. За пределами максимизации R0: эволюция патогенов и экологические аспекты. Trends Ecol. Evol. 33, 458–473 (2018). В этой статье утверждается, что текущие формулировки р 0 слишком упрощены, чтобы понять эволюцию патогенов, и что необходим более сложный, многомерный подход.

Фрейзер, К., Холлингсворт, Т. Д., Чепмен, Р., де Вольф, Ф. & amp, Хэнадж, У. П. Изменение контрольной вирусной нагрузки ВИЧ-1: эпидемиологический анализ и эволюционная гипотеза. Proc. Natl Acad. Sci. Соединенные Штаты Америки 104, 17441–17446 (2007).

Ализон, С., Херфорд, А., Мидео, Н. и Ван Баален, М. Эволюция вирулентности и гипотеза компромисса: история, текущее положение дел и будущее. J. Evol. Биол. 22, 245–259 (2009). В этой статье представлен обзор теории, согласно которой существует компромисс между вирулентностью и трансмиссивностью, и выделены области, в которых теория подвергалась сомнению и расширялась за последние 20 лет..

Ализон С. и Михалакис Ю. Эволюция адаптивной вирулентности: старый добрый подход, основанный на фитнесе. Trends Ecol. Evol. 30, 248–254 (2015).

Липсич, М. и Моксон, Э. Р. Вирулентность и трансмиссивность патогенов: какова взаимосвязь? Trends Microbiol. 5, 31–37 (1997).

Новелла, И.С., Елена, С.Ф., Моя, А., Доминго, Э. и Голландия, Дж. Дж. Размер генетических узких мест, ведущих к потере приспособленности вируса, определяется средней начальной приспособленностью популяции. J. Virol. 69, 2869–2872 (1995).

Бетанкур, М., Эскрину, Ф., Фрейле, А. и Гарсия-Ареналь, Ф. Эволюция вирулентности универсального растительного вируса в гетерогенной системе хозяина. Evol. Прил. 6, 875–890 (2013).

Ди Джиаллонардо, Ф. и Холмс, Э. С. Биоконтроль вирусов: грандиозные эксперименты по возникновению и развитию болезней. Trends Microbiol. 23, 83–90 (2015).

Виллемсен, А., Цварт, М. П. и Елена, С. Ф. Высокая вирулентность не обязательно препятствует адаптации вируса к новому хозяину: тематическое исследование с использованием РНК-вируса растений. BMC Evol. Биол 17, 25 (2017).

De Roode, J.C. et al. Вирулентность и конкурентоспособность при генетически разнообразных малярийных инфекциях. Proc. Natl Acad. Sci. Соединенные Штаты Америки 102, 7624–7628 (2005).

Левин Б. Р. и Булл Дж. Дж. Близорукая эволюция и вирулентность патогенных микроорганизмов. Trends Microbiol. 2, 76–81 (1994).

Ллойд-Смит, Дж. О. и др. Динамика эпидемии на стыке человека и животного. Наука 326, 1362–1367 (2009).

Бергстром, К. Т., МакЭлхани, П. и Реал, Л. А. Узкие места передачи как детерминанты вирулентности в быстро развивающихся патогенных микроорганизмах. Proc. Natl Acad. Sci. Соединенные Штаты Америки 96, 5095–5100 (1999).

Болкер Б. М., Нанда А. и Шах Д. Преходящая вирулентность возникающих патогенов. J. R. Soc. Интерфейс 7, 811–822 (2010).

Браун, С. П., Корнфорт, Д. М. и Мидео, Н. Эволюция вирулентности у условно-патогенных микроорганизмов: генерализм, пластичность и контроль. Trends Microbiol. 20, 336–342 (2012).

Долан П. Т., Уитфилд З. Дж. И Андино Р. Картирование эволюционного потенциала РНК-вирусов. Клеточный микроб-хозяин 23, 435–446 (2018). В этой статье обсуждается, какие аспекты эволюции вируса можно предсказать, включая вирулентность, и как это можно проверить, и подчеркивается важность параллельной эволюции как маркера адаптации..

Sackman, A. M. et al. Параллельная эволюция, управляемая мутациями, во время вирусной адаптации. Мол. Биол. Evol. 34, 3243–3253 (2017).

Стюарт, К.-Б., Шиллинг, Дж. У. и Уилсон, А. С. Конвергентная эволюция последовательностей лизоцима? Природа 332, 788 (1988).

Фрикель, Дж., Феулнер, П. Г. Д., Каракок, Э. и Бекс, Л. Изменения численности популяции и паттерны параллельной эволюции в системе вирус-хозяин. Nat. Commun. 9, 1706 (2018).

Brault, A.C. et al. Единственная положительно отобранная вирусная мутация Западного Нила приводит к усилению птичьего вирогенеза у американских ворон. Nat. Genet. 39, 1162–1166 (2007). Это исследование демонстрирует, что положительный отбор на замену одной аминокислоты в геноме WNV был ответственен за повышенную вирулентность у американской вороны..

Longdon, B. et al. Смена хозяев приводит к параллельным генетическим изменениям, когда вирусы развиваются у близкородственных видов. PLOS Pathog. 14, e1006951 (2018).

Weaver, S. et al. Datamonkey 2.0: современное веб-приложение для характеристики избирательных и других эволюционных процессов. Мол. Биол. Evol. 35, 773–777 (2018).

Кряжимский С. и Плоткин Дж. Б. Популяционная генетика dN / dS. PLOS Genet. 4, e1000304 (2008).

Pybus, O.G. et al. Филогенетические доказательства вредной мутационной нагрузки в РНК-вирусах и ее вклада в вирусную эволюцию. Мол. Биол. Evol. 24, 845–852 (2007).

Бхатт, С., Холмс, Э. С. и Пибус, О. Г. Геномная скорость молекулярной адаптации вируса гриппа А. человека. Мол. Биол. Evol. 28, 2443–2451 (2011).

Геогеган, Дж. Л., Сеньор, А. М. и Холмс, Э. С. Узкие места в популяции патогенов и адаптивные ландшафты: преодоление препятствий на пути возникновения болезней. Proc. Биол. Sci. 283, 1837 (2016).

Морли В. Дж. И Тернер П. Е. Динамика молекулярной эволюции популяций РНК-вирусов зависит от внезапных и постепенных изменений окружающей среды. Эволюция 71, 872–883 (2017).

Таубенбергер, Дж. К. и др. Характеристика генов полимеразы вируса гриппа 1918 г. Природа 437, 889–893 (2005).

Сойер, С. Л., Эмерман, М. и Малик, Х. С. Древняя адаптивная эволюция антивирусного фермента редактирования ДНК приматов APOBEC3G. PLOS Biol. 2, e275 (2004).

Сойер, С. Л., Ву, Л. И., Эмерман, М. и Малик, Х. С. Положительный отбор приматов TRIM5alpha идентифицирует критический видоспецифичный домен рестрикции ретровирусов. Proc. Natl Acad. Sci. Соединенные Штаты Америки 102, 2832–2837 (2005).

Бедхомм С., Хиллунг Дж. И Елена С. Ф. Новые вирусы: почему они не мастера на все руки? Curr. Opin. Virol. 10, 1–6 (2015).

Urbanowicz, R.A. et al. Адаптация человека к вирусу Эбола во время эпидемии в Западной Африке. Клетка 167, 1079–1087 (2016).

Саймон-Лориер, Э. и Холмс, Э. С. Почему РНК-вирусы рекомбинируют? Nat. Rev. Microbiol. 9, 617–626 (2011).

Di Giallonardo, F. et al. Жидкая пространственная динамика вируса Западного Нила в США: быстрое распространение в благоприятной среде хозяина. J. Virol. 90, 862–872 (2016).

ЛаДо, С. Л., Килпатрик, А. М. и Марра, П. П. Возникновение вируса Западного Нила и крупномасштабное сокращение популяций птиц Северной Америки. Природа 447, 710–713 (2007).

Килпатрик, А. М. Глобализация, землепользование и вторжение вируса Западного Нила. Наука 334, 323–327 (2011).

Guan, Y. et al. Грипп H5N1: угроза пандемии различных видов. Proc. Natl Acad. Sci. Соединенные Штаты Америки 101, 8156–8161 (2004).

Уэбби, Р. Дж. И Вебстер, Р. Г. Готовы ли мы к пандемическому гриппу? Наука 302, 1519–1522 (2003).

Лам, Т. Т.-Й. и другие. Распространение, дивергенция и установление вирусов гриппа H7N9 в Китае. Природа 522, 102–105 (2015).

Ян, Л. и др. Генезис и распространение недавно появившихся высокопатогенных вирусов птиц H7N9 в материковом Китае. J. Virol. 91, e01277 – e01217 (2017).

Qi, W. et al. Возникновение и адаптация нового высокопатогенного вируса гриппа H7N9 у птиц и людей от низкопатогенного предка, инфицировавшего человека в 2013 г. J. Virol. 92, e00921–17 (2018).

Lipsitch, M. et al. Вирусные факторы в оценке риска пандемии гриппа. электронная жизнь 5, e18491 (2016).

Бейджент, С. Дж. И МакКоли, Дж. У. Грипп типа А у людей, млекопитающих и птиц: детерминанты вирулентности вируса, диапазон хозяев и межвидовая передача. Биологические исследования 25, 657–671 (2003).

Хоримото, Т. и Каваока, Ю. Грипп: уроки прошлых пандемий, предупреждения из текущих инцидентов. Nat. Rev. Microbiol. 3, 591–600 (2005).

Monne, I. et al. Возникновение высокопатогенного вируса птичьего гриппа от низкопатогенного предшественника. J. Virol. 88, 4375–4388 (2014).

Russell, C.A. et al. Возможность эволюции вируса гриппа A / H5N1, передаваемого через дыхательные пути, в организме млекопитающего-хозяина. Наука 336, 1541–1547 (2012).

Хатта, М., Гао, П., Халфманн, П. и Каваока, Ю. Молекулярные основы высокой вирулентности вирусов гонконгского гриппа A H5N1. Наука 293, 1840–1842 (2001).

Pearce, M. B. et al. Повышенная вирулентность высокопатогенных вирусов птичьего гриппа A H5N1 клады 2.3.2.1 у хорьков. Вирусология 502, 114–122 (2017).

Ногалес А., Мартинес-Собридо Л., Топхэм Д. Дж. И ДеДиего М. Л. Изменения аминокислот белка NS1 D189N и V194I влияют на интерфероновые ответы, термочувствительность и вирулентность циркулирующих вирусов гриппа A человека H3N2. J.Virol. 91, e01930–16 (2017).

Джексон, Д., Хоссейн, М. Дж., Хикман, Д., Перес, Д. Р. и Лэмб, Р. А. Новая детерминанта вирулентности вируса гриппа: четыре С-концевых остатка белка NS1 модулируют патогенность. Proc. Natl Acad. Sci. Соединенные Штаты Америки 105, 4381–4386 (2008).

Kash, J.C. et al. Геномный анализ повышенной иммунной реакции хозяина и реакции гибели клеток, вызванной вирусом гриппа 1918 г. Природа 443, 578–581 (2006). В этой статье представлено всестороннее исследование вирулентности вируса гриппа 1918 года на мышиной модели, раскрывающее важность взаимодействий вирус-хозяин с участием широкого набора взаимодействующих вирусных генов..

Бэ, Ж.-Й. и другие. Одна аминокислота в кислотном белке полимеразы определяет патогенность вирусов гриппа B. J. Virol. 92, e00259 – e00218 (2018).

Феннер, Ф. Биологический контроль на примере ликвидации оспы и миксоматоза. Proc. R. Soc. Б. 218, 259–285 (1983).

Феннер, Ф. и Маршалл, И. Д. Сравнение вирулентности европейских кроликов (Oryctolagus cuniculus) штаммов вируса миксомы, выделенных в полевых условиях в Австралии, Европе и Америке. J. Hyg. 55, 149–191 (1957).

Феннер, Ф. и Рэтклифф, Ф. Н. Миксоматоз (Издательство Кембриджского университета, Кембридж, 1965).

Керр, П. Дж. И др. История эволюции и ослабление вируса миксомы на двух континентах. PLOS Pathog. 8, e1002950 (2012). В этой статье представлен первый крупномасштабный филогеномный анализ MYXV и показано, что, несмотря на параллельную эволюцию на фенотипическом (то есть степень вирулентности) уровне, разные вирусные мутации были ответственны за эволюцию вирулентности как в Австралии, так и в Европе..

Керр, П. Дж. И др. Масштабная эволюция генома вируса миксомы (MYXV) показывает адаптацию патогена к хозяину и быстрое географическое распространение. J. Virol. 87, 12900–12915 (2013).

Елена, С. Ф., Карраско, П., Дарос, Дж. А. и Санхуан, Р. Механизмы генетической устойчивости РНК-вирусов. EMBO Rep. 7, 168–173 (2006).

Гандон, С., Маккиннон, М. Дж., Ни, С. и Рид, А. Ф. Несовершенные вакцины и эволюция вирулентности патогенов. Природа 414, 751–756 (2001).

Смит, Т. Несовершенные вакцины и несовершенные модели. Trends Ecol. Evol. 17, 154–156 (2002).

Рид, А. Ф. и др. Несовершенная вакцинация может усилить передачу высоковирулентных патогенов. PLOS Biol. 13, e1002198 (2015). Эта статья представляет собой четкую демонстрацию того, что несовершенная вакцинация была ответственна за повышенную вирулентность в случае MDV цыплят, и рассматривает эволюционные последствия несовершенной вакцинации в целом..

Камил, Дж. П. и др. vLIP, гомолог вирусной липазы, является фактором вирулентности вируса болезни Марека. J. Virol. 79, 6984–6996 (2005).

Trimpert, J. et al. Филогеномный анализ вируса болезни Марека показывает независимые пути к вирулентности в Евразии и Северной Америке. Evol. Прил. 10, 1091–1101 (2017).

Маккиннон, М. Дж. И Рид, А. Ф. Иммунитет способствует развитию вирулентности в модели малярии. PLOS Biol. 2, e230 (2004).

Carre, N. et al. Изменилась ли скорость прогрессирования СПИДа за последние годы? СПИД 11, 1611–1618 (1997).

Fraser, C. et al. Вирулентность и патогенез инфекции ВИЧ-1: эволюционная перспектива. Наука 343, 1243727 (2014). Это ключевое исследование эволюции вирулентности ВИЧ фокусируется на факторах, определяющих SPVL, и показывает важность генетических признаков вируса в формировании SPVL и, следовательно, тяжести заболевания..

Galai, N. et al. Временные тренды начального количества клеток CD4 после сероконверсии вируса иммунодефицита человека в Италии, 1985–1992 гг. Итальянское сероконверсионное исследование вируса иммунодефицита человека. Являюсь. J. Epidemiol. 143, 278–282 (1996).

Herbeck, J. T. et al. Меняется ли вирулентность ВИЧ? Мета-анализ тенденций в прогностических маркерах прогрессирования и передачи ВИЧ-инфекции. СПИД 26, 193–205 (2012).

Ванхемс, П., Ламберт, Дж., Герра, М., Хиршель, Б. и Аллард, Р. Связь между скоростью снижения CD4 + Т-лимфоцитов и годом сероконверсии вируса иммунодефицита человека (ВИЧ) типа 1 среди лиц, включенных в исследование. в швейцарском когортном исследовании ВИЧ. J. Infect. Дис. 180, 1803–1808 (1999).

Ариен, К. К., Ванхам, Г. и Арс, Э. Дж.Переходит ли ВИЧ-1 в менее вирулентную форму у людей? Nat. Rev. Microbiol. 5, 141–151 (2007).

Claiborne, D. T. et al. Репликативная способность передаваемого ВИЧ-1 вызывает острую иммунную активацию, провирусную нагрузку на CD4 + Т-клетки памяти и прогрессирование заболевания. Proc. Natl Acad. Sci. Соединенные Штаты Америки 112, E1480 – E1489 (2015).

Miura, T. et al. Нарушение способности к репликации острых / ранних вирусов у людей, которые становятся контролерами ВИЧ. J. Virol. 84, 7581–7591 (2010).

Blanquart, F. et al. На генетические вариации вирусов приходится треть вариабельности контрольной вирусной нагрузки ВИЧ-1 в Европе. PLOS Biol. 15, e2001855 (2017).

Fellay, J. et al. Общие генетические вариации и контроль ВИЧ-1 у людей. PLOS Genet. 5, e1000791 (2009).

Alizon, S. et al. Филогенетический подход показывает, что генотип вируса во многом определяет вирусную нагрузку ВИЧ. PLOS Pathog. 6, е1001123 (2010).

Blanquart, F. et al. Эволюционный компромисс между передачей и вирулентностью объясняет ослабление ВИЧ-1 в Уганде. электронная жизнь 5, e20492 (2016).

Софонеа, М. Т., Алдакак, Л., Буллоса, Л. Ф. В. В. и Алисон, С. Может ли вирус Эбола стать менее вирулентным для человека? J. Evol. Биол. 31, 382–392 (2018).

Diehl, W. E. et al. Гликопротеин вируса Эбола с повышенной инфекционностью доминировал в эпидемии 2013–2016 годов. Клетка 167, 1088–1098 (2016). В этом исследовании используется комбинация филогенетики и экспериментального исследования, чтобы продемонстрировать важность замены A82V в гликопротеине EBOV для вирусной инфекционности и предположить, что A82V имеет повышенную вирулентность вируса..

Ng, M. et al. Рецептор филовируса NPC1 вносит вклад в видоспецифические паттерны чувствительности к эболавирусу у летучих мышей. электронная жизнь 4, e11785 (2015).

Марзи, А. и др. Недавно идентифицированные мутации в геноме вируса Эбола-Макона не изменяют патогенность в моделях на животных. Cell Rep. 23, 1806–1816 (2018).

Чан, Дж. Ф., Чой, Г. К., Ип, К. С., Ченг, В. К. и Юэн, К. Ю. Лихорадка Зика и врожденный синдром Зика: неожиданно возникающее арбовирусное заболевание. J. Infect. 72, 507–524 (2016).

Као-Лормо, В. М. и др. Вспышка синдрома Гийена – Барре, связанная с вирусной инфекцией Зика, во Французской Полинезии: исследование случай – контроль. Ланцет 387, 1531–1539 (2016).

Фаучи, А. С. и Моренс, Д. М. Вирус Зика в Америке - еще одна угроза арбовируса. N. Engl. J. Med. 374, 601–604 (2016).

Симонин Ю., Ван Риель Д., Ван де Перре П., Роккс Б. и Салинас С. Дифференциальная вирулентность между азиатскими и африканскими линиями вируса Зика. PLOS Negl. Троп. Дис. 11, e0005821 (2017).

Грубо, Н. Д., Фариа, Н. Р., Андерсен, К. Г. и Пибус, О. Г. Геномное понимание возникновения и распространения вируса Зика. Клетка 172, 1160–1162 (2018).

Liu, Y. et al. Эволюционное усиление инфекционности вируса Зика у комаров Aedes aegypti. Природа 545, 482–486 (2017). Результаты этого исследования показывают, что мутация в белке NS1 в ZIKV, связанная с недавней вспышкой в ​​Америке, вызывает повышенную инфекционность у Aedes aegypti комары, в свою очередь, повышают эпидемический потенциал.

Юань, Л. и др. Одна мутация в белке prM вируса Зика способствует микроцефалии плода. Наука 358, 933–936 (2017).

Розенфельд, А. Б., Дубин, Д. Дж., Уоррен, А. Л., Раканиелло, В. Р. и Валле, Р. Б. Репликация ранних и недавних изолятов вируса Зика на протяжении всего развития мозга мыши. Proc. Natl Acad. Sci. Соединенные Штаты Америки 114, 12273–12278 (2017).

Ферт С. и Липкин В. И. Геномика возникающих патогенов. Анну. Преподобный Геном. Гм. Genet. 14, 281–300 (2013).

Гарди, Дж. Л. и Ломан, Н. Дж. На пути к глобальной системе наблюдения за патогенами в режиме реального времени, основанной на геномике. Nat. Преподобный Жене. 19, 9–20 (2018).

Ши М., Чжан Ю.-З. и Холмс, Э. С. Мета-транскриптомика и эволюционная биология РНК-вирусов. Virus Res. 243, 83–90 (2018).

Геогеган, Дж. Л. и Холмс, Э. С. Прогнозирование появления вируса на фоне эволюционного шума. Откройте Биол. 7, 170189 (2017).

Lighten, J. & amp van Oosterhout, C. Биоконтроль карпа в Австралии создает риски для биобезопасности. Nat. Ecol. Evol. 1, 87 (2017).

Маршалл, Дж. И др. Биоконтроль инвазивному карпу: риски многочисленны. Наука 359, 877 (2018).

Макколл, К. А., Шеппард, А. В. и Барвик, М. Безопасный и эффективный биоконтроль карпа. Nat. Ecol. Evol. 1, 134 (2017).

Макколл, К. А., Сунарто, А. и Холмс, Е. С. Вирус карпового герпеса 3 и его эволюционное будущее в качестве средства биологической борьбы с карпом в Австралии. Virol. Дж. 13, 206 (2016).

Андре, Дж. Б. и Хохберг, М. Е. Эволюция вирулентности при возникающих инфекционных заболеваниях. Эволюция 59, 1406–1412 (2005).

Чахруди, А., Бозингер, С. Е., Вандерфорд, Т. Х., Пайардини, М. и Сильвестри, Г. Естественные хозяева ВИО: открывая двери для СПИДа. Наука 335, 1188–1193 (2012).

Сильвестри, Г., Пайардини, М., Пандреа, И., Ледерман, М., и Содора, Д. Л. Понимание доброкачественной природы инфекции SIV у естественных хозяев. J. Clin. Инвестировать. 117, 3148–3154 (2007).

Кил, Б. Ф. и др. Повышенная смертность и СПИД-подобная иммунопатология у диких шимпанзе, инфицированных SIVcpz. Природа 460, 515–519 (2009). Результаты этого исследования показывают, что вирус обезьяньего иммунодефицита у шимпанзе, который является предком ВИЧ, увеличивает смертность этих животных, хотя и с меньшей явной болезнью, чем у людей..

Crawford, P.C. et al. Передача вируса гриппа лошадей собакам. Наука 310, 482–485 (2005).

Пэрриш, К. Р., Мурсия, П. Р. и Холмс, Е. С. Резервуары вируса гриппа и промежуточные хозяева: собаки, лошади и новые возможности воздействия вируса гриппа на людей. J. Virol. 89, 2990–2994 (2015).

Feng, K.H. et al. Вирусы гриппа лошадей и собак Вирусы H3N8 имеют минимальные биологические различия, несмотря на филогенетическое расхождение. J. Virol. 89, 6860–6873 (2015).

Бурхи, Х., Даутри-Варсат, А., Хотез, П. Дж. И Саломон, Дж. Бешенство, по-прежнему игнорируются после 125 лет вакцинации. PLOS Negl Trop. Дис. 4, e839 (2010).

Гарвер, К. А., Баттс, В. Н. и Курат, Г. Сравнение вирулентности геногрупп U и M вируса инфекционного гематопоэтического некроза у саламона нерки и радужной форели. J. Aquat. Anim. Здоровье 18, 232–243 (2006).

Пенаранда М. М., Перселл М. К. и Курат Г. Механизмы дифференциальной вирулентности инфекционного вируса гематопоэтического некроза у радужной форели (Oncorhynchus mykiss) включают проникновение в организм хозяина и кинетику репликации вируса. Gen. J. Virol. 90, 2172–2182 (2009).

Керр, П. Дж. И др. Эволюция вируса миксомы: геномная и фенотипическая характеристика изолятов из Великобритании выявляет множество успешных эволюционных путей, отличных от таковых в Австралии. PLOS Pathog. 13, e1006252 (2017).

Керр, П. Дж. И др. Следующим шагом в продолжающейся гонке вооружений между вирусом миксомы и дикими кроликами в Австралии является новый фенотип заболевания. Proc. Natl Acad. Sci. Соединенные Штаты Америки 114, 9397–9402 (2017).

Jiao, P. et al. Замена одной аминокислоты в белке NS1 изменяет патогенность вирусов птичьего гриппа H5N1 у мышей. J. Virol. 82, 1146–1154 (2008).

Cotter, C.R., Jin, H. & amp Chen, Z. Одна аминокислота в области стебля белка НА вируса гриппа H1N1pdm влияет на слияние, стабильность и инфекционность вируса. PLOS Pathog. 10, е1003831 (2014).

Громовски, Г. Д., Файерстоун, К. Ю. и Уайтхед, С. С. Генетические детерминанты вакцинного штамма вируса японского энцефалита SA14-14-2, которые определяют ослабление вирулентности у мышей. J. Virol. 89, 6328–6337 (2015).

Он, W. et al. Влияние делеции 88 аминокислот в nsp2 вируса репродуктивного и респираторного синдрома свиней на репликацию вируса и цитокиновые ответы in vitro. Arch. Virol. 163, 1489–1501 (2018).

Yu, X. et al. Глутаминовый остаток в положении 402 на С-конце нуклеопротеина вируса болезни Ньюкасла является критическим для вируса. Sci. Rep. 7, 17471 (2017).

Панзарин В. и др. Низкая скорость эволюции вируса инфекционного некроза поджелудочной железы (IPNV) в Италии связана со снижением вирулентности форели. Virus Evol. 4, vey019 (2018).

Dietzschold, B. et al. Характеристика антигенной детерминанты гликопротеина, которая коррелирует с патогенностью вируса бешенства. Proc. Natl Acad. Sci. Соединенные Штаты Америки 80, 70–74 (1983).

Blanie, S., Mortier, J., Delverdier, M., Bertagnoli, S. & amp; Camus-Bouclainville, C. M148R и M149R являются двумя факторами вирулентности для патогенеза вируса миксомы у европейского кролика. Вет. Res. 40, 11 (2009).

Bauer, P.H. et al. Генетический и структурный анализ детерминанты вирулентности полиомавируса VP1. J. Virol. 69, 7925–7931 (1995).

Балинский, С.А. и др. Кельч-подобный ген вируса Sheeppox SPPV-019 влияет на вирулентность вируса. J. Virol. 81, 11392–11401 (2007).


Материалы и методы

Оценка уровней экспрессии генов

Наборы данных секвенирования РНК, используемые в этом исследовании

Уровни экспрессии генов клеток Vero и ORF для SARS-CoV-2 были оценены на основе данных секвенирования РНК на основе наношаров для клеток Vero, инфицированных SARS-CoV-2 BetaCoV / Korea / KCDC03 / 2020 (Kim et al.2020). Уровни экспрессии ORF БВРС-КоВ оценивали по данным секвенирования РНК эпителиальных клеток аденокарциномы легких человека (Calu-3), собранных через 6 часов после инфицирования БВРС-КоВ HCoV-EMC / 2012 (Zhang et al.2020). Уровни экспрессии Вирус гриппа А ORF оценивали по данным секвенирования РНК первичного эпителия легких человека (NHBE), инфицированного подтипом H1N1. Вирус гриппа А A / Puerto Rico / 8/1934 (Бланко-Мело и др., 2020). Уровни экспрессии генов ORF вируса Эбола были оценены на основе данных секвенирования РНК клеток печени человека (Huh7), инфицированных изолятом вируса Эбола Makona (Albarino et al. 2018). Уровни экспрессии ORF для HERV оценивали по данным секвенирования РНК мононуклеарных клеток периферической крови человека от шести здоровых людей (Tokuyama et al. 2018).

Справочные геномы

Уровни экспрессии при SARS-CoV-2 и MERS-CoV

Уровень мРНК ORF коронавирусов невозможно оценить по количеству отображенных считываний в данных секвенирования РНК из-за вложенной природы генома и субгеномов (Kim et al.2020). Тем не менее, такие вложенные субгеномы были произведены прерывистым синтезом РНК с отрицательной цепью (т. Е. Слиянием лидера с телом), поэтому численность субгенома можно оценить по количеству считываний соединения лидер-тело (рис. 2B ). Причина кратко описывается следующим образом. Существует два типа последовательностей, регулирующих транскрипцию (TRS): TRS-L находится ниже лидерной последовательности, а TRS тела (TRS-B) находится выше индивидуальных ORF. Во время синтеза РНК с отрицательной цепью TRS-B с отрицательной цепью может гибридизоваться с TRS-L в геномной РНК с положительным смыслом, и синтез продолжается с использованием лидерной последовательности в качестве матрицы, что приводит к переходу от лидера к -корпус. Для каждого субгенома транслируется только самая восходящая (5 & # x02032-) ORF (когда утечка сканирования стартовых кодонов не рассматривается). Следовательно, уровень мРНК ORF в субгеноме может быть выведен из числа считываний, содержащих лидер. ORF1ab транслируется с геномной РНК. Следовательно, хотя соединения лидер-тело отсутствует, считывания, содержащие лидер, все же можно использовать для оценки уровня его мРНК.

Считанные значения секвенирования РНК инфицированных коронавирусом клеточных линий были сопоставлены со ссылками на STAR 2.7.3a (Dobin et al. 2013) с использованием следующих параметров: --outFilterTypeBySJout --outFilterMultimapNmax 20 --align SJoverhangMin 8 --outSJfilterOverhangMin 12 12 12 12 --outSJfilterCountUniqueMin 1 1 1 1 --outSJfilterCount TotalMin 1 1 1 1 --outSJfilterDistToOtherSJmin 0 0 0 0 --outFilterMismatchNmax 999 --outFilterMismatchNover ReadLmax-0,04 --scoreGapNonchpe - В пределах chimScoreJunction NonGTAG 0 --alignSJstitchMismatchNmax -1 -1-1-1 --alignIntronMin 20 --alignIntronMax 1000000 --alignMates GapMax 1000000.

TRS-L SARS-CoV-2 является 70-м нуклеотидом в его геноме, а MERS-CoV - 62-м нуклеотидом. Следовательно, учитывались только чтения с сайтом 5 & # x02032, расположенным между 55-м и 85-м нуклеотидами генома SARS-Cov-2 (или между 45-м и 80-м нуклеотидами генома MERS-CoV), поскольку они представляли субгеномы, генерируемые каноническое слияние лидера с телом. Считывание соединения лидер-тело было назначено субгеному в соответствии с последовательностью ORF непосредственно после его сайта соединения 3 & # x02032, чтение соединения лидера с телом будет отброшено, если его сайт соединения 3 & # x02032 превышает 50 нуклеотидов перед стартовым кодоном любой ORF. Уровень мРНК ORF1ab рассчитывали по количеству считываний, содержащих лидер, выровненных по геномной РНК без пропусков. ORF10 SARS-CoV-2 был исключен из этого исследования, потому что у него нет TRS-B, а также не был обнаружен его субгеном (Kim et al.2020). Zhang et al. (2020) предоставили три повторяющихся набора данных RNA-seq для клеток Calu-3, инфицированных MERS-CoV. Учитывая, что уровни мРНК среди ORF были согласованы в трех повторах, в этом исследовании использовали реплику №3.

Уровни экспрессии в Вирус гриппа А и вирус Эбола

Уровень экспрессии ORF оценивался по количеству сопоставленных считываний секвенирования. Данные секвенирования РНК были сопоставлены с соответствующими ссылками с помощью STAR с использованием параметров по умолчанию. Уровень экспрессии ORF был дан RSEM (Li and Dewey 2011). Стоит отметить, что Вирус гриппа А штамм подтипа H1N1, используемый для оценки уровня экспрессии (A / Puerto Rico / 8/1934), не имеет прямого отношения к вариантам вируса, используемым для оценки скорости эволюции, вирусам от пандемии 2009 года. Тем не менее, мы предположили, что относительные уровни экспрессии ORF вряд ли сильно изменились среди Вариант вируса гриппа Аs, поскольку необходимо в значительной степени поддерживать стехиометрический баланс вирусных белков, чтобы гарантировать правильную упаковку вирусной частицы. Альбарино и другие. (2018) предоставили три набора данных RNA-seq в разные моменты времени после того, как клетки Huh7 были инфицированы вирусами Эбола, средний уровень экспрессии в трех временных точках использовался для каждой ORF.

Уровни экспрессии в Вирус осповакцины и цитомегаловирус человека

Уровни экспрессии Вирус осповакцины ORF были получены из данных массива тайлинга генома Вирус осповакцины-инфицированные клетки HeLa (Assarsson et al. 2008) большинство вирусных ORF инициировали транскрипцию через 4 часа после заражения, и поэтому уровни экспрессии в этот момент времени были использованы для дальнейших анализов. Уровни экспрессии ORF цитомегаловируса человека были получены из предыдущего исследования, в котором были проведены эксперименты по секвенированию РНК на инфицированных цитомегаловирусом человека гемопоэтических стволовых клетках CD34 + (Cheng et al.2017). В этом исследовании использовались данные секвенирования РНК клеток, собранных через 2 дня после заражения, когда вирусные ОРС наиболее активно транскриптировались.

Уровни экспрессии вируса парагриппа человека типа 3, респираторно-синцитиального вируса человека, вируса кори и вируса эпидемического паротита

Уровень экспрессии ORF был получен из плотностей полос гелей для электрофореза, оцененных в предыдущих исследованиях (Cattaneo et al. 1987 De et al. 1990 Barik 1992 Takeuchi et al. 1993 Pag & # x000e1n et al. 2012).

Оценка уровней экспрессии перекрывающихся ORF

Некоторые вирусные ORF перекрываются друг с другом, и кодируемые ими белки транслируются с помощью различных механизмов, таких как сканирование с утечкой информации, сдвиг рамки рибосом и редактирование РНК. При оценке уровня экспрессии перекрывающихся ORF были рассмотрены три сценария. Во-первых, перекрывающиеся ORF имеют один и тот же стартовый кодон (например, ORF1a/ORF1ab в SARS-CoV-2). Во-вторых, перекрывающиеся ORF транслируются в разные кадры из-за утечки сканирования (например, ORF3a/ORF3b в SARS-CoV-2). В обоих сценариях мы присвоили предполагаемый уровень мРНК самой длинной ORF (например, ORF1ab или ORF3a) для простоты по этой ORF также оценивалась скорость эволюции. В третьем сценарии, например, P / V / C в вирусе кори и вирусе парагриппа человека 3 типа, есть перекрывающиеся ORF, имеющие один и тот же стартовый кодон (P и V), а также перекрывающиеся ORF в разных рамках трансляции (C и P ) в той же геномной области мы разделили общий предполагаемый уровень мРНК на отдельные ORF в соответствии с сообщенным относительным содержанием белка (ViralZone, https://viralzone.expasy.org/857, получено 18 июня 2020 г.).

Уровни экспрессии генов обезьяны и человека

Данные секвенирования РНК клеток Vero, инфицированных SARS-CoV-2, были сопоставлены с геномом C. sabaeus со звездой с использованием параметров по умолчанию. Точно так же данные секвенирования РНК мононуклеарных клеток периферической крови человека были сопоставлены с геномом человека с помощью STAR с использованием параметров по умолчанию. Каждому считыванию был присвоен соответствующий выровненный ген с параметром --quantMode TranscriptomeSAM. Учитывая, что для гена могут существовать множественные изоформы сплайсинга, была оценена численность каждой изоформы, и общая численность всех изоформ гена была использована в качестве уровня его экспрессии.

Уровни экспрессии ORF HERV

Данные секвенирования РНК мононуклеарных клеток периферической крови человека были сопоставлены с геномом человека с помощью STAR с использованием следующих параметров: --outSAMtype BAM SortedByCoordinate --outFilterMultimapNmax 30. Файл аннотации ORF HERV был загружен из gEVE 5 августа 2020 г. ( геномная база данных эндогенных вирусных элементов, http://geve.med.u-tokai.ac.jp) (Nakagawa and Takahashi, 2016). Отмечено, что некоторые ORF HERV были аннотированы как несколько усеченных областей. Для каждой аннотированной области ORF или ORF уровень экспрессии определялся как соотношение между числом выровненных считываний, которое было оценено с помощью Telescope 1.0.3 (Bendall et al., 2019) с параметрами по умолчанию, и длиной области ORF или ORF. . Поскольку аннотированные области одной и той же ORF HERV могут иметь разные предполагаемые уровни экспрессии, мы использовали средний уровень экспрессии всех экспрессированных аннотированных областей ORF одной и той же ORF, чтобы представить уровень экспрессии этой ORF.

Уровни белка в SARS-CoV-2

Обилие белков, кодируемых геномом SARS-CoV-2, оценивали по количеству совпадений пептидного спектра (PSM) белка, нормализованного по количеству его теоретических пептидов. Количество PSM было получено из предыдущего протеомного анализа клеток Vero, инфицированных SARS-CoV-2, с использованием тандемной масс-спектрометрии (Davidson et al.2020). Теоретические пептиды белков, перевариваемых трипсином, были получены in silico с использованием собственного скрипта Python, в котором максимальное количество пропущенного аргинина или лизина во время переваривания было установлено равным 2. Подсчитывался только пептид длиной от 7 до 140 аминокислот. . Расчетное содержание белка в девяти ORF SARS-CoV-2 сильно коррелировало с соответствующим содержанием мРНК (r & # x02009=& # x020090.99, П & # x02009=& # x020096 & # x02009 & # x000d7 & # x0200910 & # x022127, таблица корреляции Пирсона & # x02019s 1).

Оценка скорости эволюции белков

Получение геномной последовательности вариантов вируса

Полные последовательности генома вариантов SARS-CoV-2 и Вирус гриппа А были загружены из GISAID (Глобальная инициатива по обмену всеми данными о гриппе, https://www.gisaid.org/) (Shu and McCauley, 2017), данные о БВРС-КоВ, вирусе Эбола, вирусе кори, вирусе эпидемического паротита, вирусе парагриппа человека 3 типа. , респираторно-синцитиальный вирус человека, Вирус осповакциныи цитомегаловирус человека были загружены с сайта NCBI Virus (https://www.ncbi.nlm.nih.gov/labs/virus/vssi/) (Hatcher et al.2017). В частности, для SARS-CoV-2 12 мая 2020 г. было загружено 13 556 последовательностей генома с высоким охватом. Последовательности генома, выделенные из летучих мышей, панголина, тигра или норки, а также последовательности с более чем 50 основаниями, не определенные во время секвенирования (помечены как Ns в последовательности генома) были отфильтрованы, а оставшиеся 7310 последовательностей были использованы для последующего анализа. Для MERS-CoV последовательности генома с более чем 200 несовпадениями нуклеотидов относительно эталонного генома были отфильтрованы, и 518 оставшихся последовательностей генома (как от человека, так и от животных-хозяев) были использованы для последующего анализа. Для вируса Эбола было загружено 287 последовательностей генома, собранных в Сьерра-Леоне и Гвинее во время вспышки эпидемии в Западной Африке в 2013–2013 гг. Для Вирус гриппа А подтипа H1N1 было загружено 1839 последовательностей генома, собранных во время пандемии 2009 года. Для вируса кори и паротита было загружено 209 и 284 геномных последовательностей соответственно. Для вируса парагриппа человека типа 3 было загружено всего 353 полных последовательности генома. Для респираторно-синцитиального вируса человека было загружено 1006 полных последовательностей генома подгруппы А. Для Вирус осповакциныбыло загружено 103 полных последовательности генома. Две последовательности (<"type": "entrez-нуклеотид", "attrs": <"text": "NC_006998", "term_id": "66275797", "term_text": "NC_006998" >> NC_006998 и <" type ":" entrez-nucleotide "," attrs ": <" text ":" AY243312 "," term_id ":" 29692106 "," term_text ":" AY243312 ">> AY243312) были идентичны друг другу, и мы сохранили только эталонный геном <"type": "entrez-нуклеотид", "attrs": <"text": "NC_006998", "term_id": "66275797", "term_text": "NC_006998" >> NC_006998 для дальнейшего анализа. Кроме того, два варианта вируса (<"type": "entrez-нуклеотид", "attrs": <"text": "MG012795", "term_id": "1320878772", "term_text": "MG012795" >> >> MG012795 и <"type": "entrez-нуклеотид", "attrs": <"text": "MG012796", "term_id": "1320879051", "term_text": "MG012796" >> MG012796), которые имели исключительно длинные внешние ветви филогенетического дерева были исключены для дальнейшего анализа. Как следствие, всего 100 оставшихся последовательностей были использованы для оценки скорости эволюции белка в Вирус осповакцины. Для цитомегаловируса человека было загружено всего 299 полных последовательностей генома.

Оценка скорости эволюции белков в вирусах

Скорость эволюции белков десяти видов вирусов, исследованных в этом исследовании, была определена на основе средней попарной разницы между вариантами. В частности, для каждого вида вируса эталонная последовательность каждой ORF была сопоставлена ​​с геномами отдельных вариантов вируса с помощью иглы EMBOSS (Rice et al. 2000). Выровненные последовательности (без пробелов) in silico транслировали в белковые последовательности. Для каждой пары вариантов подсчитывали количество различных аминокислот и оценивали среднее значение для всех возможных пар вариантов, которое дополнительно нормализовали по длине пептидной последовательности.

Оценка скорости эволюции белка SARS-CoV-2 до передачи зоонозов

Скорость последовательности белка SARS-CoV-2 во время эволюции у животных-хозяев оценивалась на основе dN/dS соотношение между SARS-CoV-2 и тремя родственными коронавирусами, выделенными от летучих мышей или ящеров. Последовательности SARS-CoV-2 (Wu et al. 2020), RaTG13 (GenBank: <"type": "entrez-нуклеотид", "attrs": <"text": "MN996532.1", "term_id": «1802633852», «term_text»: «MN996532.1» >> MN996532.1), выделенные от летучих мышей в Юньнани (Zhou et al. 2020), GD-1 (GISAID: EPI_ISL_410721), выделенные от ящеров в Гуандуне (Xiao et al. 2020) и GX-P5E (GISAID: EPI_ISL_410541), выделенные из панголинов в Гуанси (Lam et al.2020), были выровнены с помощью MUSCLE (Эдгар 2004), филогенетическое дерево было построено с использованием метода объединения соседей в MEGA X (Kumar et al. 2018) с максимальной совокупной вероятностью в качестве модели замещения. Коронавирус (bat-SL-CoVZC45, GenBank: <"type": "entrez-нуклеотид", "attrs": <"text": "MG772933.1", "term_id": "1369125417", "term_text": " MG772933.1 ">> MG772933.1), выделенный из Чжэцзяна (Hu et al. 2018), был использован для укоренения филогенетического дерева. Гомологичные ORF среди SARS-CoV-2, RaTG13, GD-1 и GX-P5E были сопоставлены с помощью MUSCLE. Среднее dN, dS, а также dN/dS соотношение на филогенетическом дереве оценивалось для каждой ORF с помощью codeml в PAML (Yang 2007) при параметрах model = 0, NSsites = 0, fix_omega = 0 и clock = 0.

Оценка межвидового dN/dS Соотношение трех групп видов / подвидов вирусов

Оценка скорости эволюции белков, кодируемых ядерным геномом приматов

Мы оценили скорость эволюции белков, кодируемых в геноме клеток Vero, по дивергенции белков между C. sabaeus а также M. mulatta. Для каждого гена доли идентичных аминокислот в выравнивании последовательностей между двумя видами, & # x0201cC. sabaeus % ID & # x0201d и & # x0201cМ. мулатта % ID, & # x0201d были получены из Ensembl (выпуск 99). Гомологичная пара генов была отфильтрована, если две фракции различаются более чем на 5%. Было оценено среднее значение двух фракций, и его отличие от 100% было использовано для вывода скорости эволюции белка. Скорость эволюции белков человека оценивалась аналогичным образом как средняя доля идентичных аминокислот при выравнивании последовательностей человека и шимпанзе, & # x0201cХ. сапиенс % ID & # x0201d и & # x0201cP. troglodytes % ID. & # X0201d

Оценка скорости эволюции ORF для HERV

Последовательности белков эндогенного ретровируса человека и шимпанзе были загружены из gEVE. Пара ортологичных эндогенных ретровирусов шимпанзе человека и шимпанзе для аннотированной области ORF была идентифицирована по трем критериям: 1) ортологичная пара представляет синтенные взаимные наилучшие совпадения BLAST 2) идентичность выровненной последовательности была больше 85% и 3) количество выровненные аминокислоты составляли не менее 85% полной длины белка в любой аннотированной области. Скорость эволюции каждой аннотированной области ORF оценивалась по дивергенции белков между человеком и шимпанзе, определяемой как число различных аминокислот, деленное на среднюю длину белка ортологичной пары. Подобно оценке уровней экспрессии, мы использовали среднюю скорость эволюции всех аннотированных областей ORF, чтобы представить скорость эволюции ORF, когда несколько областей аннотированы для одной и той же ORF.