Генетические детерминанты расщепления фурина в различных вирусах европейских летучих мышей, связанных с SARS

Сбор и обработка проб

летучие мыши (Р. эвриалаИ Р. blasiiИ Р. феррумеквинум И Р. хиппосидерос) были отобраны в четырех странах (Болгария, Италия, Словения, Испания)15, 16, 18. Со всеми животными обращались в соответствии с национальным и европейским законодательством о защите животных (Директива Совета ЕС 86/609/EEC). Во время этого исследования животных не забивали. Все операции с животными и отбор проб проводились обученным персоналом, при этом безопасность и комфорт животных были в приоритете во время минимально инвазивного отбора проб (сбора фекалий). Пойманных летучих мышей немедленно выпускали из сетей и помещали в хлопчатобумажные мешки на 2–15 минут, чтобы дать им остыть перед исследованием. При содержании в мешках летучие мыши образовывали фекальные гранулы, которые переносили в 500 мкл раствора RNAlater (Qiagen, Hilden, Germany) для обработки образцов. Лицензии на отлов летучих мышей с использованием туманных сетей, ручных сетей или ловушек для арф были получены от соответствующих стран и органов: Министерство окружающей среды и водных ресурсов Болгарии, разрешение № 192 / 26.03.200913, Министерство окружающей среды Италии, разрешение № 192 / 26.03. 200952, Агентство по охране окружающей среды Словении, Разрешение № 35701-80/200453, Служба сохранения биоразнообразия Консультативной службы сельских районов Ксунта-де-Галисия, Испания, Разрешение № 52/2010 ns 13697.

Анализ проб методом ПЦР с обратной транскриптазой

Образцы подвергали скринингу на наличие коронарной РНК с использованием обратной транскриптазы-интерферирующей ПЦР (ОТ-ПЦР) для амплификации фрагментов длиной 455 п.н. РНК-зависимая РНК-полимераза (RdRp) ген. Вкратце, ОТ-ПЦР проводили с использованием набора для одностадийной ОТ-ПЦР QIAGEN (Hilden, Германия) с 5 мкл РНК, 200 нМ праймера PC2S2 (эквимолярная смесь TTATGGTTGGGATTATC и TGATGGATGGGACTATC), 900 нМ смеси PC2As1 (эквимолярная) из TCATCACTCAGAATCATCA, TCATCAGAAAGAATCATCA, TCGTCGGACAAGATCATCA) и 1 мкл смеси ферментов QIAGEN для одноэтапной ОТ-ПЦР. Протокол амплификации состоял из 30 мин при 50 °C; 15 минут при 95°С; 10 циклов по 20 с при 94 °С, 30 с, начиная с 62 °С с понижением на 1 °С за цикл, 40 с при 72 °С; 30 циклов по 20 секунд при 95°C, 30 секунд при 52°C и 40 секунд при 72°C35. Для дальнейшего генетического анализа эти ампликоны были расширены до> 800 п.н. ниже 5′-конца с использованием последовательности 5′-праймеров: 5′-CTTCTCTTTCTTGCTCAGGATGCAATGCTGC-3′; SP3195, 5′-ATACTTGATTGTTACGATGGTGGCTG-3′; SP3374, 5′-CTATAACTCAAATGAATCTTAAGTATGC-3′; GrISP1, 5′-TTCTTTGCACAGAAGGGTGATGC-3′; и GrISP2, 5′-CTTTGCACAAAAAGGTGATGCWGC-317. одна летучая мышь сержант Ген гликопротеина с повышенным содержанием (названный BB99-04; GenBank Acc No. KR559017) был полностью охарактеризован с использованием вложенных наборов праймеров для ОТ-ПЦР (дополнительные данные 2).

Геномные области S1/S2 (346 п.н.; позиции 23 422–23 767 в SARS-CoV-2 Wuhan GenBank Acc. No. MT019529) от восьми летучих мышей. сержант (GenBank Acc No. KC633198, KC633201, KC633203-205, KC633209, KC633212 and KC633217) were tagged with a half-overlapping RT-PCR assay using the following oligonucleotides: panSARS-S1S2-F1 (TDGCTGTWTWGATRGATGATTTAGATGATGATGATGATKSARS-S1S2-F1 (TDGCTGTWTGAYTRTGATGATTTAGATGATGATGATKSCARC ). Расширенная область S2 (691 п.н.; положения 23 422–24 112 в штамме Wuhan SARS-CoV-2) была амплифицирована для филогенетического анализа с использованием тех же прямых праймеров, но с обратным праймером panSARS-S1S2-R2 (AGDCCATTRAACTTYTGHGCACA). Вкратце, РНК подвергали обратной транскрипции в течение 30 минут при 50°C с использованием набора SSIII One-Step Kit (Thermo Fisher), после чего проводили 45 циклов ПЦР при 94°C в течение 15 с, 58°C в течение 20 или 45 с соответственно и 72°C. С. С в течение 1 минуты. Второй раунд ПЦР проводили в тех же условиях, что и первый раунд, без обратной транскрипции. Ампликон Сэнгера ПЦР секвенировали.

Для обнаружения однонуклеотидных вариантов в сайте S1/S2 секвенировали ПЦР-ампликоны геномной области S1/S2 (фрагменты 346 п.н.) с использованием системы MiSeq с набором реагентов MiSeq v2 (500 циклов) в соответствии с инструкциями производителя. Считывания последовательности, полученные из библиотеки, были сопоставлены с соответствующей последовательностью гена S1/S2 в Geneious 9.1.8. Пользовательский скрипт с использованием модуля Python pysam (https://github.com/pysam-developers/pysam) использовался для определения распределения нуклеотидов по конкретным локусам генома из выравнивания чтения.

Генетическая аналитика

tblastx ищет полную последовательность спайков болгарского сержант (GenBank Acc No. GU190215) в рамках класса ID 11118)Коронавирусы), за исключением классификации с идентификатором 2697049 (SARS-CoV-2), выполненной 28 декабря 2021 г. Результаты с процентильной идентичностью менее 80 % не соответствовалисержант Поэтому последовательности не включены в набор данных. Последовательности SARS-CoV были исключены из экспериментальных инфекций или клонов, а также последовательности менее 27 000 нм или пробелы в кодирующей области шипа, в результате чего было получено 88 последовательностей. Была добавлена ​​одна эталонная последовательность для SARS-CoV (NC004718) и SARS-CoV-2 (MT019529), а также девять последовательностей от недавно созданных европейских летучих мышей в этом исследовании, в результате чего был получен окончательный набор данных из 99 последовательностей. Потому что короновирусы собираются часто36 Для филогенетического анализа использовали только область S2 (495 н.) 691-нуклеотидного фрагмента. Породы Extreme Evolution были созданы с помощью FastTree.37 Версия 2.1.10 с использованием модели замены GTR и 1000 вводных итераций. Значения локальной поддержки основаны на тесте Симодайра-Хасегавы (SH).38.

Анализ in silico

Вторичные структуры строятся с использованием веб-сервера UNAfold.39. Сайты расщепления фурином были предсказаны с использованием программного обеспечения ProP v.1.0b ProPeptide Cleavage Site Prediction.10. Последовательности были получены с веб-сайта таксономии NCBI для загрузки всех последовательностей видов. Довенаковирус (HCoV-229E), мерпиковирус (Коронавирус) , Цитраковирус (HCoV-NL63) и эмбиковирус (HCoV-HKU1 и HCoV-OC43). Дубликаты, неполные геномы и последовательности экспериментальных инфекций и клонов были исключены из всех наборов данных. На этом этапе анализа в наборе данных остались только эталонные последовательности NCBI для генома человека. Для Sarbecovirus используется набор данных для поиска tBlastx для файла сержант– Филогенез дополнительной фигуры 1. Выравнивание трансляции было выполнено в Geneious 9.1.8. Номера доступа для всех вирусов, протестированных в ProP, перечислены в дополнительных данных 3. Идентификация локализованной аминокислоты из 816 нуклеотидов. РдРп Фрагменты были рассчитаны с помощью MEGA1140 Использование опции двойного удаления.

Сбор данных секвенирования HCoV для изучения сохранения FCS в последовательностях человека

Наборы данных, использованные для предсказания ProP FCS, включали только одну референсную последовательность человека. Однако консервацию FCS в последовательностях, полученных от человека, исследовали следующим образом. Взрывной поиск частичных спайковых последовательностей, граничащих с сайтом S1/S2 (SARS-CoV, NC004718, позиции (POS) 23139-24191; HCoV-229E, NC002645, позиции 21,923–22,954; HCoV-NL63, NC005831, позиции 22,329 – выполнено 23 414; HCoV-OC43, NC006213, поз. нет База данных на 3 января 2022 г. Чтобы ограничить результаты только последовательностями, полученными от человека, бластный поиск был ограничен идентификаторами таксономии 111137 (HCoV-229E), 290028 (HCoV-HKU1), 1335626 (MERS-CoV), 277944 (HCoV-NL63). ) и 31631 (HCoV-OC43). В случае ОРВИ виды Вирус короны, связанный с тяжелым острым респираторным синдромом (Classification ID 694009) and non-human viruses were excluded according to their classification IDs (1283333, 2709072, 1283332, 442736, 349342, 349343, 347537, 347536, 349344, 1508227, 1415834, 1415851, 1415852, 1699360, 1699361, 285945, 698398, 1487703, 1503296, 1503299, 1503300, 1503301, 1503302, 1503303, 2042697, 2042698, 2697049). Поиск Blastp привел к 157, 60, 378, 102, 348, 94 совпадениям для HCoV-229E, HCoV-HKU1, MERS-CoV, HCoV-NL63, HCoV-OC43 и SARS-CoV соответственно. Полные записи были загружены и обработаны вручную в Geneious 9.1.8, за исключением экспериментальных инфекций, клонов и трансгенных последовательностей, а также последовательностей, частично покрывающих эталонную последовательность, что привело к окончательному набору данных, включающему 104, 58, 180, 55, 264 и 40 белков. последовательность HCoV-β: 229E, HCoV-HKU1, MERS-CoV, HCoV-NL63, HCoV-OC43 и SARS-CoV соответственно. Последовательности белков выравнивали с помощью Geneious 9.1.8. я не41 Использование автоматического алгоритма и регистрационной матрицы BLOSUM62. Сохранение FCS проверял вручную.

Из-за большого количества доступных последовательностей для SARS-CoV-2 мы загрузили метаданные для всех доступных последовательностей в GISAID 11 января 2022 г. в 10:55 по центральноевропейскому времени. Метаданные использовались для последовательностей, отвечающих критериям полного и высокого охвата GISAID, в результате чего был получен окончательный набор данных, включающий метаданные из 4 824 313 записей последовательностей. Специальный скрипт Python использовался для извлечения идентификаторов образцов GISAID для последовательностей с полными или частичными делециями в модели FCS SARS-CoV-2 (аминокислотные локусы/мотивы). 682РРАР685) или последовательности, содержащие по крайней мере одну аминокислотную замену в положении R682 или R685, все из которых, вероятно, приводят к нефункциональной FCS. Этим критериям соответствовали 304 последовательности SARS-CoV-2, все из которых произошли от человека. Последовательности были загружены из базы данных GISAID и сопоставлены с эталонным штаммом Wuhan MT019529 в Geneious 9.1.8 с использованием я не.

Сводка отчета

Более подробная информация о дизайне исследования доступна в кратком отчете об исследовании природы, связанном с этой статьей.

Leave a Comment