Systematic analysis of protein identity between Zika virus and other arthropod-borne viruses

Bull World Health Organ. 2017 Jul 1;95(7):517-525I. doi: 10.2471/BLT.16.182105. Epub 2016 Jul 18.

Abstract

Objective: To analyse the proportions of protein identity between Zika virus and dengue, Japanese encephalitis, yellow fever, West Nile and chikungunya viruses as well as polymorphism between different Zika virus strains.

Methods: We used published protein sequences for the Zika virus and obtained protein sequences for the other viruses from the National Center for Biotechnology Information (NCBI) protein database or the NCBI virus variation resource. We used BLASTP to find regions of identity between viruses. We quantified the identity between the Zika virus and each of the other viruses, as well as within-Zika virus polymorphism for all amino acid k-mers across the proteome, with k ranging from 6 to 100. We assessed accessibility of protein fragments by calculating the solvent accessible surface area for the envelope and nonstructural-1 (NS1) proteins.

Findings: In total, we identified 294 Zika virus protein fragments with both low proportion of identity with other viruses and low levels of polymorphisms among Zika virus strains. The list includes protein fragments from all Zika virus proteins, except NS3. NS4A has the highest number (190 k-mers) of protein fragments on the list.

Conclusion: We provide a candidate list of protein fragments that could be used when developing a sensitive and specific serological test to detect previous Zika virus infections.

Objectif: Analyser les pourcentages de similarité protéique entre le virus Zika et les virus de la dengue, de l'encéphalite japonaise, de la fièvre jaune, du Nil occidental et du chikungunya, ainsi que le polymorphisme entre différentes souches du virus Zika.

Méthodes: Nous avons utilisé les séquences protéiques publiées du virus Zika et avons obtenu les séquences protéiques des autres virus dans la banque protéique du National Center for Biotechnology Information (NCBI) ou dans la base de données Virus Variation du NCBI. Nous avons utilisé BLASTP pour identifier les régions de similarité entre les virus. Nous avons quantifié la similarité entre le virus Zika et chacun des autres virus ainsi que le polymorphisme du virus Zika pour tous les k-mers d'acides aminés, dans tout le protéome, avec k allant de 6 à 100. Nous avons étudié l'accessibilité des fragments protéiques en calculant la surface accessible au solvant pour les protéines d'enveloppe et non structurale-1 (NS1).

Résultats: Au total, nous avons identifié 294 fragments protéiques du virus Zika qui présentent à la fois un faible degré de similarité avec les autres virus et un faible degré de polymorphisme entre les souches du virus Zika. Notre liste comprend des fragments protéiques issus de toutes les protéines du virus Zika, à l'exception de la protéine NS3. Le plus grand nombre de fragments protéiques de notre liste (190 k-mers) correspond à la protéine NS4A.

Conclusion: Nous proposons une liste de fragments protéiques candidats, qui pourraient être utilisés pour concevoir un test sérologique sensible et spécifique pour dépister les infections antérieures par le virus Zika.

Objective: Analizar las proporciones de identidad proteica entre el virus de Zika y los virus del dengue, la encefalitis japonesa, la fiebre amarilla, el Nilo Occidental y el chikungunya, así como el polimorfismo entre las distintas cepas del virus de Zika.

Métodos: Se utilizaron secuencias de proteínas publicadas para el virus de Zika y secuencias de proteínas obtenidas para los otros virus de la base de datos de proteínas del Centro Nacional para la Información Biotecnológica (NCBI) o la fuente de información sobre la variación de virus del NCBI. Se utilizó el programa BLASTP para encontrar regiones de identidad entre los virus. Se cuantificó la identidad entre el virus de Zika y cada uno de los otros virus, así como el polimorfismo del virus de Zika para todos los k-mers de aminoácidos a través del proteoma, con una variación de k de 6 a 100. Se evaluó la accesibilidad de los fragmentos proteicos calculando la superficie accesible solvente para las proteínas de envoltura y no estructurales 1 (NS1).

Resultados: En total, se identificaron 294 fragmentos proteicos del virus de Zika con una proporción escasa de identidad con otros virus y con niveles bajos de polimorfismos entre las distintas cepas del virus de Zika. En la lista se incluyen fragmentos proteicos de todas las proteínas del virus de Zika, salvo la NS3. La NS4A cuenta con el mayor número (190 k-mers) de fragmentos proteicos de la lista.

Conclusión: Se proporcionó una lista de posibles fragmentos proteicos que podrían utilizarse para desarrollar una prueba serológica sensible y específica para detectar infecciones del virus de Zika anteriores.

الغرض: تحليل مقدار تماثل البروتين بين فيروس زيكا وحمى الضنك، والتهاب الدماغ الياباني، وحمى الصفراء، وفيروس غرب النيل، وشيكونغونيا فضلاً عن تعددية الأشكال بين سلالات فيروس زيكا.

الطريقة: استخدمنا تسلسلات البروتين المنشورة لفيروس زيكا وحصلنا على تسلسلات البروتين لغيره من الفيروسات من قاعدة البيانات الخاصة بالبروتين للمركز الوطني لمعلومات التقانة الحيوية (NCBI) أو مورد اختلاف الفيروسات لمركز NCBI. كما استخدمنا أداة BLASTP للعثور على مناطق التماثل بين الفيروسات. وقمنا بإجراء تحديد كمي لمقدار التماثل بين فيروس زيكا وكلٍ من الفيروسات الأخرى فضلاً عن تعددية الأشكال في فيروس زيكا نفسه لكل ميرات k للأحماض الأمينية السائدة عبر البروتيوم، حيث تتراوح k من 6 إلى 100. وقمنا بتقييم إمكانية الوصول إلى شظايا البروتين من خلال حساب المساحة السطحية التي يمكن للمذيبات الوصول من خلالها للبروتينات المغلفة والبروتين اللابنيوي-1 (NS1).

النتائج: إجمالاً، قمنا بتحديد 294 شظية من شظايا البروتين الخاص بفيروس زيكا مع انخفاض نسبة التماثل مع الفيروسات الأخرى وانخفاض مستويات تعدد الأشكال بين سلالات فيروس زيكا. وتتضمن القائمة شظايا البروتين من جميع بروتينات فيروس زيكا باستثناء بروتين NS3. ويتمتع بروتين NS4A بالرقم الأكبر (190 من ميرات k ) من شظايا البروتين الواردة في القائمة.

الاستنتاج: قمنا بإنشاء قائمة مرشحين لشظايا البروتين والتي يمكن استخدامها عند تطوير اختبار مصلي حساس ومحدد لاكتشاف الحالات السابقة للإصابة بفيروس زيكا.

目的: 旨在分析寨卡病毒、登革热、流行性乙型脑炎、黄热病、西尼罗河以及基孔肯雅热病毒之间的蛋白质识别率以及不同寨卡病毒株之间的多态性。.

方法: 我们使用已公布的寨卡病毒蛋白质序列,并从国家生物技术信息中心 (NCBI) 蛋白质数据库或国家生物技术信息中心 (NCBI) 病毒变异资源中获取了其他病毒的蛋白质序列。 我们使用 BLASTP 来找出病毒之间的识别区域。 我们量化了寨卡病毒和其他各种病毒之间的蛋白质识别以及寨卡病毒内部多态性,以识别蛋白质组中的所有氨基酸 k-mer,其中 k 的变化范围为 6 到 100。通过计算外膜蛋白和非结构蛋白 1 (NS1) 的溶剂可及表面,我们对蛋白质片段的可及性进行了评估。.

结果: 我们共识别出 294 个寨卡病毒蛋白质片段,相较于其他病毒,其识别率较低,且寨卡病毒株之间的多态性程度较低。 上述清单包括所有寨卡病毒蛋白质的蛋白质片段,非结构蛋白 3 (NS3) 除外。 清单中,非结构蛋白 4A (NS4A) 的蛋白质片段数目(190 个 k-mer)最高。.

结论: 我们提供了一份蛋白质片段补充目录,可在开发敏感的特殊血清学测试时使用,以检测之前的寨卡病毒感染情况。.

Цель: Проанализировать пропорции белковой идентичности между вирусом Зика и вирусами лихорадки денге, японского энцефалита, желтой лихорадки, лихорадки Западного Нила и лихорадки чикунгунья, а также полиморфизм между различными штаммами вируса Зика.

Методы: Мы использовали опубликованные последовательности белка для вируса Зика и получили последовательности белка для других вирусов из базы данных Национального центра биотехнологической информации (NCBI) или ресурса вирусных вариаций NCBI. Мы использовали программу BLASTP, чтобы найти области идентичности между вирусами. Мы провели количественную оценку идентичности между вирусом Зика и каждым из других вирусов, а также оценку полиморфизма между различными штаммами вируса Зика для всех k-меров аминокислот всего протеома, где k находится в пределах от 6 до 100. Мы оценили доступности фрагментов белка путем расчета доступной для растворителя области поверхности для белков оболочки и неструктурного белка-1 (NS1).

Результаты: В целом мы идентифицировали 294 фрагмента белка вируса Зика с низкой долей идентичности с другими вирусами и низкими уровнями полиморфизма среди штаммов вируса Зика. Этот список включает белковые фрагменты от всех белков вируса Зика, за исключением NS3. В этом списке NS4A имеет самое большое количество (190 k-меров) фрагментов белка.

Вывод: Мы подготовили список белковых фрагментов-кандидатов, которые можно использовать при разработке чувствительного и специфического серологического теста для выявления ранее обнаруженных инфекций, вызываемых вирусом Зика.

MeSH terms

  • Animals
  • Chikungunya virus / ultrastructure*
  • Databases, Protein*
  • Dengue Virus / ultrastructure
  • Encephalitis Virus, Japanese / ultrastructure
  • Flavivirus / ultrastructure*
  • Humans
  • Insect Vectors
  • Polymorphism, Genetic
  • West Nile virus / ultrastructure
  • Yellow fever virus / ultrastructure
  • Zika Virus / ultrastructure