Institutul Național de Cercetare Dezvoltare Medico-Militară „Cantacuzino”

Secvențierea genomului virusului SARS-CoV-2 în România
 
Biolog specialist dr. Mihaela Lazăr, șef Laborator Infecții Respiratorii Virale 
din Institutul Național de Cercetare-Dezvoltare Medico-Militară „Cantacuzino
 
     Coronavirusurile cuprind numeroase virusuri care pot determina infecții atât la animale cât și la oameni. La om, coronavirusurile provoacă infecții respiratorii, forme ușoare sau severe precum Sindromul Respirator din Orientul Mijlociu (MERS), sau Sindromul Respirator Acut Sever (SARS). Cel mai recent coronavirus a fost identificat pentru prima dată în China (orașul Wuhan, provincia Hubei) în decembrie 2019 și provoacă boala coronavirus COVID-19.
    Infecția COVID-19 în România a fost raportată în data de 26 februarie 2020 prin confirmarea primului pacient cu SARS-CoV-2 prin rRT-PCR (reverse transcriptasepolymerase chain reaction), în următoarele 18 săptămâni înregistrându-se 15.501 cazuri confirmate și 966 decese [1].
    Virionii corona au  formă sferică şi cel mai mare genom dintre toate virusurile cu genom ARN (120-160nm în diametru), unitar, nu segmentat așa cum este al virusurilor gripale. Virionul corona este format din nucleocapsida cu simetrie helicală alcătuită din ARN și proteina N, acoperită de un înveliș (peplos) în care sunt inclavate glicoproteinele virale. Genomul conține două cadre de citire la capătul 5’ (open reading frames, ORF), ORF1a și ORF1b, care codifică 16 proteine non-structurale (exp. ARN polimeraza ARN-dependentă, RdRp). La capătul 3’ al genomului se află genele care codifică cele 4 proteine structurale majore: glicoproteina S (proteina structurală a spiculilor care conferă virionilor aspectul caracteristic de coroană și permite virusului să pătrundă în celulele gazdă prin utilizarea enzimei 2 de conversie a angiotensinei, ACE2, ca receptor de intrare), proteina E (de înveliș), M de membrană (componentă minoră a peplosului) și proteina N a nucleocapsidei [2-5]. Coronavirusurile pot prezenta variabilitate genetică datorită mutațiilor apărute în genomul viral. Mutațiile genetice reprezintă erori de transcriere ale ARN-polimerazei care dispune de mecanisme de corectare (proof-reading) ineficiente (exp. încorporarea greșită a unei baze care poate duce la schimbarea mesajului unui codon), ceea ce permite reasortarea materialului genetic. Mutaţia poate genera noi variante antigenice și o variaţie limitată a potenţialului patogenic. Recombinarea, un eveniment mult mai rar, produce un virus nou, cu o nouă combinaţie de gene şi cu proprietăţi antigenice noi. Emergenţa unei tulpini virale noi este condiţionată de capacitatea sa de multiplicare şi de diseminare la organismele sensibile, iar apariția de epidemii sau pandemii depinde de capacitatea de diseminare a virusului (contagiozitate) [6, 7].
    În fazele incipiente ale epidemiei din România, sursa de infecție a fiecărui caz a fost identificată prin anchete epidemiologice amănunțite, urmate de detecția și izolarea/ carantinarea contacților. Odată cu răspândirea virusului în populația generală, această strategie nu mai poate furniza date exacte. Pe măsură ce virusul se răspândește, apar multiple oportunități de selecție naturală a unor mutații care pot avea impact major asupra transmisibilității virusului.
    Secvențierea genomică oferă o alternativă de monitorizare în timp real a dinamicii transmiterii virale, prin identificarea unor secvențe care agregă împreună în clustere și corelarea lor cu datele clinice și epidemiologice.
    Primele informații asupra întregului genom al virusului SARS-CoV-2 identificat în România, au fost obținute în Laboratorul Infecții Respiratorii Virale, Centrul Național de Gripă din Institutul Național de Cercetare-Dezvoltare Medico-Militară ”Cantacuzino”, prin utilizarea tehnologiei secvențierii de nouă generație (NGS) cu ajutorul sistemului de secvențiere Illumina MiSeq și a softului DNASTAR Lasergene.
    Analiza filogenetică a primelor trei genomuri secvențiate (întregul genom, acoperire 100%) au evidențiat identitate 99.95% cu tulpina de referință Severe acute respiratory syndrome coronavirus 2 isolate Wuhan-Hu-1, complete genome (NCBI Reference Sequence: NC_045512.2) și identitate 99,97% - 99,96% cu tulpini identificate în Austria, Danemarca, Franța, Germania, Grecia, India, Italia, Marea Britanie, Spania sau SUA (Figura1).
 
 
 
Figura 1. Analiza filogenetică a secvențelor de genom complet SARS-CoV-2 din România (n=3) prin comparare cu tulpina de referință (marcată cu roșu) și secvențe disponibile din diverse țări (n = 18, GenBank și GISAID), MegaX (Maximum Likelihood Tree)
     Prin compararea cu tulpina de referință (NCBI, NC_045512.2) au fost identificate mai multe mutații punctiforme SNVs (single-nucleotide variants) comune pentru două dintre cele trei secvențe analizate, dar și substituții unice, toate aceste mutații fiind specifice tulpinilor identificate în România (Figura2).
 
  Referința ID   Pozitia Gena Proba
EPI_ISL_445220
Proba
EPI_ISL_445243
Proba
EPI_ISL_447054
   Substituții      aminoacizi
NC_045512.2 241   C>T C>T C>T  
NC_045512.2 2659 ORF1ab G G>T G>T K798N
NC_045512.2 3037 ORF1ab C>T C>T C>T  
NC_045512.2 6349 ORF1ab G>A G G  
NC_045512.2 8290 ORF1ab C C>T C>T  
NC_045512.2 9565 ORF1ab C C>T C>T  
NC_045512.2 11674 ORF1ab C>T C C  
NC_045512.2 14408 ORF1ab C>T C>T C>T P4715L
NC_045512.2 15864 ORF1ab A>G A A  
NC_045512.2 18877 ORF1ab C C>T C>T  
NC_045512.2 19145 ORF1ab C>T C C  
NC_045512.2 19839 ORF1ab T>C T T  
NC_045512.2 23124 S C C>G C>G P521R
NC_045512.2 23403 S A>G A>G A>G D614G
NC_045512.2 25440 ORF3a G G>T G>T K16N
NC_045512.2 25469 ORF3a C C>T C>T S26L
NC_045512.2 25563 ORF3a G G>T G>T Q57H
NC_045512.2 27741 ORF7a C C>T C>T  
NC_045512.2 28289 N C C>T C>T P6S
NC_045512.2 28881 N GGG>AAC G G R203_G204delinsKR
 
Figura 2. Evidențierea SNVs prin comparare cu tulpina de referință Severe acute respiratory syndrome coronavirus 2 isolate Wuhan-Hu-1 (NC_045512.2)
 
   Identificarea variantelor virale trebuie atent interpretată și monitorizată pentru întelegerea adaptării, evoluției și transmiterii virusului SARS-CoV-2 în populația umană, precum și pentru evaluarea metodelor de diagnostic.
    Deoarece acest virus este una dintre cele mai mari amenințări cu care oamenii s-au confruntat în ultima vreme, la nivel mondial se depun eforturi considerabile pentru secvențierea tulpinilor de SARS-Cov-2 pentru identificarea originii virusului, a surselor de proveniență ale epidemiilor din diferite regiuni și a dinamicii transmiterii intracomunitare. Înțelegerea modului de răspândire este crucială pentru lupta care trebuie dusă împotriva acestui virus. Pentru identificarea unui profil viral specific României, studiul va fi completat cu analize ulterioare și va cuprinde secvențele virusului izolat din diferite regiuni geografice, de la pacienți asimptomatici, cu simptome ușoare și severe. Identificarea variantelor genomice și analiza filogenetică a tulpinilor SARS-CoV-2 din România va permite monitorizarea patogenicității tulpinilor circulante în relație cu exprimarea fenotipică a infecției la pacienții cu COVID-19 precum și a potențialului de adaptare a virusului SARS-CoV-2 la organismele umane. Secvențierea genetică poate ajuta la înțelegerea COVID-19 în vederea alcătuirii unui ghid al tratamentelor în viitor și posibil, pentru evaluarea impactului intervențiilor medicale cu rol în îmbunătățirea stării de sănătate.
    Secvențele genomice complete sunt disponibile în bazele de date internaționale (GenBank, GISAID), iar evoluția pandemiei poate fi monitorizată în timp real pe site-ul https://nextstrain.org/ncov/global care permite analiza filogenetică și analiza ratei de variabilitate virală.
 
 Parteneri
 Mulțumim partenerilor de la Rompetrol și Asociația de Chirurgie a Umărului și Cotului din România pentru achiziționarea reactivilor necesari optimizării metodei de secvențiere în Laboratorul Infecții Respiratorii Virale din Institutul național de Cercetare Dezvoltare Medico-Militară „Cantacuzino”.
Suportul tehnic a fost asigurat de Ustea Luiza (Laboratorul Infecții Respiratorii Virale), Adrian Crețu (ELTA 90 Medical Reserch) și Tim Durfee (DNASTAR Lasergene).
 
Bibliografie:
 
1.     Institutul Național de Sănătate Publică, Centrul Național de Supraveghere și Control a Bolilor Transmisibile
        https://www.cnscbt.ro/index.php/analiza-cazuri-confirmate-covid19/1721-raport-saptamanal-episaptamana18
2.     Kathryn V. Holmes – Coronaviridae and Their Replication, în Virology, Second Ed., ed. B. N. Fields, D. M. Knipe et al., Raven Press, Ltd, New York, 1990.
3.     Susan R. Weiss and Sonia Navas-Martin – Coronavirus Pathogenesis and the Emerging Pathogen severe Acute Respiratory Coronavirus – MMBR, 2005, 69, 4, p. 635-664.
4.     Walls AC, Park YJ, Tortorici MA, Wall A, McGuire AT, Veesler D. Structure, Function, and Antigenicity of the SARS-CoV-2 Spike Glycoprotein. Cell. 2020 Apr 16;181(2):281-292.e6.
5.     Zhang J, Zeng H, Gu J, Li H, Zheng L, Zou Q. Progress and Prospects on Vaccine Development against SARS-CoV-2. Vaccines (Basel). 2020 Mar 29;8(2).
6.     Mihăescu G, COVID-19: contagiozitate, mutații și memorie imunitară 
        https://unibuc.ro/covid-19-contagiozitate-mutatii-si-memorie-imunitara/
7.     Ruță S. Coronavirusul 2019-nCoV 
        https://www.virology.ro/download/files/RO%20-%20Home/Coronavirusul%202019.pdf