Secvențierea genomului virusului SARS-CoV-2 în România
Biolog specialist dr. Mihaela Lazăr, șef Laborator Infecții Respiratorii Virale
din Institutul Național de Cercetare-Dezvoltare Medico-Militară „Cantacuzino”
Coronavirusurile cuprind numeroase virusuri care pot determina infecții atât la animale cât și la oameni. La om, coronavirusurile provoacă infecții respiratorii, forme ușoare sau severe precum Sindromul Respirator din Orientul Mijlociu (MERS), sau Sindromul Respirator Acut Sever (SARS). Cel mai recent coronavirus a fost identificat pentru prima dată în China (orașul Wuhan, provincia Hubei) în decembrie 2019 și provoacă boala coronavirus COVID-19.
Infecția COVID-19 în România a fost raportată în data de 26 februarie 2020 prin confirmarea primului pacient cu SARS-CoV-2 prin rRT-PCR (reverse transcriptase–polymerase chain reaction), în următoarele 18 săptămâni înregistrându-se 15.501 cazuri confirmate și 966 decese [1].
Virionii corona au formă sferică şi cel mai mare genom dintre toate virusurile cu genom ARN (120-160nm în diametru), unitar, nu segmentat așa cum este al virusurilor gripale. Virionul corona este format din nucleocapsida cu simetrie helicală alcătuită din ARN și proteina N, acoperită de un înveliș (peplos) în care sunt inclavate glicoproteinele virale. Genomul conține două cadre de citire la capătul 5’ (open reading frames, ORF), ORF1a și ORF1b, care codifică 16 proteine non-structurale (exp. ARN polimeraza ARN-dependentă, RdRp). La capătul 3’ al genomului se află genele care codifică cele 4 proteine structurale majore: glicoproteina S (proteina structurală a spiculilor care conferă virionilor aspectul caracteristic de coroană și permite virusului să pătrundă în celulele gazdă prin utilizarea enzimei 2 de conversie a angiotensinei, ACE2, ca receptor de intrare), proteina E (de înveliș), M de membrană (componentă minoră a peplosului) și proteina N a nucleocapsidei [2-5]. Coronavirusurile pot prezenta variabilitate genetică datorită mutațiilor apărute în genomul viral. Mutațiile genetice reprezintă erori de transcriere ale ARN-polimerazei care dispune de mecanisme de corectare (proof-reading) ineficiente (exp. încorporarea greșită a unei baze care poate duce la schimbarea mesajului unui codon), ceea ce permite reasortarea materialului genetic. Mutaţia poate genera noi variante antigenice și o variaţie limitată a potenţialului patogenic. Recombinarea, un eveniment mult mai rar, produce un virus nou, cu o nouă combinaţie de gene şi cu proprietăţi antigenice noi. Emergenţa unei tulpini virale noi este condiţionată de capacitatea sa de multiplicare şi de diseminare la organismele sensibile, iar apariția de epidemii sau pandemii depinde de capacitatea de diseminare a virusului (contagiozitate) [6, 7].
În fazele incipiente ale epidemiei din România, sursa de infecție a fiecărui caz a fost identificată prin anchete epidemiologice amănunțite, urmate de detecția și izolarea/ carantinarea contacților. Odată cu răspândirea virusului în populația generală, această strategie nu mai poate furniza date exacte. Pe măsură ce virusul se răspândește, apar multiple oportunități de selecție naturală a unor mutații care pot avea impact major asupra transmisibilității virusului.
Secvențierea genomică oferă o alternativă de monitorizare în timp real a dinamicii transmiterii virale, prin identificarea unor secvențe care agregă împreună în clustere și corelarea lor cu datele clinice și epidemiologice.
Primele informații asupra întregului genom al virusului SARS-CoV-2 identificat în România, au fost obținute în Laboratorul Infecții Respiratorii Virale, Centrul Național de Gripă din Institutul Național de Cercetare-Dezvoltare Medico-Militară ”Cantacuzino”, prin utilizarea tehnologiei secvențierii de nouă generație (NGS) cu ajutorul sistemului de secvențiere Illumina MiSeq și a softului DNASTAR Lasergene.
Analiza filogenetică a primelor trei genomuri secvențiate (întregul genom, acoperire 100%) au evidențiat identitate 99.95% cu tulpina de referință Severe acute respiratory syndrome coronavirus 2 isolate Wuhan-Hu-1, complete genome (NCBI Reference Sequence: NC_045512.2) și identitate 99,97% - 99,96% cu tulpini identificate în Austria, Danemarca, Franța, Germania, Grecia, India, Italia, Marea Britanie, Spania sau SUA (Figura1).

Figura 1. Analiza filogenetică a secvențelor de genom complet SARS-CoV-2 din România (n=3) prin comparare cu tulpina de referință (marcată cu roșu) și secvențe disponibile din diverse țări (n = 18, GenBank și GISAID), MegaX (Maximum Likelihood Tree)
Prin compararea cu tulpina de referință (NCBI, NC_045512.2) au fost identificate mai multe mutații punctiforme SNVs (single-nucleotide variants) comune pentru două dintre cele trei secvențe analizate, dar și substituții unice, toate aceste mutații fiind specifice tulpinilor identificate în România (Figura2).
Referința ID |
Pozitia |
Gena |
Proba
EPI_ISL_445220 |
Proba
EPI_ISL_445243 |
Proba
EPI_ISL_447054 |
Substituții aminoacizi |
NC_045512.2 |
241 |
|
C>T |
C>T |
C>T |
|
NC_045512.2 |
2659 |
ORF1ab |
G |
G>T |
G>T |
K798N |
NC_045512.2 |
3037 |
ORF1ab |
C>T |
C>T |
C>T |
|
NC_045512.2 |
6349 |
ORF1ab |
G>A |
G |
G |
|
NC_045512.2 |
8290 |
ORF1ab |
C |
C>T |
C>T |
|
NC_045512.2 |
9565 |
ORF1ab |
C |
C>T |
C>T |
|
NC_045512.2 |
11674 |
ORF1ab |
C>T |
C |
C |
|
NC_045512.2 |
14408 |
ORF1ab |
C>T |
C>T |
C>T |
P4715L |
NC_045512.2 |
15864 |
ORF1ab |
A>G |
A |
A |
|
NC_045512.2 |
18877 |
ORF1ab |
C |
C>T |
C>T |
|
NC_045512.2 |
19145 |
ORF1ab |
C>T |
C |
C |
|
NC_045512.2 |
19839 |
ORF1ab |
T>C |
T |
T |
|
NC_045512.2 |
23124 |
S |
C |
C>G |
C>G |
P521R |
NC_045512.2 |
23403 |
S |
A>G |
A>G |
A>G |
D614G |
NC_045512.2 |
25440 |
ORF3a |
G |
G>T |
G>T |
K16N |
NC_045512.2 |
25469 |
ORF3a |
C |
C>T |
C>T |
S26L |
NC_045512.2 |
25563 |
ORF3a |
G |
G>T |
G>T |
Q57H |
NC_045512.2 |
27741 |
ORF7a |
C |
C>T |
C>T |
|
NC_045512.2 |
28289 |
N |
C |
C>T |
C>T |
P6S |
NC_045512.2 |
28881 |
N |
GGG>AAC |
G |
G |
R203_G204delinsKR |
Figura 2. Evidențierea SNVs prin comparare cu tulpina de referință
Severe acute respiratory syndrome coronavirus 2 isolate Wuhan-Hu-1 (NC_045512.2)
Identificarea variantelor virale trebuie atent interpretată și monitorizată pentru întelegerea adaptării, evoluției și transmiterii virusului SARS-CoV-2 în populația umană, precum și pentru evaluarea metodelor de diagnostic.
Deoarece acest virus este una dintre cele mai mari amenințări cu care oamenii s-au confruntat în ultima vreme, la nivel mondial se depun eforturi considerabile pentru secvențierea tulpinilor de SARS-Cov-2 pentru identificarea originii virusului, a surselor de proveniență ale epidemiilor din diferite regiuni și a dinamicii transmiterii intracomunitare. Înțelegerea modului de răspândire este crucială pentru lupta care trebuie dusă împotriva acestui virus. Pentru identificarea unui profil viral specific României, studiul va fi completat cu analize ulterioare și va cuprinde secvențele virusului izolat din diferite regiuni geografice, de la pacienți asimptomatici, cu simptome ușoare și severe. Identificarea variantelor genomice și analiza filogenetică a tulpinilor SARS-CoV-2 din România va permite monitorizarea patogenicității tulpinilor circulante în relație cu exprimarea fenotipică a infecției la pacienții cu COVID-19 precum și a potențialului de adaptare a virusului SARS-CoV-2 la organismele umane. Secvențierea genetică poate ajuta la înțelegerea COVID-19 în vederea alcătuirii unui ghid al tratamentelor în viitor și posibil, pentru evaluarea impactului intervențiilor medicale cu rol în îmbunătățirea stării de sănătate.
Secvențele genomice complete sunt disponibile în bazele de date internaționale (GenBank, GISAID), iar evoluția pandemiei poate fi monitorizată în timp real pe site-ul https://nextstrain.org/ncov/global care permite analiza filogenetică și analiza ratei de variabilitate virală.
Parteneri
Mulțumim partenerilor de la Rompetrol și Asociația de Chirurgie a Umărului și Cotului din România pentru achiziționarea reactivilor necesari optimizării metodei de secvențiere în Laboratorul Infecții Respiratorii Virale din Institutul național de Cercetare Dezvoltare Medico-Militară „Cantacuzino”.
Suportul tehnic a fost asigurat de Ustea Luiza (Laboratorul Infecții Respiratorii Virale), Adrian Crețu (ELTA 90 Medical Reserch) și Tim Durfee (DNASTAR Lasergene).
Bibliografie:
1. Institutul Național de Sănătate Publică, Centrul Național de Supraveghere și Control a Bolilor Transmisibile
https://www.cnscbt.ro/index.php/analiza-cazuri-confirmate-covid19/1721-raport-saptamanal-episaptamana18
2. Kathryn V. Holmes – Coronaviridae and Their Replication, în Virology, Second Ed., ed. B. N. Fields, D. M. Knipe et al., Raven Press, Ltd, New York, 1990.
3. Susan R. Weiss and Sonia Navas-Martin – Coronavirus Pathogenesis and the Emerging Pathogen severe Acute Respiratory Coronavirus – MMBR, 2005, 69, 4, p. 635-664.
4. Walls AC, Park YJ, Tortorici MA, Wall A, McGuire AT, Veesler D. Structure, Function, and Antigenicity of the SARS-CoV-2 Spike Glycoprotein. Cell. 2020 Apr 16;181(2):281-292.e6.
5. Zhang J, Zeng H, Gu J, Li H, Zheng L, Zou Q. Progress and Prospects on Vaccine Development against SARS-CoV-2. Vaccines (Basel). 2020 Mar 29;8(2).
6. Mihăescu G, COVID-19: contagiozitate, mutații și memorie imunitară
https://unibuc.ro/covid-19-contagiozitate-mutatii-si-memorie-imunitara/
7. Ruță S. Coronavirusul 2019-nCoV
https://www.virology.ro/download/files/RO%20-%20Home/Coronavirusul%202019.pdf