Gener för covid-19-resiliens: identifiering av DNA-markörer som motsvarar coronavirusresistens och -sårbarhet
Koronaviruser (CoVs) (ordning Nidovirales, familj Coronaviridae, underfamilj Coronavirinae) är ansvariga för utbrott av respiratoriska sjukdomar hos många ryggradsdjursarter. De är en stor familj av enkelsträngade RNA-inkapslade virus (+ssRNA) som kan isoleras i olika djurarter. Deras genomstorlekar varierar mellan 26 till 32 kilobaser (kb) i längd, vilket gör dem till de största genomerna för RNA-virus (vilket i sin tur ökar effektiviteten av ansiktsmasker). COVID-19, även känd som svår akut respiratorisk syndrom coronavirus 2 (SARS-CoV-2), eller "nytt coronavirus 2019", är ett nytt virus och vi börjar just förstå resistens och mottaglighet hos människor.
COVID-19 liknar svår akut respiratorisk syndrom (SARS) på så sätt att båda virusen infekterar sina mänskliga värdar via samma receptor, angiotensin-konverterande enzym 2 (ACE2-receptorn), och orsakar liknande kliniska och patologiska egenskaper. Intressant nog är spike-proteinet, som är ansvarigt för receptorbindning, mycket likt mellan 2019-nCoV och SARS-CoV, vilket är ett resultat av betydande selektion för samma receptor (Wu., 2020). Forskning om hur våra kroppar försvarar sig mot SARS kan avslöja hur våra kroppar skulle kunna försvara sig mot covid-19.
Flera nyligen genomförda Genome Wide Association Studies (GWAS) har gett en mycket djupare insikt i de genetiska variationerna som kan hjälpa till att förklara varför vissa individer är praktiskt taget opåverkade av COVID-19, medan viruset för andra är livshotande eller till och med dödligt.
I det här inlägget ger vi en översikt av den granskade litteraturen och presenterar information om kandidatgener för motståndskraft mot SARS-CoV. Om du har genomfört ett DNA-test hemma, som de som erbjuds av 23andMe, Ancestry DNA eller Dante Labs, kan du utvärdera dina råa DNA-data och se hur din DNA-sekvens jämförs med forskningsresultaten.
Hur analyserar man sitt DNA för motståndskraft eller mottaglighet mot coronaviruset?
Steg 1) Ladda ner din råa autosomala DNA-fil och spara den på en säker plats
För att analysera dina DNA-data, börja med att ladda ner din råa autosomala DNA och spara den på en säker plats. Här är instruktioner för att ladda ner din råa DNA-fil från: 23andMe, Ancestry DNA, Family Tree DNA, Dante Labs, My Heritage, Genes For Good, Vitagene, and Living DNA.
Steg 2) Analysera din råa DNA-fil.
Sök din råa DNA-data med en textredigerare som "TextWrangler" eller "Anteckningar" med hjälp av funktionen "sök" eller via kommandoraden.
Öppna din råa DNA-fil och du kommer att märka rubrikerna för unika SNP ID (rs# eller i#), kromosom, position och genotyp. Formaten skiljer sig något mellan de olika direkt-till-konsument DNA-testföretagen.
För att utvärdera din risk för dålig återhämtning från COVID-19, titta efter dessa DNA-markörer som beskrivs nedan:
Flera Genome Wide Association Studies (GWAS) publicerades nyligen som beskriver loci kopplade till respiratorisk svikt hos patienter infekterade med SARS-CoV-2, och tre studier identifierade SNP-markörer i samma ~50 kb genomiska segment som är ärvt från Neandertalar. (Ellinghaus D et al., 2020, Zeberg & Pääbo, and Blokland et al., 2020). Dessutom identifierade dessa GWAS-studier ett antal andra DNA-markörer som är kopplade till COVID-19, och var och en av dessa presenteras i tabellen nedan.
Utöver detta omfattar andra DNA-markörer som tas upp i detta inlägg rs4804803 som har kopplats till SARS, samt de som är placerade i angiotensin-konverterande enzym-2 (ACE2) receptorn, vilket har visat sig vara samma receptor för det mänskliga respiratoriska coronaviruset NL63, SARS-coronaviruset (SARS-CoV) och det nya coronaviruset 2019-nCoV/SARS-CoV (Li et al., 2017; Lu et al., 2019). Eftersom spike-proteinet hos coronaviruset har utvecklats för att matcha ACE2-receptorn, är det troligt att individer med variationer som förändrar proteinsekvensen skulle resultera i en viss grad av motståndskraft mot covid-19. Nedan finns icke-synonyma SNP:er från ACE2-transkriptet NM_021804.2, och av särskilt intresse är SNP:er som orsakar stora förändringar som rs199951323 som resulterar i en för tidig stoppkodon.
| 'Gen' | dbsnp | Kromosom (GRCh37) | POS | REF | ALT | 'Risk Alleler' | 'Markeringseffekt' | 'Referens' |
|---|---|---|---|---|---|---|---|---|
| IVNS1ABP | rs6668622 | 1 | 185414582 | T | C | Känslig variant T:T och T:C hos män.s | 'oddsförhållande 1,44' | Roberts., 2020; |
| SRRM1 | rs111972040 | 1 | 24999361 | A | G | 'risk genotyper G:G och A:G, 3_prime_UTR_variant' | Odds för sjukhusvistelse = 8,29 | |
| LZTFL1 | rs35044562 | 3 | 45909024 | A | G | risk genotyper G:G och A:G, intronvariant, genisk uppströms transkriptvariant | odds ratio 1.60 | Blokland et al., 2020; Zeberg & Pääbo |
| LZTFL1 | rs11385942 | 3 | 45876460 | A | - or A or AAA | InDel, A:A and A:- 'har högre känslighet för andningssvikt, intronvariant' | odds ratio 1.77 | Ellinghaus et al., 2020; Roberts., 2020 |
| LZTFL1 | rs10490770 *LD with rs11385942 | 3 | 45864732 | T | C | 'riskgenotyper T:C och C:C, intronvariant' | Odds för heterozygota bärare 1,7. | Zeberg and Pääbo., 2020; |
| LZTFL1 | rs67959919 *LD with rs11385942 | 3 | 45871908 | G | A | 'riskgenotyper G:A och A:A, intronvariant' | Odds för heterozygota bärare 1,7. | |
| LZTFL1 | rs35624553 *LD with rs11385942 | 3 | 45867440 | A | G | 'riskgenotyper G:A och G:G, intronvariant' | Odds för heterozygota bärare 1,7. | |
| LZTFL1 | rs71325088 *LD with rs11385942 | 3 | 45862952 | T | C | risk genotyper C:T och C:C, intronvariant | Odds för heterozygota bärare 1,7. | |
| ABO | rs657152 | 9 | 136139265 | A | C or T | En riskallel, intronvariant. | odds ratio 1.77 | Ellinghaus et al., 2020; Roberts., 2020 |
| Intergenic | rs5798227 | 12 | 53120100 | C | - | Riskallelen är borttagningen. | p = 2.2x10-7 | Blokland et al., 2020; |
| IGHV3-7 | rs11844522 | 14 | 106522576 | C | T | Känsliga variationer T:T, C:T. | p=1.9x10-7 | |
| Immunoglobulin Lambda Locus (IGL) | rs73166864 | 22 | 23340580 | T | C or G | Känsliga variationer T:T och T:C. | odds ratio 1.7 | Roberts., 2020; |
| TLR7 | rs200553089 | ChrX | 12906010 | G | T | riskgenotyper T:G och T:T, missense_variant | Made et al., 2020; | |
| 'Synonymer SNPs placerade i ACE2' | ||||||||
| ACE2 | rs373153165 | chrX | 15580093 | C | T or A | missense_variant" "Missensevariant | p.Asp785Asn/c.2353G>A | Cao et al., 2020 |
| ACE2 | rs140016715 | chrX | 15582154 | G | A | missense_variant" "Missensevariant | p.Arg768Trp/c.2302C>T | |
| ACE2 | rs147311723 | chrX | 15582265 | G | A | missense_variant" "Missensevariant | p.Leu731Phe/c.2191C>T | |
| ACE2 | rs41303171 | chrX | 15582298 | T | C | missense_variant" "Missensevariant | p.Asn720Asp/c.2158A>G | |
| ACE2 | rs370187012 | chrX | 15582327 | C | T | missense_variant" "Missensevariant | p.Arg710His/c.2129G>A | |
| ACE2 | rs776995986 | chrX | 15582334 | G | A | missense_variant" "Missensevariant | p.Arg708Trp/c.2122C>T | |
| ACE2 | rs149039346 | chrX | 15584416 | A | G | missense_variant" "Missensevariant | p.Ser692Pro/c.2074T>C | |
| ACE2 | rs200180615 | chrX | 15584488 | C | T | missense_variant" "Missensevariant | p.Glu668Lys/c.2002G>A | |
| ACE2 | * |
chrX | 15585879 | A | C | stop_gained | p.Leu656*/c.1967T>G | |
| ACE2 | rs183135788 | chrX | 15585933 | T | C | missense_variant" "Missensevariant | p.Asn638Ser/c.1913A>G | |
| ACE2 | rs748163894 | chrX | 15588434 | G | A | missense_variant" "Missensevariant | ||
| ACE2 | rs202137736 | chrX | 15591485 | T | C | splice_region_variant+intron_variant" = "splice_region_variant+intronvariant | c.1541+5A>G | |
| ACE2 | rs140473595 | chrX | 15591530 | C | T | missense_variant" "Missensevariant | p.Ala501Thr/c.1501G>A | |
| ACE2 | rs191860450 | chrX | 15593829 | T | C | missense_variant" "Missensevariant | p.Ile468Val/c.1402A>G | |
| ACE2 | rs758142853 | chrX | 15609868 | A | G | missense_variant" "Missensevariant | p.Val184Ala/c.551T>C | |
| ACE2 | rs754511501 | chrX | 15609902 | C | T | missense_variant" "Missensevariant | p.Gly173Ser/c.517G>A | |
| ACE2 | rs746034076 | chrX | 15609943 | T | C | missense_variant" "Missensevariant | p.Asn159Ser/c.476A>G | |
| ACE2 | rs373252182 | chrX | 15609973 | T | C | missense_variant" "Missensevariant | p.Asn149Ser/c.446A>G | |
| ACE2 | rs2285666 | chrX | 15610348 | C | T | splice_region_variant+intron_variant" = "splice_region_variant+intronvariant | c.439+4G>A | |
| ACE2 | rs768736934 | chrX | 15612963 | C | T | splice_region_variant+intron_variant" = "splice_region_variant+intronvariant | c.345+5G>A | |
| ACE2 | rs4646116 | chrX | 15618958 | T | C | missense_variant" "Missensevariant | p.Lys26Arg/c.77A>G | |
| ACE2 | rs73635825 | chrX | 15618980 | A | G | missense_variant" "Missensevariant | p.Ser19Pro/c.55T>C | |
| SNP som är associerade med SARS | ||||||||
| CD209 | rs4804803 | 19 | 7812733 | A | G | Känslig genotyp A:A, uppströms_transkript_variant. | NC_000019.10:7747846 | Sakuntabhai et al., 2005; Chan et al., 2010 |