針對 COVID-19 韌性的基因:識別與冠狀病毒抵抗力和易感性相關的 DNA 標記
冠狀病毒(CoVs)(目 Nidovirales,科 Coronaviridae,亞科 Coronavirinae)是許多脊椎動物物種呼吸道疾病疫情的元兇。它們是一大類單鏈RNA包膜病毒(+ssRNA),可以在不同的動物物種中被分離出來。它們的基因組大小介於26到32千鹼基對(kb)之間,是RNA病毒中基因組最大的(因此提高了口罩的有效性)。COVID-19,也被稱為嚴重急性呼吸綜合症冠狀病毒2型(SARS-CoV-2),或“2019新冠病毒”,是一種新病毒,我們才剛開始理解人類的抗性和易感性。
COVID-19 與嚴重急性呼吸綜合症 (SARS) 有相似之處,因為這兩種病毒都是通過相同的受體——血管緊張素轉換酶 2 (ACE2 受體) 來感染人類宿主,並引起類似的臨床和病理特徵。有趣的是,負責受體結合的刺突蛋白在 2019-nCoV 和 SARS-CoV 之間高度相似,這是因為對相同受體的顯著選擇所致 (Wu., 2020)。對我們的身體如何抵抗 SARS 的研究可能揭示我們的身體如何抵抗 COVID-19。
最近幾項全基因組關聯研究 (GWAS) 提供了更深入的見解,幫助解釋為什麼有些人幾乎不受 COVID-19 影響,而對其他人來說,這種病毒則是生命威脅甚至致命的。
在這篇文章中,我們提供了經過同行評審的文獻回顧,並介紹了與SARS-CoV抗性相關的候選基因資訊。如果您曾經進行過像23andMe、Ancestry DNA或Dante labs等公司的居家DNA測試,您可以評估您的原始DNA數據,並查看您的DNA序列與研究結果的比較。
如何分析您的DNA以抵抗或易感于冠状病毒?
步驟 1) 下載您的原始常染色體 DNA 檔案並將其保存到安全的位置
要分析您的 DNA 數據,首先下載您的原始常染色體 DNA,並將其保存到安全的位置。 以下是從下載您的原始 DNA 檔案的說明:
23andMe, Ancestry DNA, Family Tree DNA, Dante Labs, My Heritage, Genes For Good, Vitagene, and Living DNA.步骤 2) 分析您的原始 DNA 文件
使用文本編輯器(如 "text wrangler" 或 "notepad")透過 "查找" 功能或命令行搜索您的原始 DNA 數據。
打開您的原始 DNA 文件,您會注意到獨特的 SNP ID (rs# 或 i#)、染色體、位置和基因型的標題。不同的消費者 DNA 測試公司之間的格式略有不同。
要評估您從 COVID-19 中恢復不良的風險,請查看以下描述的 DNA 標記:
最近發表了幾項全基因組關聯研究(GWAS),描述了與 SARS-CoV-2 感染患者的呼吸衰竭相關的位點,並且有三項研究在同一 ~50 kb 的基因組區段中識別了 SNP 標記,該區段是從尼安德特人那裡繼承的。
(Ellinghaus D et al., 2020, Zeberg & Pääbo, and Blokland et al., 2020). 此外,這些GWAS研究還識別出了一些與COVID-19相關的DNA標記,這些標記在下表中列出。此外,本文提到的其他DNA標記包括rs4804803,該標記與SARS有關,還有位於血管緊張素轉換酶-2(ACE2)受體的標記,這被證明是人類呼吸道冠狀病毒NL63、SARS冠狀病毒(SARS-CoV)以及2019新型冠狀病毒2019-nCoV/SARS-CoV的相同受體(Li et al., 2017; Lu et al., 2019)。由於冠狀病毒的刺突蛋白已進化以匹配ACE2受體,因此擁有改變該蛋白質序列的變異的個體,可能會對COVID-19產生一定程度的抵抗力。以下是來自ACE2轉錄本NM_021804.2的非同義單核苷酸多態性(SNP),特別值得注意的是像rs199951323這樣會導致重大變化的SNP,該變異導致提前終止密碼子。
| 基因 | dbsnp | 染色体 (GRCh37) | POS | REF | ALT | 风险等位基因 | 标记效果 | 参考 |
|---|---|---|---|---|---|---|---|---|
| IVNS1ABP | rs6668622 | 1 | 185414582 | T | C | 男性易感变异 T:T 和 T:Cs | 优势比 1.44 | Roberts., 2020; |
| SRRM1 | rs111972040 | 1 | 24999361 | A | G | 风险基因型 G:G 和 A:G, 3_prime_UTR_variant | 住院优势比 = 8.29 | |
| LZTFL1 | rs35044562 | 3 | 45909024 | A | G | 风险基因型 G:G 和 A:G, intron_variant,genic_upstream_transcript_variant | odds ratio 1.60 | Blokland et al., 2020; Zeberg & Pääbo |
| LZTFL1 | rs11385942 | 3 | 45876460 | A | - or A or AAA | InDel, A:A and A:- 具有较高的呼吸衰竭易感性,intron_variant | odds ratio 1.77 | Ellinghaus et al., 2020; Roberts., 2020 |
| LZTFL1 | rs10490770 *LD with rs11385942 | 3 | 45864732 | T | C | 风险基因型T:C和C:C,内含子变异。 | 杂合子携带者的优势比 1.7 | Zeberg and Pääbo., 2020; |
| LZTFL1 | rs67959919 *LD with rs11385942 | 3 | 45871908 | G | A | 风险基因型 G:A 和 A:A, intron_variant | 杂合子携带者的优势比 1.7 | |
| LZTFL1 | rs35624553 *LD with rs11385942 | 3 | 45867440 | A | G | 风险基因型 G:A 和 G:G, intron_variant | 杂合子携带者的优势比 1.7 | |
| LZTFL1 | rs71325088 *LD with rs11385942 | 3 | 45862952 | T | C | 風險基因型 C:T 和 C:C,內含子變異 | 杂合子携带者的优势比 1.7 | |
| ABO | rs657152 | 9 | 136139265 | A | C or T | 风险等位基因,intron_variant | odds ratio 1.77 | Ellinghaus et al., 2020; Roberts., 2020 |
| Intergenic | rs5798227 | 12 | 53120100 | C | - | 风险等位基因是缺失 | p = 2.2x10-7 | Blokland et al., 2020; |
| IGHV3-7 | rs11844522 | 14 | 106522576 | C | T | 易感变异 T:T, C:T | p=1.9x10-7 | |
| Immunoglobulin Lambda Locus (IGL) | rs73166864 | 22 | 23340580 | T | C or G | 易感变异 T:T 和 T:C | odds ratio 1.7 | Roberts., 2020; |
| TLR7 | rs200553089 | ChrX | 12906010 | G | T | 风险基因型 T:G 和 T:T,错义变体 | Made et al., 2020; | |
| 位于 ACE2 中的同义 SNP | ||||||||
| ACE2 | rs373153165 | chrX | 15580093 | C | T or A | 错义变体 | p.Asp785Asn/c.2353G>A | Cao et al., 2020 |
| ACE2 | rs140016715 | chrX | 15582154 | G | A | 错义变体 | p.Arg768Trp/c.2302C>T | |
| ACE2 | rs147311723 | chrX | 15582265 | G | A | 错义变体 | p.Leu731Phe/c.2191C>T | |
| ACE2 | rs41303171 | chrX | 15582298 | T | C | 错义变体 | p.Asn720Asp/c.2158A>G | |
| ACE2 | rs370187012 | chrX | 15582327 | C | T | 错义变体 | p.Arg710His/c.2129G>A | |
| ACE2 | rs776995986 | chrX | 15582334 | G | A | 错义变体 | p.Arg708Trp/c.2122C>T | |
| ACE2 | rs149039346 | chrX | 15584416 | A | G | 错义变体 | p.Ser692Pro/c.2074T>C | |
| ACE2 | rs200180615 | chrX | 15584488 | C | T | 错义变体 | p.Glu668Lys/c.2002G>A | |
| ACE2 | * |
chrX | 15585879 | A | C | stop_gained | p.Leu656*/c.1967T>G | |
| ACE2 | rs183135788 | chrX | 15585933 | T | C | 错义变体 | p.Asn638Ser/c.1913A>G | |
| ACE2 | rs748163894 | chrX | 15588434 | G | A | 错义变体 | ||
| ACE2 | rs202137736 | chrX | 15591485 | T | C | 剪接区变体+内含子变体 | c.1541+5A>G | |
| ACE2 | rs140473595 | chrX | 15591530 | C | T | 错义变体 | p.Ala501Thr/c.1501G>A | |
| ACE2 | rs191860450 | chrX | 15593829 | T | C | 错义变体 | p.Ile468Val/c.1402A>G | |
| ACE2 | rs758142853 | chrX | 15609868 | A | G | 错义变体 | p.Val184Ala/c.551T>C | |
| ACE2 | rs754511501 | chrX | 15609902 | C | T | 错义变体 | p.Gly173Ser/c.517G>A | |
| ACE2 | rs746034076 | chrX | 15609943 | T | C | 错义变体 | p.Asn159Ser/c.476A>G | |
| ACE2 | rs373252182 | chrX | 15609973 | T | C | 错义变体 | p.Asn149Ser/c.446A>G | |
| ACE2 | rs2285666 | chrX | 15610348 | C | T | 剪接区变体+内含子变体 | c.439+4G>A | |
| ACE2 | rs768736934 | chrX | 15612963 | C | T | 剪接区变体+内含子变体 | c.345+5G>A | |
| ACE2 | rs4646116 | chrX | 15618958 | T | C | 错义变体 | p.Lys26Arg/c.77A>G | |
| ACE2 | rs73635825 | chrX | 15618980 | A | G | 错义变体 | p.Ser19Pro/c.55T>C | |
| 与 SARS 相关的 SNP | ||||||||
| CD209 | rs4804803 | 19 | 7812733 | A | G | 易感基因型 A:A,upstream_transcript_variant | NC_000019.10:7747846 | Sakuntabhai et al., 2005; Chan et al., 2010 |