目的 利用两样本孟德尔随机化(MR)方法探究lncRNA与口腔鳞状细胞癌(OSCC)及口腔癌前病变(口腔白斑及口腔扁平苔藓)发病风险之间的潜在关联。
方法 对基因表达综合数据库中GSE23558和GSE85195数据集进行表达谱分析,筛选出差异表达lncRNA,利用eQTLGen联盟的cis-eQTLs数据集和OSCC及癌前病变全基因组关联分析数据,以单核苷酸多态性作为工具变量,运用逆方差加权法、MR-Egger回归模型等5种方法评估lncRNAs与OSCC及口腔癌前病变之间的因果效应,并通过异质性检验、基因多效性检验和敏感性分析评估结果的可靠性和稳定性,并通过错误发现率(FDR)和Bonferroni法对结果进行校正。
结果 MR分析表明,HCG22[OR=0.999,95%CI(0.999,1.000)]可能降低OSCC发病风险,FAM30A [OR=1.001,95%CI(1.000,1.002)]可能增加OSCC发病风险,FAM182B [OR=0.738,95%CI(0.581,0.937)]可能降低口腔白斑的发病风险,但经校正后上述结果可能存在假阳性。敏感性分析表明无显著异质性或多效性偏倚,提示结果稳定。
结论 当前遗传证据不支持所选的lncRNAs与OSCC或其癌前病变之间存在强而稳健的因果关系。本研究为lncRNA在口腔癌前病变发展中的作用提供了初步遗传学参考,但未来仍需更大样本、功能验证及多组学整合研究,以进一步探索其生物学机制与临床潜力。
口腔鳞状细胞癌(oral squamous cell carcinoma,OSCC)是口腔颌面部最常见的恶性肿瘤之一,主要来源于口腔鳞状上皮的恶性转变 [1- 2]。近年来,伴随综合序列治疗方法的进步,口腔癌的治疗效果有了显著的提升,但是其5年生存率仍较低,由于其发病部位的特殊,对患者的语言、吞咽及容貌均有较为明显的伤害,显著的降低了患者的生存质量。正常口腔黏膜向癌前病变及癌症的转变过程与环境和遗传因素密切相关 [3]。长链非编码RNA(long non-coding RNA,lncRNA)是一种超过200个核苷酸的长链RNA亚型,不具有蛋白质编码能力。lncRNA 作为肿瘤调控因子在肿瘤的发生发展中扮演了重要的角色,其异常突变和表达异常与肿瘤的发生和转移密切相关[4-5]。研究表明lncRNA可以在转录、转录后或翻译水平上影响肿瘤相关基因的异常表达,参与口腔黏膜癌变的整个过程[6]。
孟德尔随机化(Mendelian randomization,MR)分析以单核苷酸多态性(single nucleotide polymorphisms,SNPs)作为工具变量(instrumental variables,IVs),用于研究暴露和结局之间的因果关系,有助于规避混杂因素的影响[7]。为了进一步探究lncRNA 在OSCC及癌前病变发生发展的作用机制,本研究拟从基因表达综合数据库(Gene Expression Omnibus,GEO)中获得OSCC表达谱数据,对其进行差异表达分析,筛选关键lncRNA分子,并结合应用两样本MR分析,研究lncRNAs与OSCC及癌前病变之间的潜在关联。
1 资料与方法
1.1 研究设计
本研究以GEO筛选获得的lncRNA为暴露因素,以OSCC、口腔癌前病变(口腔白斑及口腔扁平苔藓)为结局,通过双样本MR方法探究二者的因果关系,并通过敏感性分析及水平有效性检验确保结果的稳定。在本MR研究中,lncRNA作为连续型暴露变量,其效应值来源于标准化后的表达水平。
1.2 差异表达基因
1.2.1 数据来源
本研究中,从GEO 数据库下载GSE23558和GSE85195数据集,标本数据均为正常口腔黏膜组织和OSCC组织的基因表达谱。
1.2.2 数据分析
差异表达基因(differentially expressed gene,DEGs)的获取,使用在线分析工具GEO2R(https://www.ncbi.nlm.nih.gov/geo/geo2r/)分析上述2个数据集中OSCC样本和正常口腔黏膜组织样本之间的DEGs,符合P<0.05且|log2FC|≥2的基因被认为是DEGs。采用Excel确定2个数据集之间的交集部分。
1.2.3 lncRNA基因筛选
将上述2个数据集交集的DEGs上传Ensembl 平台(https://asia.ensembl.org/index.html),提取差异表达lncRNA基因。
1.3 孟德尔随机化分析
1.3.1 数据来源
OSCC患者及其对照组全基因组数据来源于IEU Open GWAS数据库,包括357例OSCC样本和372 016例对照组样本;口腔白斑患者及其对照组全基因组数据来源于FinnGen数据库,包括1 972例口腔白斑样本和498 376例对照组样本(finngen_R12_K11_ORAL_LEUCOPLAC_RELAT);口腔扁平苔藓患者及其对照组全基因组数据来源于FinnGen数据库,包括795例口腔扁平苔藓患者和499 553例对照组样本(finngen_R12_K11_ORAL_LICHEN_PLANUS)。表达数量性状基因座(expression quantitative trait locus,eQTL)是一类能够影响基因表达量的遗传位点,本研究数据来源于eQTLGen联盟的cis-eQTL数据集,涉及16 987个基因,包括SNPs染色体位置、主要等位基因、次要等位基因频率、样本数和P值等。本研究依据GEO筛选分析获得相应的lncRNAs基因,通过cis-eQTL 数据匹配,获得lncRNAs基因相关GWAS数据集。
1.3.2 工具变量选择
MR分析要求满足3个基本假设: ①IVs与暴露因素之间密切相关;②IVs仅通过暴露因素作用于性状或疾病,即不存在多效性;③IVs与混杂因素相互独立[8]。结合cis-eQTL包含碱基及突变位点实际情况,所选用的lncRNA的SNPs均满足全基因组统计显著性阈值(P<5×10-6),连锁不平衡满足条件为r2<0.01,遗传距离1 000 kb。为进一步评价IVs强度,计算每个SNP的F统计量,其中F<10(视为弱IV)的IVs被剔除,具体计算公式:F=R2×(N-2)/(1-R2),R2=2×(1-EAF)×EAF×β2,N是选择用于MR分析的SNP总数,β是SNP对暴露因素的效应估计值,EAF是效应等位基因频率[9]。此外,采用在线LDtrait工具数据库(https://ldlink.nih.gov/?tab=ldtrait)识别和剔除与混杂因素相关的SNPs[10]。
1.3.3 统计学分析
采用逆方差加权法(inverse variance weighting,IVW)和MR-Egger法、加权中位数法(weighted median estimator,WME)、简单众数法(simple mode,SM)以及加权众数法(weighted mode,WM)共5种MR分析方法研究lncRNAs与OSCC及癌前病变之间的因果关联。其中,IVW结果为主要依据,其他四种方法作为补充,若各方法估计的因果方向一致,可增强结果的可信度;否则提示证据存在异质性,因果关系尚不明确,需进一步验证。通过Cochran's Q检验评估IVs间是否存在异质性,并绘制漏斗图判断是否存在离群效应。MR-Egger截距可以检测是否存在多效性并评估结果的稳健性。通过留一法,逐步剔除SNP并观察其对结果是否产生较大影响。通过错误发现率(false discovery rate,FDR)和Bonferroni法对结果进行校正。此外,对于校正后的阳性结果进行Steiger检验,以确定结果的可靠 性。
使用R 4.4.2软件及其TwoSampleMR(0.5.7)、MR-PRESSO(1.0)软件包进行统计学分析与MR分析。统计检验均为双侧检验,P<0.05时,结果具有统计学意义。
2 结果
2.1 lncRNAs筛选
通过比对分析后,从GEO数据集中初步检出56个lncRNAs基因,在cis-eQTL数据集中筛选这56个lncRNAs的eQTL,删除37个无cis-eQTL记录的lncRNAs,最终获得PTGES2- AS1、MIR600HG、FAM182D等19个lncRNAs的eQTL数据(表1)。
-
表格1 lncRNAs的筛选及其效应值
Table1.Screening of lncRNAs
2.2 IVs筛选
根据IVs筛选标准,将19个lncRNAs对应的cis-eQTL作为暴露因素,OSCC和口腔白斑及口腔扁平苔藓作为结局因素,筛选出SNPs纳入MR分析,纳入研究的每个SNP的F值均>10,表示不存在弱IVs偏倚。
2.3 两样本孟德尔随机化分析
2.3.1 lncRNA 与OSCC
IVW结果显示,HCG22[OR=0.999,95%CI(0.999,1.000)]可能降低OSCC的发病风险,FAM30A [OR=1.001,95%CI(1.000,1.002)]可能增加OSCC的发病风险,但其OR与95%CIs毗邻临界值,表明二者之间关联可能较弱,但其他四种方法(MR Egger、WME、SM、WM)基本均不支持两者之间存在显著因果关系(表2)。
-
表格2 lncRNAs与OSCC及癌前病变的MR分析及异质性检验和基因多效性检验
Table2.MR analysis, heterogeneity test, and gene pleiotropy test of lncRNAs in OSCC and precancerous
Cochran's Q 检验均未发现HCG22、FAM30A明显异质性,以上结果通过漏斗图得到进一步确认(附 件图1)。多效性检验表明不存在潜在的水平多效性。留一法分析表明,以上结果并不受单个SNP影响(附件图2)。经FDR和Bonferroni校正后二者均未达到统计学显著性标准,表明HCG22及FAM30A与OSCC之间无明确的因果关联。其他17个lncRNAs与OSCC之间亦无明显的因果关系(附件表1)。
2.3.2 lncRNA与口腔白斑
IVW结果显示,FAM182B[OR=0.738,95%CI(0.581,0.937)]降低了口腔白斑的发病风险。Cochran's Q 检验未发现存在明显异质性(附件图 3)。多效性检验表明不存在潜在的水平多效性。留一法分析表明,以上结果并不受单个SNP影响(附件图4)。经FDR和Bonferroni校正后二者均未达到统计学显著性标准,表明FAM182B与口腔白斑之间无明确的潜在关联。其他18个lncRNAs与口腔白斑之间亦无显著的因果关系(附 件表2)。
2.3.3 lncRNA与口腔扁平苔藓
IVW结果显示,暂未发现lncRNA与口腔扁平苔藓存在潜在的因果关联。Cochran's Q 检验均未发现明显异质性存在。多效性检验,表明不存在潜在的水平多效性。留一法分析表明,以上结果并不受单个SNP影响。经FDR和Bonferroni校正后二者均未能达到统计学显著性标准,表明目前纳入研究的19个lncRNA与口腔扁平苔藓之间均无潜在因果关系(附 件表3)。
3 讨论
本研究发现HCG22降低了OSCC发病风险,FAM30A增加了OSCC发病风险;FAM182B降低了口腔白斑发病风险。但经FDR和Bonferroni法校正后,目前检测的19种lncRNA均未发现与OSCC及癌前病变之间存在明确的因果关联。
lncRNA HCG22作为近年来备受关注的重要肿瘤抑制因子,在包括OSCC等多种癌症的发生发展中发挥着关键的调控作用。研究表明,HCG22在OSCC中呈现显著的低表达状态,并通过复杂的分子机制参与调控肿瘤细胞的增殖、凋亡、迁移、侵袭以及上皮-间质转化(EMT)等生物学行为[11]。此外,HCG22的表达水平与肿瘤的临床病理特征密切相关,其低表达与肿瘤体积增大[12]、TNM分期进展、分化程度降低, 淋巴结转移等不良预后因素密切相关[11]。从分子机制来看,HCG22主要通过作为竞争性内源RNA与多种miRNA结合,如通过靶向结合miR-17-3p下调MMP-2/9的表达[13],或通过调控miR- 650和miR-425-5p抑制肿瘤细胞的迁移侵袭能力 [11- 14];其次,HCG22能显著抑制Akt/mTOR和Wnt/ β-catenin等重要信号通路的活化[15],降低增殖相关蛋白(如PCNA、Cyclin E)的表达;此外,它还能通过上调上皮标志物上皮钙黏素、下调间质标志物神经钙黏素和波形蛋白的表达来逆转EMT过程[11]。在头颈部鳞状细胞癌中,HCG22被发现是下调最显著的lncRNA之一,是患者总生存期和无病生存期的独立预后因素[12]。Yin等 [16]研究基于Kaplan-Meier生存曲线分析证实lncRNA HCG22在口腔癌组织中低表达,与生存时间的缩短显著相关,可以作为口腔癌症的诊断和预后标志物之一。Huang等[17]研究证实lncRNA HCG22在口腔癌细胞系和组织中表达较低,而且HCG22的低表达与患者的低生存率密切相关。
值得注意的是,尽管本研究MR结果未支持HCG22与OSCC之间的遗传因果关系,但其在组织表达和功能实验中的显著表现提示其可能更多受到后天因素(如环境暴露、表观遗传调控)的影响,而非单纯由遗传变异驱动。这也提示未来研究应结合多组学数据(如甲基化、染色质可及性)以更全面揭示其在口腔癌中的作用路径。
目前尚无关于FAM30A和FAM182B与OSCC及癌前病变相关的研究报道。FAM30A的研究主要关注于结直肠癌,研究发现FAM30A在肠癌中的表达水平显著低于正常组织,并且与患者的预后呈现正相关[18-19]。而针对FAM182B的研究主要集中于肝癌,研究发现FAM182B在肝癌中的表达水平显著高于正常组织,并且与患者的预后呈现负相关[20]。与本研究结果并不一致,这可能是由于肿瘤类型的差异造成的,也有可能是研究数据过少导致的结果偏倚,表明关于lncRNA FAM30A,FAM182B在OSCC及癌前病变中的表达及其致病机制的研究仍有待进一步探索。
本研究存在一定局限性。本研究使用的lncRNA遗传工具(eQTLs)主要来源于外周血,而口腔扁平苔藓和OSCC的发病机制定位于口腔组织,血液与口腔微环境内中lncRNA的调控与表达可能不一致,eQTL的效应差异可能会引入偏倚。尽管如此,使用血液eQTL在当前全转录组MR研究中仍是一种常见且实用的方法。未来研究应着眼于利用特异性来源于口腔或其他相关组织的lncRNA eQTL数据,以便更为精确的研究OSCC和癌前病变的分子机制。
综上所述,本研究筛选出的19种lncRNA与OSCC及其癌前病变之间未发现存在明确的潜在关联,囿于现有研究数量及病种的局限,有必要进一步验证以上lncRNAs与OSCC及癌前病变的潜在关联,为其在OSCC及癌前病变的临床诊疗中的应用奠定理论基础。
附件见《医学新知》官网附录(https://yxxz.whuznhmedj.com/futureApi/storage/appendix/202508113.docx)
伦理声明:不适用
作者贡献:研究设计、数据分析、文献检索、资料整理:胡媛媛、牛玉明;论文撰写:胡媛媛;文章选题、论文修订和经费支持:牛玉明
数据获取:本研究中使用和(或)分析的数据可在公开数据库IEU OpenGWAS project(https://gwas.mrcieu.ac.uk/)以及FinnGen数据库(https://www.finngen.fi/)网站获取
利益冲突声明:无
致谢:不适用
1.Peres MA, Macpherson LMD, Weyant RJ, et al. Oral diseases: a global public health challenge [J]. Lancet, 2019, 394(10194): 249-260. DOI: 10.1016/s0140-6736(19)31146-8.
2.Yasothkumar D, Ramani P, Ramasubramanian A. Clinico-pathological assessment and malignant transformation in patients with oral epithelial dysplasia - a follow-up cohort study[J]. Head Neck Pathol, 2025, 19(1): 96. DOI: 10.1007/s12105-025-01833-8.
3.Kojima S, Kuribayashi N, Goda H, et al. Oral cancer driver gene mutations in oral potentially malignant disorders: clinical significance and diagnostic implications[J]. Discov Oncol, 2025, 16(1): 174. DOI: 10.1007/s12672-025-01923-7.
4.Mattick JS, Amaral PP, Carninci P, et al. Long non-coding RNAs: definitions, functions, challenges and recommendations[J]. Nat Rev Mol Cell Biol, 2023, 24(6): 430-447. DOI: 10.1038/s41580-022-00566-8.
5.Coan M, Haefliger S, Ounzain S, et al. Targeting and engineering long non-coding RNAs for cancer therapy[J]. Nat Rev Genet, 2024, 25(8): 578-595. DOI: 10.1038/s41576-024-00693-2.
6.Tang J, Fang X, Chen J, et al. Long non-coding RNA (lncRNA) in oral squamous cell carcinoma: biological function and clinical application[J]. Cancers (Basel), 2021, 13(23): 5944. DOI: 10.3390/cancers13235944.
7.Davies NM, Holmes MV, Davey Smith G. Reading Mendelian randomisation studies: a guide, glossary, and checklist for clinicians[J]. BMJ, 2018, 362: k601. DOI: 10.1136/bmj.k601.
8.Lawlor DA, Harbord RM, Sterne JA, et al. Mendelian randomization: using genes as instruments for making causal inferences in epidemiology[J]. Stat Med, 2008, 27(8): 1133-1163. DOI: 10.1002/sim.3034.
9.Li XF, Cai JW, Hu YY, et al. Causal relationship between autoimmune arthritis and temporomandibular disorders[J]. Int Dent J, 2025, 75(2): 596-604. DOI: 10.1016/j.identj.2024.08.006.
10.Lin SH, Brown DW, Machiela MJ. LDtrait: an online tool for identifying published phenotype associations in linkage disequilibrium[J]. Cancer Res, 2020, 80(16): 3443-3446. DOI: 10.1158/0008-5472.Can-20-0985.
11.高永强, 施鹏伟, 师文楷, 等. 长链非编码RNA HCG22在口腔鳞状细胞癌中的表达及作用机制研究[J]. 华西口腔医学杂志, 2021, 39(6): 658-666. [Gao YQ, Shi PW, Shi WK, et al. Expression and mechanism of long non-coding RNA HCG22 in oral squamous cell carcinoma[J]. West China Journal of Stomatology, 2021, 39(6): 658-666.] DOI: 10.7518/hxkq.2021.06.006.
12.Guo YZ, Sun HH, Wang XT, et al. Transcriptomic analysis reveals key lncRNAs associated with ribosomal biogenesis and epidermis differentiation in head and neck squamous cell carcinoma[J]. J Zhejiang Univ Sci B, 2018, 19(9): 674-688. DOI: 10.1631/jzus.B1700319.
13.尹江, 唐平, 张慧, 等. HCG22靶向miR-17-3p对口腔鳞癌细胞生物学行为的影响[J]. 临床肿瘤学杂志, 2023, 28(8): 693-699. [Yin J, Tang P, Zhang H, et al. Effects of HCG22 on biological behavior of oral squamous cell carcinoma cells by targeting miR-17-3p[J]. Chinese Clinical Oncology, 2023, 28(8): 693-699.] DOI: 10.3969/j.issn.1009-0460.2023.08.004.
14.Fu Y, Liu Y, Nasiroula A, et al. Long non-coding RNA HCG22 inhibits the proliferation, invasion and migration of oral squamous cell carcinoma cells by downregulating miR-425-5p expression[J]. Exp Ther Med, 2022, 23(3): 246. DOI: 10.3892/etm.2022.11171.
15.Wang M, Feng Z, Li X, et al. Assessment of multiple pathways involved in the inhibitory effect of HCG22 on oral squamous cell carcinoma progression[J]. Mol Cell Biochem, 2021, 476(6): 2561-2571. DOI: 10.1007/s11010-021-04091-8.
16.Yin JH, Zeng XL, Ai ZX, et al. Construction and analysis of a lncRNA-miRNA-mRNA network based on competitive endogenous RNA reveal functional lncRNAs in oral cancer[J]. BMC Med Genomics, 2020, 13(1): 84. DOI: 10.1186/s12920-020-00741-w.
17.Huang GZ, Wu QQ, Zheng ZN, et al. Identification of candidate biomarkers and analysis of prognostic values in oral squamous cell carcinoma[J]. Front Oncol, 2019, 9: 1054. DOI: 10.3389/fonc.2019.01054.
18.Liu J, Han SY, Cui YB, et al. LncRNA FAM30A suppresses proliferation and metastasis of colorectal carcinoma by blocking the JAK-STAT signalling[J]. J Cell Mol Med, 2025, 29(4): e70421. DOI: 10.1111/jcmm.70421.
19.Ye G, Chen Y. LncRNA FAM30A predicts adverse prognosis and regulates cellular processes in colorectal cancer via modulating miR-21-3p[J]. Turk J Gastroenterol, 2024, 35(7): 532-538. DOI: 10.5152/tjg.2024.23465.
20.Liu J, Li W, Zhang J, et al. Identification of key genes and long non-coding RNA associated ceRNA networks in hepatocellular carcinoma[J]. Peer J, 2019, 7: e8021. DOI: 10.7717/peerj.8021.