鼻咽癌是指由被覆鼻咽腔表面的上皮或鼻咽隐窝上皮发生的恶性肿瘤[1],发病率位于耳鼻咽喉恶性肿瘤之首,其发病机制复杂,诱发因素较多[2]。鼻咽癌地理分布明显,在东亚和东南亚较为流行[3-4],而中国发病率最高[5]。世界卫生组织国际癌症研究中心的数据显示,2020年中国鼻咽癌新发病例6.2万例,死亡3.4 万例 [6],严重影响中国人民的健康。与此同时,中国的人口正迅速老龄化[7],鼻咽癌越来越成为不可忽视的恶性肿瘤之一。准确、可靠、持续的监测数据是合理制定公共卫生政策的基础。鉴于鼻咽癌对公共健康的影响,以及其与可改变的危险因素和人口老龄化的关联,深入了解中国鼻咽癌的流行趋势和疾病负担对于制定有效的预防和控制策略至关重要。在鼻咽癌的防控中,利用数学建模的方式建立准确的中国鼻咽癌发病与死亡预测模型,可为制定鼻咽癌防控政策和卫生资源的配置提供科学依据。前期已有研究利用全球疾病负担研究(Global Burden of Diseases Study,GBD)数据对中国鼻咽癌的疾病负担未来趋势进行了预测[8- 9],而灰色预测模型(grey prediction model,GM)(1,1)和差分整合移动平均自回归模型(autoregressive integrated moving average model,ARIMA)在恶性肿瘤疾病负担预测中广为使用 [10- 11],两种模型各有优缺和适用场景,两者比较使用可提高预测的准确性。本研究利用2012—2021年中国鼻咽癌发病率及死亡率数据分别建立GM(1,1)和ARIMA预测模型,比较两种模型的预测效果,建立科学准确的预测模型,为中国鼻咽癌的防控工作提供参考依据。
1 资料与方法
1.1 资料来源
本研究数据来源于2021 GBD数据库(https://vizhub.healthdata.org/gbd-results/),该数据库收集了不同国家和地区的疾病、伤害和健康危险因素的流行病学数据[12]。本研究在GBD数据库中提取2012—2021年中国居民鼻咽癌总年龄标准化发病率(age standardized incidence rate,ASIR)、男性ASIR、女性ASIR、总年龄标准化死亡率(age standardized mortality rate,ASMR)、男性ASMR、女性ASMR。
1.2 模型构建
1.2.1 GM(1,1)的建立
对2012—2021年中国鼻咽癌总ASIR、男性ASIR、女性ASIR、总ASMR、男性ASMR和女性ASMR构建GM(1,1)模型,通过对原始数据进行一次累加得到新的数据序列,建立微分方程模型,最终得到原始序列模拟值,从而实现对未来数据的预测[13-14]。
采用后验差比值C值和小误差概率P值检验灰色模型GM(1,1)的拟合精度,精度等级越小预测效果越好[15-16],模型精度等级判断标准见表1。相对误差和级比偏差评估模型的拟合效果,两个指标数值越小越好,<0.2说明达到要求,<0.1说明达到较高要求[17]。
-
表格1 拟合精度的等级判断
Table1.Standards for precision grades
1.2.2 ARIMA建立
ARIMA(p,d,q)中AR是自回归模型,p为自回归阶数;MA为移动平均模型,d为差分阶数,q为移动平均阶数[18]。
建模步骤:①验证序列平稳性,绘制时序图或单位根检验来判断时间序列平稳性,对不平稳序列采用差分使其平稳;②模型识别,利用序列自相关(autocorrelation function,ACF)和偏自相关(partial autocorrelation function,PACF)图进行分析,确定p、q、d及备选模型类型;③参数估计与模型诊断,提出若干备选模型后,采用最小二乘法判断各参数是否具有统计学意义,采用赤池信息准则(Akaike information criterion,AIC)和贝叶斯信息准则(Bayesian information criterion,BIC)确定最优模型[19],对其残差进行Ljung-Box检验,当 QLB6 的P>0.05 时残差序列为白噪声序列,表明拟合模型有效[20];④ 预测,确定最优模型对数据进行预测。
1.3 评价指标
采用平均绝对误差(mean absolute error,MAE)和平均相对误差(mean relative error,MRE)对GM(1,1)和ARIMA模型的预测结果进行比较,MAE和MRE越小越好。
1.4 统计学分析
采用SPSS 27.0软件对发病率和死亡率的时间趋势进行线性趋势χ2检验,P<0.05为差异具有统计学意义。应用SPSS AU在线分析软件进行GM(1,1)和ARIMA模型的建立、预测及拟合精度检验。
2 结果
2.1 GM(1,1)预测结果
2.1.1 GM(1,1)模型拟合精度
总ASIR、男性ASIR、女性ASIR和总ASMR预测模型的后验差比C值<0.35,小误差概率P >0.95,拟合精度等级较高;男性ASMR和女性ASMR的预测模型后验差比C值<0.35,小误差概率P>0.80,拟合精度等级合格(表2),模型公式见附件表1。
-
表格2 GM(1,1)模型参数估计值和预测精度检验
Table2.Parameter estimation value and prediction accuracy test of GM (1,1) model
2.1.2 GM(1,1)预测模型拟合效果
6个GM(1,1)预测模型的相对误差值和级比偏差均<0.1,6个模型拟合效果达到较高要求(表3)。
-
表格3 GM(1,1)模型拟合效果检验
Table3.Test of fitting effect of GM (1,1) model
2.1.3 GM(1,1)模型预测结果
2012—2021年总ASIR、男性ASIR、女性ASIR、总ASMR、男性ASMR和女性ASMR时间趋势均有统计学意义(P<0.05)。根据GM(1,1)模型预测,2012—2026年总ASIR、男性ASIR、女性ASIR、总ASMR、男性ASMR和女性ASMR预测值时间趋势均有统计学意义(P<0.05)。预测到2026年总ASIR、男性ASIR和女性ASIR分别上升至3.83/10万、5.85/10万、1.82/10万;总ASMR、男性ASMR和女性ASMR分别下降至1.44/10万、2.23/10万、0.71/10万(图1)。
-
图1 GM(1,1)模型预测效果图
Figure1.GM (1,1) model prediction performance diagram
注:A.ASIR;B.ASMR。
2.2 ARIMA预测结果
2.2.1 ARIMA模型建立及最优模型确定
ARIMA模型参数见表4。各模型ACF图和PACF图见附件图1。SPSS AU在线分析软件根据ARIMA模型的AIC和BIC对多个潜在备选模型进行对比,最终确定最优模型和模型公式,各指标ARIMA最优模型和模型公式见附件表2。
-
表格4 ARIMA模型参数
Table4.Table 4 ARIMA model parameters
2.2.2 ARIMA模型残差判断
根据QLB统计量结果,6个模型QLB6 的P 值均>0.1,模型的残差均是白噪声,模型满足要求(附件表3)。
2.2.3 ARIMA模型预测结果
根据ARIMA模型预测,2012—2026年总ASIR、男性ASIR、女性ASIR和总ASMR预测值时间趋势均有统计学意义(P<0.05),男性ASMR和女性ASMR预测值时间趋势无统计学意义(P >0.05),预测到2026年中国鼻咽癌的总ASIR、男性ASIR、女性ASIR、总ASMR、男性ASMR和女性ASMR分别为3.41/10万、5.10/10万、1.61/10万、1.33/10万、2.42/10万和0.79/10 万(图2)。
-
图2 ARIMA模型预测效果图
Figure2.ARIMA model prediction performance diagram
注:A.ASIR;B.ASMR。
2.3 模型评价指标比较
GM(1,1)模型的MAE和MRE比ARIMA模型的小,说明GM(1,1)模型的误差值更小,GM(1,1)模型更适用于中国鼻咽癌ASIR、男性ASIR、女性ASIR、总ASMR、男性ASMR和女性ASMR的趋势预测(表5)。
-
表格5 2种模型的平均绝对误差与平均相对误差
Table5.The average absolute error and average relative error of two models
3 讨论
鼻咽癌早期症状不明显,常发生于中老年阶段,随着我国人口增长以及老龄化进程加快其发病率不断上升[21],预计2035 年,我国≥60岁老年人口将超过4 亿,鼻咽癌的疾病负担可能成为一个重大的公共卫生问题[22]。除了年龄的影响,EB病毒感染、不良饮食习惯、环境污染、吸烟、饮酒等都与鼻咽癌的发生有直接的关系。在中国,咸鱼及其他腌制食品食用较为普遍,其中含有高致癌性的亚硝胺及其前体物质,并可能携带EB病毒的激活因子[23],EB病毒可能通过变异改变致癌力进而影响鼻咽癌的发生 [24],腌制品的高盐量也会导致鼻咽癌发病率的增加 [25]。随着我国工业化水平的不断提高,空气污染日益严重。暴露于含有粉尘、化学蒸气、废气/烟雾或酸/碱的工作环境中也会增加鼻咽癌发生的风险[26]。吸烟与鼻咽癌的发生有着密切的关联,以往研究表明,吸烟者较不吸烟者患鼻咽癌的风险更高[27-28]。随着医疗水平的不断提高,尤其是靶向治疗和免疫治疗等新的治疗技术的发展,鼻咽癌的死亡率有所降低。目前,鼻咽癌的控制手段仍以早发现、早治疗为主,分析中国鼻咽癌发病及死亡趋势,建立科学准确的预测模型,对卫生资源配置和防控政策的制定有重要意义。
对于疾病的预测,不同预测模型有着不同的优点和局限性,选取预测模型应充分考虑数据的特点。GM模型已广泛用于疾病的预测中,其中GM(1,1)模型是GM模型的核心和基础理论[29],应用最为广泛。它对样本量和概率分布没有严格的要求,预测精度高,适用于近期、中短期预测 [30],具有所需数据少、无需典型的概率分布、计算简便和预测效果好的优点[31],但当数据存在明显的趋势变化时,预测的准确性可能会受到影响,再者,它适合短期和中期预测,不适合长期预测 [30]。本研究的6个GM(1,1)模型的模型精度检验中,后验差比 C值和小误差概率 P值均达到了合格水平,相对误差值和级比偏差均<0.1,拟合效果较好。拟合后6个GM(1,1)模型预测值均保持了原始数列的单调变化趋势,说明GM(1,1)模型对单调变化的原始数列预测效果较好,这与石雷[32]的观点一致。ARIMA模型近年来在疾病的预测中得到了广泛的应用,它是一种时间序列分析预测模型,其优点在于可充分考虑原始数列的趋势变化、周期变化及随机干扰,并且可以通过反复测试得到最为满意的模型,缺点是对数据量及序列的平稳性要求高[33]。经过检验,本研究6个ARIMA模型的残差均是白噪声,模型拟合效果较好。在两种模型的预测效果方面,6个GM(1,1)模型的MAE和MRE均小于ARIMA 模型,说明在中国鼻咽癌的发病率和死亡率预测中,GM(1,1)模型的预测效果更好。
本研究也存在一定的局限性。首先,本研究数据来源于GBD数据库,可能与实际数据存在一定的偏差。其次,本研究利用GM(1,1)模型对中国鼻咽癌ASIR、男性ASIR、女性ASIR、总ASMR、男性ASMR和女性ASMR进行了短期的预测,能够反映其发展趋势,但研究中仅纳入了时间变量,缺乏考虑社会因素和自然因素等其他因素对结局的影响,在后续的研究中应构建包含多种因素的组合模型,以提高预测模型,为中国鼻咽癌的防控工作提供更有利的数据支撑。
综上,GM(1,1)模型在预测中国鼻咽癌发病率和死亡率方面优于ARIMA模型,根据GM(1,1)模型预测到2026年,中国鼻咽癌的总ASIR、男性ASIR和女性ASIR分别上升至3.83/10万、5.85/10万、1.82/10万,总ASMR、男性ASMR和女性ASMR分别下降至1.44 /10万、2.23/10万、0.71/10万。
附件见《医学新知》官网附录(https://yxxz.whuznhmedj.com/futureApi/storage/appendix/202412173.pdf)
伦理声明:不适用
作者贡献:研究构思、数据收集、论文撰写:林小龙;数据采集与分析、图片绘制、论文修订:张杰;资金支持、研究指导、论文修改:林伟
数据获取:本研究中使用和(或)分析的数据可在GBD数据库获取(https://vizhub.healthdata.org/gbd-results/)
利益冲突声明:无
致谢:不适用
1.Campion NJ, Ally M, Jank BJ, et al. The molecular march of primary and recurrent nasopharyngeal carcinoma[J]. Oncogene, 2021, 40(10): 1757-1774. DOI: 10.1038/s41388-020-01631-2.
2.Fierti AO, Yakass MB, Okertchiri EA, et al. The role of epstein-barr virus in modulating key tumor suppressor genes in associated malignancies: epigenetics, transcriptional, and post-translational modifications[J]. Biomolecules, 2022, 12(1): 127. DOI: 10.3390/biom12010127.
3.Yang SP, Rao MY, Chen QS, et al. Causes of death in long-term nasopharyngeal carcinoma survivors[J]. Front Public Health, 2022, 10: 912843. DOI: 10.3389/fpubh.2022.912843.
4.Tang LL, Chen YP, Chen CB, et al. The Chinese Society of Clinical Oncology (CSCO) clinical guidelines for the diagnosis and treatment of nasopharyngeal carcinoma[J]. Cancer Commun (Lond), 2021, 41(11): 1195-1227. DOI: 10.1002/cac2.12218.
5.朱文鹏, 韩梦琦, 王雨欣, 等. 1990—2019年中国鼻咽癌发病与死亡的趋势及预测研究[J]. 中国全科医学, 2023, 26(34): 4269-4276. [Zhu WP, Han MQ, Wang YX, et al. Trends and prediction of nasopharyngeal carcinoma incidence and mortality in China from 1990 to 2019[J]. Chinese General Practice, 2023, 26(34): 4269-4276.] DOI: 10.12114/j.issn.1007-9572.2023.0247.
6.Sung H, Ferlay J, Siegel RL, et al. Global cancer statistics 2020: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J]. CA Cancer J Clin, 2021, 71(3): 209-249. DOI: 10.3322/caac.21660.
7.Chen X, Giles J, Yao Y, et al. The path to healthy ageing in China: a peking university-lancet commission[J]. Lancet, 2022, 400(10367): 1967-2006. DOI: 10.1016/S0140-6736(22)01546-X.
8.梁冠盈, 苗大壮, 范宁宁, 等. 1990-2019年中国鼻咽癌发病和死亡年龄-时期-队列分析及预测[J]. 中华肿瘤防治杂志, 2024, 31(7): 391-398. [Liang GY, Miao DZ, Fan NN, et al. Age-period-cohort analysis and prediction of nasopharyngeal carcinoma incidence and mortality in China from 1990 to 2019[J]. Chinese Journal of Cancer Prevention and Treatment, 2024, 31(7): 391-398.] DOI: 10.16073/j.cnki.cjcpt.2024.07.01.
9.谢梦娇. 中国鼻咽癌发病和死亡的趋势分析及预测研究 [D]. 辽宁: 中国医科大学, 2023. [Xie MJ. Trend analysis and prediction of nasopharyngeal carcinoma incidence and mortality in China[D]. Liaoning: China Medical University, 2023.] DOI: 10.27652/d.cnki.gzyku.2023.000883.
10.邓芷晴, 周利华, 叶久红, 等. ARIMA模型在肺癌发病率预测中的应用[J]. 医学新知杂志, 2019, 29(4): 414-417. [Deng ZQ, Zhou LH, Ye JH, et al. Application of ARIMA model in forecast of the incidence of lung cancer[J]. Journal of New Medicine, 2019, 29(4): 414-417.] DOI: 10.3969/j.issn.1004-5511.2019.04.020.
11.文静, 殷成宇, 廖国伟, 等. 应用GM(1,1)灰色模型预测全国甲状腺癌发病趋势[J]. 现代肿瘤医学, 2022, 30(5): 899-902. [Wen J, Yin CY, Liao GW, et al. Application of GM(1,1) grey model in predicting the incidence trend of thyroid cancer in China[J]. Journal of Modern Oncology, 2022, 30(5): 899-902.] DOI: 10.3969/j.issn.1672-4992.2022.05.030.
12.Wang X, Cheng F, Fu Q, et al. Time trends in maternal hypertensive disorder incidence in Brazil, Russian Federation, India, China, and South Africa (BRICS): an age-period-cohort analysis for the GBD 2021[J]. BMC Pregnancy Childbirth, 2024, 24(1): 731. DOI: 10.1186/s12884-024-06931-z.
13.Tu C, Pan Q, Jiang C, et al. Trends and predictions in the physical shape of Chinese preschool children from 2000 to 2020[J]. Front Public Health, 2023, 11: 1148415. DOI: 10.3389/fpubh.2023.1148415.
14.鲍晓露, 向国春, 史卢少博, 等. 基于灰色GM(1,1)-SVM组合模型的广东省卫生总费用预测研究[J]. 现代预防医学, 2022, 49(5): 856-859. [Bao XL, Xiang GC, Shi LSB, et al. Prediction of total health expenditure in Guangdong based on GM(1,1)-SVM combination model[J]. Modern Preventive Medicine, 2022, 49(5): 856-859.] https://d.wanfangdata.com.cn/periodical/xdyfyx202205018
15.Yan J, Li Y, Zhou P. Impact of COVID-19 pandemic on the epidemiology of STDs in China: based on the GM (1,1) model[J]. BMC Infect Dis, 2022, 22(1): 519. DOI: 10.1186/s12879-022-07496-y.
16.Gao J, Li J, Wang M. Time series analysis of cumulative incidences of typhoid and paratyphoid fevers in China using both Grey and SARIMA models[J]. PLoS One, 2020, 15(10): e241217. DOI: 10.1371/journal.pone.0241217.
17.程龙慧, 任琼琼, 肖培, 等. 我国常见细菌耐药趋势预测研究: 基于灰色GM(1,1)模型[J]. 中国感染控制杂志, 2022, 21(12): 1164-1170. [Cheng LH, Ren QQ, Xiao P, et al. Prediction of drug resistance trends of common bacteria in China based on grey prediction model GM(l,1)[J]. Chinese Journal of Infection Control, 2022, 21(12): 1164-1170.] DOI: 10.12138/j.issn.1671-9638.20223282.
18.张彬, 张龙秀, 王瑞, 等. 基于GM(1,1)和ARIMA模型的安徽省孕产妇及儿童死亡率的预测研究[J]. 中国妇幼卫生杂志, 2023, 14(1): 1-6. [Zhang B, Zhang LX, Wang R, et al. Prediction of maternal and child mortality in Anhui Province based on GM(1,1) and ARIMA combination model [J]. Chinese Journal of Women and Children Health, 2023, 14(1): 1-6.] DOI: 10.19757/j.cnki.issn1674-7763.2023.01.001.
19.俞玉琪, 李德富, 刘勇, 等. 江西省儿童流感样病例就诊率ARIMA模型的建立及应用[J]. 南昌大学学报(医学版), 2023, 63(1): 73-76. [Yu YQ, Li DF, Liu Y, et al. Establishment and application of ARIMA model for influenza-like illness consultation rate among children in Jiangxi Province[J]. Journal of Nanchang University (Medical Sciences), 2023, 63(1): 73-76.] DOI: 10.13764/j.cnki.ncdm.2023.01.014.
20.尤金辉, 范国锋. ARIMA模型与GM(1,1)模型对兴化市结核病发病数预测效果比较[J]. 江苏预防医学, 2022, 33(5): 551-553. [You JH, Fan GF. Comparative study of ARIMA and GM(1,1) models in predicting the incidence of tuberculosis in Xinghua City[J]. Jiangsu Journal of Preventive Medicine, 2022, 33(5): 551-553.] DOI: 10.13668/j.issn.1006-9070.2022.05.016.
21.Hassan NMA, 韦彗琳, 胡艳玲. 1990—2019年中国鼻咽癌疾病负担变化趋势分析及预测[J]. 蛇志, 2023, 35(2): 191-197. [Hassan NMA, Wei HL, Hu YL. Trend analysis and prediction of nasopharyngeal carcinoma disease burden in China from 1990 to 2019[J]. Journal of Snake, 2023, 35(2): 191-197.] DOI: 10.3969/j.issn.1001-5639.2023.02.012.
22.Zhang R, He Y, Wei B, et al. Nasopharyngeal carcinoma burden and its attributable risk factors in China: estimates and forecasts from 1990 to 2050[J]. Int J Environ Res Public Health, 2023, 20(4): 2926. DOI: 10.3390/ijerph20042926.
23.Yu MC, Nichols PW, Zou XN, et al. Induction of malignant nasal cavity tumours in Wistar rats fed Chinese salted fish[J]. Br J Cancer, 1989, 60(2): 198-201. DOI: 10.1038/bjc.1989.250.
24.Da CV, Marques-Silva AC, Moreli ML. The Epstein-Barr virus latent membrane protein-1 (LMP1) 30-bp deletion and XhoI-polymorphism in nasopharyngeal carcinoma: a Meta-analysis of observational studies[J]. Syst Rev, 2015, 4: 46. DOI: 10.1186/s13643-015-0037-z.
25.Jin N, Li J, Jin M, et al. Spatiotemporal variation and determinants of population's PM(2.5) exposure risk in China, 1998-2017: a case study of the Beijing-Tianjin-Hebei region[J]. Environ Sci Pollut Res Int, 2020, 27(25): 31767-31777. DOI: 10.1007/s11356-020-09484-8.
26.Chen Y, Chang ET, Liu Q, et al. Occupational exposures and risk of nasopharyngeal carcinoma in a high-risk area: a population-based case-control study[J]. Cancer, 2021, 127(15): 2724-2735. DOI: 10.1002/cncr.33536.
27.Lin JH, Jiang CQ, Ho SY, et al. Smoking and nasopharyngeal carcinoma mortality: a cohort study of 101,823 adults in Guangzhou, China[J]. BMC Cancer, 2015, 15: 906. DOI: 10.1186/s12885-015-1902-9.
28.Zhang Y, Cao Y, Luo L, et al. The global, regional, and national burden of nasopharyngeal carcinoma and its attributable risk factors in 204 countries and territories, 1990-2019[J]. Acta Otolaryngol, 2022, 142(7-8): 590-609. DOI: 10.1080/00016489.2022.2111711.
29.王明君. 灰色系统理论GM(1,1)模型在青海省碘盐监测中的应用初探[J]. 医学信息, 2023, 36(2): 24-27. [Wang MJ. Preliminary application of grey system theory GM(1,1) model in iodine salt monitoring in Qinghai Province[J]. Journal of Medical Information, 2023, 36(2): 24-27.] DOI: 10.3969/j.issn.1006-1959.2023.02.004.
30.Wang YW, Shen ZZ, Jiang Y. Comparison of ARIMA and GM(1,1) models for prediction of hepatitis B in China[J]. PLoS One, 2018, 9(13): e201987. DOI: 10.1371/journal.pone.0201987.
31.侯晓澈. 利用灰色GM(1,1)模型预测某三甲医院消化内科住院患者医院感染发生率[J]. 中国消毒学杂志, 2020, 37(3): 207-209. [Hou XC. Prediction of hospital infection incidence rate among gastroenterology inpatients in a tertiary hospital using GM(1,1) grey model[J]. Chinese Journal of Disinfection, 2020, 37(3): 207-209.] DOI: 10.11726/j.issn.1001- 7658.2020.03.017.
32.石雷. 辽阳市肺结核病流行趋势的灰色模型分析[J]. 中国热带医学, 2010, 10(4): 429-430. [Shi L. Grey model analysis of tuberculosis epidemic trend in Liaoyang City[J]. Chinese Journal of Tropical Medicine, 2010, 10(4): 429-430.] https://d.wanfangdata.com.cn/periodical/ChVQZXJpb2RpY2FsQ0hJMjAyNTA2MjISD3pncmR5eDIwMTAwNDAxOBoIaXRtdnBvaGI%3D
33.宋媛媛, 王雷, 熊甜, 等. ARIMA模型与GM(1,1)模型在痢疾发病数预测中的比较研究[J]. 实用预防医学, 2019, 26(7): 888-892. [Song YY, Wang L, Xiong T, et al. Comparative study of ARIMA and GM(1,1) models in predicting the incidence of dysentery[J]. Practical Preventive Medicine, 2019, 26(7): 888-892.] DOI: 10.3969/j.issn.1006-3110.2019.07.034.