输血是临床常用的辅助治疗方法,在遭遇创伤、产后大量失血、实施手术,以及开展血液病相关治疗时,输血是必不可少的治疗手段之一。现阶段,血液资源的获取仅能依靠健康个体自愿无偿捐献,尚无其他等效供应方式。据国家卫生健康委统计数据[1]显示,近二十年我国无偿献血的参与人次及献血总量呈上升态势;我国每千人口献血率由1998年的4.8‰大幅跃升至2023年的12.2‰,已超出世界卫生组织建议的10‰标准线。然而,考虑到我国庞大的人口基数,参与无偿献血的人群占比依旧有限,血液资源稀缺的状况依旧不容小觑。
红细胞是人体血液中含量最高的血细胞类型,具有运输氧气和二氧化碳的功能。红细胞输注是患者治疗甚至挽救生命的重要手段之一,为避免红细胞制品的资源浪费和供应不足,制定有效的红细胞采供平衡计划,科学合理地估测红细胞制品的使用量尤为重要[2- 3]。国务院办公厅印发的《“十四五”国民健康规划》将提升血液供应保障能力作为加快补齐医疗服务短板的重要方向。目前芜湖市临床红细胞用量需求预测主要依赖血站工作人员的经验估算,科学性和准确性存在较大局限。ARIMA(autoregressive integrated moving average)模型又称差分自回归移动平均模型,是由George Box和Gwilym Jenkins于上世纪70年代初提出的著名时间序列预测方法,已被广泛应用于疾病发展趋势或发展情况[4-6]、传染病 [7- 8]、金融和经济[9-10]等方面的预测,且具有良好的预测效果。基于此,本研究拟运用ARIMA模型对芜湖市红细胞临床用量进行预测模型构建并检验模型预测效果,以期在全面了解临床血液用量的基础上,实现血液资源的整合与合理调配,科学指导血液的采集和供应。
1 资料与方法
1.1 数据来源
获取芜湖市中心血站2012年1月至2022年8月红细胞出库记录,以月为单位进行整理统计,未涉及献血者隐私和身份信息,豁免伦理审查。临床红细胞用量以单位(U)计算,1 U红细胞类成分血由200 mL全血分离制备。以2012年1月至2021年12月数据作为训练集,2022年1月至2022年8月数据作为测试集。
1.2 ARIMA模型构建
模型公式为SARIMA(p,d,q)(P,D,Q) s,其中p、d、q分别表示时间序列的自回归阶数、差分阶数和移动平均阶数,P、D、Q分别表示季节自回归阶数、季节差分阶数、季节移动平均阶数,s表示周期。
模型建立过程包括以下四个步骤:①时间序列平稳化检验和处理:使用训练集数据绘制原始时间序列图,观察数据是否有明显趋势变化,应用单位根检验(augmented dickey-fuller test,ADF),若P<0.05,表示原始数据为平稳序列可直接进行下一步;若P>0.05,表示原始数据为非平稳序列,需通过差分或季节差分实现平稳化。②模型识别:通过自相关函数(autocorrelation function,ACF)和偏自相关函数(partial autocorrelation function,PACF)识别适合数据的模型(表1),并推断p,q,P,Q的阶数,d,D为使非平稳序列转化为平稳序列所做的差分次数。③参数检验和模型优化:利用推断出的参数确定待检测模型;根据Ljung-Box Q检验对模型残差进行白噪声检验,若P>0.05,表示为白噪声序列,模型建立有效,若P<0.05,表示为非白噪声序列,应舍弃;根据贝叶斯信息准则(Bayesian information criterion,BIC),在通过白噪声检验的诸多备选模型中选取BIC最小的模型为最优模型。④模型运用与评估:运用选择的最优模型预测测试集数据获得预测值,观察实际值在预测值95%置信区间(confidence interval,CI)的分布情况,计算相对误差、均方根误差(root mean square error,RMSE)、平均绝对百分比误差(mean absolute percentage error,MAPE)和平均绝对误差(mean absolute error,MAE),误差越小,模型拟合效果越好。
-
表格1 SARIMA模型识别释义
Table1.Explanation of the SARIMA model recognition
1.3 统计学分析
应用SPSS 26.0软件进行统计分析。2012年1月至2021年12月的红细胞临床用量数据用于ARIMA模型构建,2022年1月至2022年8月的数据用于验证模型的预测效果。利用SPSSPRO系统进行ADF检验,检验水准为P <0.05。
2 结果
2.1 时间序列平稳化处理
基于训练集数据建立原始时间序列图(图 1-A),红细胞临床用量整体呈上升趋势,每年均出现上下波动情况,高峰时期集中在3 至5月、7月、11至12月,低峰时期集中在1至2月、6月、8至10月,呈现明显的季节周期变化和双峰分布。经ADF检验,原始时间序列(t=0.783,P=0.991)为非平稳序列,为消除原始数列趋势和季节性周期变化带来的影响,本研究进行了差分处理。经时间序列平稳化处理和ADF检验,显示处理后的红细胞临床用量序列(t=-3.3,P=0.015)为相对平稳的序列(图 1-B)。
-
图1 2012—2021年红细胞临床用量时间序列图
Figure1.Time series plot of clinical usage of red blood cells from 2012 to 2021
注:A.原始时间序列图;B.差分和周期调整后序列图。
2.2 模型识别和参数确定
因原始时间序列有季节性周期性,经1次季节差分和非季节差分后数据趋于平稳,结合差分后平稳序列的ACF图和PACF图可知,两者均拖尾。根据模型确定条件可知,可建立季节性ARIMA模型SARIMA(p,d,q)(P,D,Q) s,其中d=1,D=1;研究数据为月度序列且观测到以年为单位的周期性波动,故s= 12。观察ACF图(图2-A)和PACF图(图 2-B),p、q值均从0、1、2中选取;而参数P和Q较难判断,取值通常为0~2,从低阶到高阶逐步尝试,由此建立待选模型。
-
图2 原始序列一阶差分和一阶季节差分后模型识别图
Figure2.Plot of the original series after first-order difference and first-order seasonal difference
注:A.ACF图;B.PACF图。
2.3 模型检验与优化
根据Ljung-Box Q方法、残差序列的ACF图和PACF图进行白噪声检验,从备选模型中选取BIC最小者,最终选取模型ARIMA(0,1,0)(1,1,0)12,BIC=12.162,R2=0.758,残差序列的ACF和PACF均基本落在95%CI内。Ljung-Box Q=15.265,P=0.576>0.05,符合白噪声序列。使用SPSS 26.0软件中的专家建模器模块进行验证,专家建模器推荐模型ARIMA(0,1,1)(0,1,1)12,BIC=12.282,R2=0.515。两者相比,前者BIC、RMSE、MAE和MAPE值均较小,平稳R2较大,因此确定最优模型为ARIMA(0,1,0)(1,1,0)12(表2、图3)。
-
表格2 备选模型的参数估计和残差白噪声检验
Table2.Parameter estimation for alternative models and white noise test for residuals
注:模型1为ARIMA(0,1,0)(1,1,0)12;模型2为ARIMA(0,1,1)(0,1,1)12。
-
图3 模型残差ACF和PACF图
Figure3.Plots of the ACF and PACF of model residuals
2.4 模型预测与评价
运用筛选的最佳模型ARIMA(0,1,0)(1,1,0) 12预测2022年1月至2022年8月的红细胞临床用量,模型拟合结果见图4,观测值与拟合值曲线趋势基本相同,各月实际值除4月和5月外均在预测值95%CI内,模型拟合情况较好。将预测值与2022年1至8月红细胞临床用量实际值相比,平均相对误差为-0.003 75,ARIMA模型预测值与实际值的MAPE为7.087%(10%以内)(表3),表明该模型具有较好的预测拟合性。
-
图4 实际值与预测值比较图
Figure4.Comparison of actual values with projections
-
表格3 2022年1月至2022年8月预测结果
Table3.January 2022-August 2022 forecast results
3 讨论
红细胞是人体血液的核心组分,是输送氧气、二氧化碳的关键载体。国家卫生健康委印发的《全国血站服务体系建设发展规划(2021—2025年)》中,明确要求采供血机构应按照“平急结合、补齐短板”的原则,加强血液应急能力建设,提高血液应急保障能力[11]。科学预测红细胞临床用量有利于合理规划红细胞采集储存和制定红细胞采供计划,避免血液制品囤积报废或临床用血供应不足。ARIMA模型数据收集简单、适用性强、预测精确度高,不仅能分析季节及周期性变动,还可反映时间序列的变化规律,易于实际工作应用 [12-13]。既往研究表明,ARIMA模型有助于科学制定采血计划,指导血液供需平衡 ,其预测精度及效果优于其他模型[14-16]。
如东莞市中心血站基于2006—2011年临床红细胞用量建立预测模型,对2012年前5个月的红细胞实际用量进行模型检验,结果显示预测值和实际值拟合效果较好,相对误差较小 [17]。苏州市中心血站基于2009—2019年红细胞用量构建ARIMA模型,预测2020年1至11月的红细胞临床用量,结果发现预测值与实际值曲线趋势基本相同,相对误差为8.21%,模型预测效果较好[18]。儿童患者血容量少、病情转变迅速,输血需求较为急切,还易出现输血不良反应。鉴于此,儿科输血工作较成人输血更为复杂 [19]。杨媛淇等[15]探讨ARIMA模型用于预测儿科悬浮红细胞用量的可行性,发现儿童用血具有明显季节和周期规律,最优模型ARIMA(0,1,1)(0,1,1)12能较好拟合儿科悬浮红细胞用量的变化趋势,进而为儿童医院临床血液储备计划制定提供依据。Pereira 等[20]针对临床红细胞需求量的预测拟合效果,对 ARIMA、Holt - Winters 指数平滑模型、神经网络三种时间序列方法展开了对比分析,结果显示ARIMA模型对红细胞短期需求预测的效果最为理想。
本研究采用ARIMA模型对芜湖市2012—2021年每月红细胞用量进行分析,结果显示,ARIMA(0,1,0)(1,1,0)12模型拟合效果良好,运用该模型对2022年1至8月每月红细胞需求进行预测,结果发现预测值与实际值变化趋势基本一致。现有研究证实,若ARIMA模型预测值与实际值之间平均相对误差<10%,说明模型具有较高的预测精准性,预测效果较好 [21- 23]。本研究构建的模型数据符合上述标准,其中ARIMA(0,1,0)(1,1,0)12模型可用于芜湖地区未来红细胞临床用量预测。
自体输血具有避免经血传播疾病,预防因异体输血产生免疫反应所致的溶血、发热、过敏等,并有刺激红细胞再生,增强患者术后造血功能的作用[24-25]。为防止资源浪费和免疫反应,临床可结合红细胞临床用量预测结果,采取自体输血的方式缓解用血压力。此外,招募更多的献血志愿者对保障安全充足的血液供应十分必要。陈娟等 [26]基于机器学习算法,对江苏省血液中心2017—2022年的献血者进行回顾性研究,建立精准识别模型,对高意愿献血者招募成功率提升57.79%。基于本研究结果,芜湖市采血机构未来可从采血计划、献血者招募策略和库存管理三个方面优化采供平衡方案。首先,可根据不同季节红细胞需求量动态调整采血计划,确保血液供应的平衡。在需求高峰期(如3至5月、11至12月)增加采血量,而在需求低谷期(如1至2月、6月)适当减少采血量,避免血液资源的浪费。其次,根据预测结果,采血机构可制定针对性的志愿者招募策略。如在需求高峰期加大宣传力度,提高献血认知水平、强化主观规范,吸引更多献血者参与无偿献血;同时,针对特定群体(如大学生、企事业单位员工)开展定向招募活动,制定激励措施,提高献血者的参与率。再者,血站可优化红细胞制品的库存管理,确保库存量在满足临床需求的同时避免过期浪费,如在需求高峰期提前储备足够的红细胞制品,而在需求低谷期适当减少库存量,确保血液资源的高效利用。
本研究存在一定局限性。首先,ARIMA模型主要依赖历史数据的趋势和季节性变化,对于突发的外部因素(如公共卫生事件、政策变化等)无法有效捕捉,可能导致预测值与实际值之间存在偏差。其次,模型的预测精度受数据质量和数量的限制,若数据量不足或存在异常值,可能会影响模型的拟合效果。因此,未来研究可考虑结合其他预测模型(如机器学习模型)或引入更多外部变量,以提高预测的准确性。
综上所述,基于ARIMA模型建立红细胞临床用量需求预测模型,有助于科学制定采血计划,提高血液供给及需求之间的契合度,使红细胞成分制品既能满足临床需求,又能避免过期浪费。后续研究将进一步深挖影响临床用血需求的各类因素,如人口结构、疾病特性、医疗水准及医院床位数等,同时探究不同时间周期、不同血型和不同年龄段人群的预测可行性及准确性。
伦理声明:不适用
作者贡献:研究设计与指导:蒋青青;研究实施、数据收集:杨旭;数据分析、图像处理:刘舒琦;查阅文献、论文撰写:黄慧、陈秀兰;论文修改:楼依玲;论文审定:曹世义
数据获取:本研究中使用和(或)分析的数据可联系通信作者获取
利益冲突声明:无
致谢:不适用
1.新华社. 我国献血人次创新高, 无偿献血激励机制再优化 [EB/OL]. (2024-06-14) [2025-1-9]. https://www.gov.cn/yaowen/liebiao/202406/content_6957279.htm
2.谢丽娟,郑敏,陈剑羽. 基于ARIMA模型的血液制剂使用量时间预测模型的建立与应用[J]. 现代医药卫生, 2020, 36(24): 4047-4051. [Xie LJ, Zheng M, Chen JY. Establishment and application of time prediction model of blood preparation usage based on ARIMA model[J]. Journal of Modern Medicine & Health, 2020, 36(24): 4047-4051.] DOI: 10.3969/j.issn.1009-5519.2020.24.054.
3.周世航,王霓,刘铭,等. 贮存时间对红细胞非典型趋化因子受体1清除及储存趋化因子的影响[J]. 中国输血杂志, 2022, 35(11): 1113-1116. [Zhou SH, Wang N, Liu M, et al. Effect of storage time on erythrocyte atypical chemokine receptor 1 clearance and stored chemokines[J]. Chinese Journal of Blood Transfusion, 2022, 35(11): 1113-1116.] DOI: 10.13303/j.cjbt.issn.1004-549x.2022.11.005.
4.陆诗阳,李银红,田玉洁,等. 基于ARIMA模型的地区武装冲突期间埃博拉病毒病疫情发展趋势预测[J]. 军事医学, 2023, 47(6): 417-421, 426. [Lu SY, Li YH, Tian YJ, et al. Prediction of Ebola virus disease epidemic trend during regional armed conflict based on ARIMA model[J]. Military Medicine, 2023, 47(6): 417-421, 426.] DOI: 10.7644/j.issn.1674-9960. 2023.06.004.
5.李平,黄澳迪,包黎明,等. 基于ARIMA乘积季节模型的中国流行性腮腺炎发病趋势预测分析[J]. 中国疫苗和免疫, 2023, 29(2): 174-179. [Li P, Huang AD, Bao LM, et al. Predictive analysis of mumps incidence trend in China based on ARIMA product seasonal model[J]. China Vaccine and Immunization, 2023, 29(2): 174-179.] DOI: 10.19914/j.CJVI.2023030.
6.任飞林,刘小琦,金玫华,等. 季节性差分自回归滑动平均模型对肺结核发病情况的预测效果研究[J]. 中国防痨杂志, 2023, 45(5): 514-519. [Ren FL, Liu XQ, Jin MH, et al. Study on the predictive effect of seasonal differential autoregressive sliding average model on the incidence of tuberculosis[J]. Chinese Journal of Antituberculosis, 2023, 45(5): 514-519.] DOI: 10.19982/j.issn.1000-6621.20220517.
7.Song X, Xiao J, Deng J, et al. Time series analysis of influenza incidence in Chinese provinces from 2004 to 2011[J]. Medicine (Baltimore), 2016, 95(26): e3929. DOI: 10.1097/md.0000000000003929.
8.Zhou L, Xia J, Yu L, et al. Using a hybrid model to forecast the prevalence of schistosomiasis in humans[J]. Int J Environ Res Public Health, 2016, 13(4): 355. DOI: 10.3390/ijerph13040355.
9.Omar H, Hoang VH, Liu DR. A hybrid neural network model for sales forecasting based on ARIMA and search popularity of article titles[J]. Comput Intell Neurosci, 2016, 2016: 9656453. DOI: 10.1155/2016/9656453.
10.Qiu MY, Song Y. Predicting the direction of stock market index movement using an optimized artificial neural network model[J]. PLoS One, 2016, 11(5): e0155133. DOI: 10.1371/journal.pone.0155133.
11.国家卫生健康委. 国家卫生健康委关于印发《全国血站服务体系建设发展规划(2021—2025年)》的通知[EB/OL]. (2021-12-30) [2025-10-20]. https://www.nhc.gov.cn/yzygj/c100068/202112/8eaf17478aa84dec892c951763877f90.shtml
12.刘芸男,彭荣荣,杨冬燕,等. ARIMA模型在临床红细胞需求预测中的应用[J]. 安徽医科大学学报, 2019, 54(10): 1611-1615. [Liu YN, Peng RR, Yang DY, et al. Application of ARIMA model in clinical red blood cell demand prediction[J]. Journal of Anhui Medical University, 2019, 54(10): 1611-1615.] DOI: 10.19405/j.cnki.issn1000-1492.2019.10.023.
13.张永鹏,席光湘,洪缨,等. 时间序列在辐照单采血小板供应管理上的应用分析[J]. 中国输血杂志, 2020, 33(9): 975-977. [Zhang YP, Xi GX, Hong Y, et al. Application analysis of time series in the management of irradiated single platelet supply[J]. Chinese Journal of Blood Transfusion, 2020, 33(9): 975-977.] DOI: 10.13303/j.cjbt.issn.1004-549x.2020.09.031.
14.刘妍妍,樊晶. ARIMA模型在多种成分血拟合供血预测中的研究[J]. 中国输血杂志, 2021, 34(7): 759-763. [Liu YY, Fan J. ARIMA model in blood supply prediction of multi blood components[J]. Chinese Journal of Blood Transfusion, 2021, 34(7): 759-763.] DOI: 10.13303/j.cjbt.issn.1004-549x.2021.07.022.
15.杨媛淇,何柏霖,温普生,等. ARIMA模型在儿科红细胞用量预测中的应用[J]. 中国输血杂志, 2023, 36(9): 822-826. [Yang YQ, He BL, Wen PS, et al. Application of ARIMA model in predicting red blood cell dosage in pediatrics[J]. Chinese Journal of Blood Transfusion, 2023, 36(9): 822-826.] DOI: 10.13303/j.cjbt.issn.1004-549x.2023.09.016.
16.Fanoodi B, Malmir B, Jahantigh FF. Reducing demand uncertainty in the platelet supply chain through artificial neural networks and ARIMA models[J]. Comput Biol Med, 2019, 113: 103415. DOI: 10.1016/j.compbiomed.2019.103415.
17.叶柱江,刘赴平. 时间序列自回归移动平均模型在临床红细胞用量预测中的应用[J]. 中国输血杂志, 2013, 26(2): 131-134. [Ye ZJ, Liu FP. Application of autoregressive integrated moving average model in predicting the clinical use of red blood cells [J]. Chinese Journal of Blood Transfusion, 2013, 26(2): 131-134.] DOI: 10.13303/j.cjbt.issn.1004-549x.2013.02.038.
18.谢淑红,张思静,严伟斌,等. 基于ARIMA模型的临床红细胞类血液需求预测研究[J]. 蚌埠医学院学报, 2023, 48(5): 633-636. [Xie SH, Zhang SJ, Yan WB, et al. Research on the prediction of clinical red blood cell blood demand based on the ARIMA model [J]. Journal of Bengbu Medical College, 2023, 48(5): 633-636.] DOI: 10.13898/j.cnki.issn.1000-2200.2023.05.019.
19.黄雪原,黄蓉,董航,等. 基于循证医学证据的《儿科输血指南》构建流程——以新生儿溶血病换血治疗的最佳换血量为例[J]. 中国临床新医学, 2022, 15(8): 694-700. [Huang XY, Huang R, Dong H, et al. The construction process of Guideline for Pediatric Transfusion based on evidence?based medicine—taking the optimal exchange transfusion volume for neonatal hemolytic disease as an example[J]. Chinese Journal of New Clinical Medicine, 2022, 15(8): 694-700.] DOI: 10.3969/j.issn.1674 - 3806.2022.08.05.
20.Pereira A. Performance of time-series methods in forecasting the demand for red blood cell transfusion[J]. Transfusion, 2004, 44(5): 739-746. DOI: 10.1111/j.1537-2995.2004.03363.x.
21.张雪佩,周林,刘敏,等. ARIMA乘积季节模型在食源性疾病月发病数预测中的应用[J]. 公共卫生与预防医学, 2024, 35(5): 6-9. [Zhang XP, Zhou L, Liu M, et al. Application of seasonal ARIMA model in predicting the monthly incidence of foodborne diseases[J]. Journal of Public Health and Preventive Medicine, 2024, 35(5): 6-9.] DOI: 10.3969/j.issn.1006-2483.2024.05.002.
22.黄国军,王乐三,张统宇,等. 自回归滑动平均混合模型在红细胞供应量预测中的应用[J]. 中国输血杂志, 2016, 29(2): 140-144. [Huang GJ, Wang LS, Zhang TY, et al. Autoregressive integrated moving average model and its application in prediction of red blood cell supply[J]. Chinese Journal of Blood Transfusion, 2016, 29(2): 140-144.] DOI: 10.13303/j.cjbt.issn.1004-549x.2016.02.006.
23.Wang M, Jiang Z, You M, et al. An autoregressive integrated moving average model for predicting varicella outbreaks - China, 2019[J]. China CDC Wkly, 2023, 5(31): 698-702. DOI: 10.46234/ccdcw2023.134.
24.龙小琼,吴建君,赵树铭. 三氧自体输血的临床应用进展 [J].中国输血杂志, 2023, 36(2): 108-111. [Long XQ, Wu JJ, Zhao SM. Progress in clinical application of autologous ozonized blood transfusion[J]. Chinese Journal of Blood Transfusion, 2023, 36(2): 108-111.] DOI: 10.13303/j.cjbt.issn.1004-549x.2023.02.004.
25.赵娜,徐铭军. 产科回收式自体输血技术应用进展[J].中国临床医生杂志, 2024, 52(3): 265-270. [Zhao N, Xu MJ. Progress in the application of intraoperative autologous blood salvage technology in obstetrics [J]. Chinese Journal for Clinicians, 2024, 52(3): 265-270.] DOI: 10.3969/j.issn.2095-8552.2024.03.004.
26.陈娟,赵作彦,田金玥,等. 基于机器学习的南京地区献血者精准招募方法的建立和应用[J].临床输血与检验, 2024, 26(4): 535-543. [Chen J, Zhao ZY, Tian JY, et al. Machine learning-based development and application of a precise blood donor recruitment strategy in Nanjing[J]. Journal of Clinical Transfusion and Laboratory Medicine, 2024, 26(4): 535-543.] DOI: 10.3969/j.issn.1671-2587.2024.04.018.