在计算机辅助临床决策和实践中,现行临床实践指南的可读性和可操作性存在诸多不足。通过对指南的结构、知识及知识间的关系进行规范化的表示,发掘指南通用性的结构框架;通过建模表证,促进指南知识的标准化、规范化表达,构建便于共享和可移植的标准化指南知识库,有利于满足临床决策支持系统发展的需要,推动临床实践指南的实施和临床诊疗服务质量的提升。知识图谱的引入为指南数字智能化提供了坚实的基础,然而目前介绍指南知识图谱构建的方法学研究较为罕有。本研究以《中国非肌层浸润性膀胱癌治疗与监测循证临床实践指南(2018年标准版)》的知识图谱构建为例,通过梳理指南模块,解析指南基本信息、背景和方法内容范围,结合专家意见设置各概念间的层级关系,根据多级概念层及概念实例设计概念结构表,调整概念间的关系结构,并改进实体与实体间的关系。本文旨在探讨指南中基本信息、背景和方法部分的建模和表征方法,以期为今后其他临床实践指南的知识图谱构建提供参考。
首页在线期刊2022年 第32卷,第6期详情
临床实践指南实施性促进研究之六:临床实践指南知识图谱构建中关于基本信息、背景和方法的建模表征研究
发表时间:2022年12月25日阅读量:4134次下载量:1228次下载手机版
- 摘要|Abstract
- 全文|Full-text
- 参考文献|References
摘要|Abstract
全文|Full-text
临床实践指南是针对患者的特定临床问题,基于系统评价的证据,在比较不同干预措施利弊的基础上,形成的旨在为患者提供最佳医疗服务的推荐意见[1],一般由医学组织或是政府机关发布。目前国内外针对指南数字智能化有两个关键问题:一是如何将基于自然语言的非结构化文本指南转换成基于计算机语言的结构化电子指南;二是如何进行知识抽取、表示、融合、推理和问答,使得计算机能有效理解并高效执行结构化的指南[2-4]。知识图谱是采用语义技术形式表达的系统化、结构化、集成化的特定领域知识[5]。因此,基于知识图谱技术,将指南的非结构化数据转化成图数据库以进行存储及搜索是值得研究的[6]。当前指南知识图谱的研究主要关注从临床问题到推荐意见的内容,鲜有涉及指南基本信息及方法学内容,如指南的目标人群、指南使用者、证据收集过程、推荐意见形成过程、证据质量等级与推荐意见分级标准、利益冲突等。呈现指南的基本信息及方法学内容对促进指南的客观、公正、透明具有重要作用。此外,通过知识图谱将指南的基本信息及方法学内容与指南的临床问题和推荐意见进行整合,更有利于增强知识图谱的完整性。通过对指南的结构、知识及知识间的关系进行规范化的表示,发掘指南通用性的结构框架,并通过建模表征,将纯文本的指南转换为机器可理解的结构化指南,可极大提高指南相关术语的规范性和一致性,避免不同信息源指南的语义异构,为进一步指南数据挖掘和知识服务提供基础。前期作者团队以《中国非肌层浸润性膀胱癌治疗与监测循证临床实践指南(2018年标准版)》[7]为例,通过系列文章介绍了基于该指南临床问题到推荐意见的知识图谱构建过程[8-10]。本文则基于该指南提出了指南基本信息、背景和方法在知识图谱中的建模表征方法,旨在丰富完善指南知识图谱构建,为指南数字智能化提供基础,为进一步促进指南的实施与推广提供参考。
1 设计建设阶段
1.1 对指南基本信息、背景和方法内容进行结构化组织
《中国非肌层浸润性膀胱癌治疗与监测循证临床实践指南(2018年标准版)》(以下简称为“非肌层浸润性膀胱癌指南”)包含发表文献所有要素,分别是中英文标题、摘要、关键词、背景、方法、结果、讨论、参考文献、利益冲突说明等,详情请见原文[7]。
本研究对解析出的指南基本信息、背景和方法相关内容的知识结构进行梳理、归纳,结合专家意见设置各概念间的层级关系,据此对指南基本信息、背景和方法内容进行结构化组织。
1.2 模式层(本体层)设计
1.2.1 概念结构表设计
本研究采用综合法的构建方式。模式层的设计思路及方法已在系列文章的第二篇[8]进行描述,此处不做赘述。本研究整理出非肌层浸润性膀胱癌指南中关于指南的基本信息、背景和方法相关内容对应本体的多级概念层次结构,如表1所示。其中概念的定义参考临床研究与指南相关书籍[11-13],以及医学相关本体,如生物医学研究本体(ontology for biomedical investigations,OBI)、信息工具本体(information artifact ontology,IAO)与通用医学科学本体(ontology for general medical science, OGMS),并通过多次专家咨询修订而来。
-
表格1 指南本体概念结构表(指南基本信息、背景和方法内容)Table1.Conceptual structure for guideline ontology (Basic information, background and method content of the guideline注:URL指统一资源定位符(uniform resource locator)
1.2.2 语义关系设计
实现指南结构的概念整合需使以上不同层级的概念在语义上产生关联。本研究设计了核心概念之间的主要语义关系(见表2),主要包含临床实践指南中的指南基本信息、背景、方法部分。
-
表格2 指南本体设计中语义关系表(指南基本信息、背景和方法内容部分)Table2.Semantic relationships in guideline ontology(Basic information, background and method content of the guideline)
1.3 数据层(实体和关系)构建
本研究基于三元组数据模型构建数据层,揭示指南中各类医学实体间的关联,通过链接实体,形成临床实践指南知识图谱。
例如,对于指南基本信息,实体1为“中国非肌层浸润性膀胱癌治疗与监测循证临床实践指南(2018年标准版)基本信息”,实体1所属概念为“临床实践指南基本信息”,而实体1指向实体2的关系为“出版日期” “出版社”“出版地”“状态”“指南类型”“学科分类”“中文标题”等,实体2则对应为“2019年7月”“现代泌尿外科杂志”“中国”“已出版”“疾病治疗指南”“泌尿外科学”“中国非肌层浸润性膀胱癌治疗与监测循证临床实践指南(2018年标准版)”等,实体2所属概念对应为“日期”“组织机构”“地点”“指南状态”“指南类型”“医学学科”“文本”等。指南基本信息、背景和方法内容的数据层(实体和关系)设计如表3所示。
-
表格3 三元组关系示例(指南基本信息、背景和方法内容部分)Table3.Example of a triplet relationship (Basic information, background and method content of the guideline)注:NMIBC:非肌层浸润性膀胱癌(non-muscle invasive bladder cancer);EAU:欧洲泌尿协会(European Association of Urology); # 表格中“非肌层浸润性膀胱癌指南”为《中国非肌层浸润性膀胱癌治疗与监测循证临床实践指南(2018年标准版)》”的简称,在实际的三元组关系中实体名称需写全称
1.4 知识存储和查询
基于抽取的三元组数据模型,设计导入的医学节点和关系节点,使用Python将CSV文件导入Neo4j,对数据进行存储。
若想获取所有和《中国非肌层浸润性膀胱癌治疗与监测循证临床实践指南(2018年标准版)》直接相连接的实体及相应的关系,则输入cypher语句:
match p=(:临床实践指南{name:'中国非肌层浸润性膀胱癌治疗与监测循证临床实践指南(2018年标准版)'})--( ) return p
2 实例验证阶段
随着图数据规模的日益增大,大图上的子图搜索问题变得更为重要[14]。以问题为例,后台代码演示数据库检索:
问题1:对于指南:“非肌层浸润性膀胱癌指南的发布日期?”,查询元路径是:(a:临床实践指南)-[:发布日期]->(b)。
输入cypher语句:
Match (a:`临床实践指南` {name:"中国非肌层浸润性膀胱癌治疗与监测循证临床实践指南(2018年标准版)"}) –[ ]-> ( )-[:发布日期]-> (b) return b
则可得到图1-A的结果,即非肌层浸润性膀胱癌指南的发布日期为“2019年7月”。
问题2:对于指南:“中国非肌层浸润性膀胱癌治疗与监测循证临床实践指南(2018年标准版)的证据质量与推荐意见分级标准来源是?”,查询元路径是:(a:临床实践指南)-[b:证据质量与推荐意见分级标准]->(c)。
输入cypher语句:
Match (a:`临床实践指南`) –[*]-> (b:`证据质量与推荐意见分级标准`) –[*]-> (c:URL) return c.name
则可得到图1-B的结果,即非肌层浸润性膀胱癌指南的证据质量与推荐意见分级标准是按照EAU-非肌层浸润性膀胱癌指南使用的标准进行评估的。
3 讨论
本研究以非肌层浸润性膀胱癌临床实践指南为例,提出并构建了指南知识图谱中指南的基本信息、背景和方法呈现方法,其多级概念架构及数据层(实体和关系部分)设计方法也可为其他疾病指南的知识图谱构建提供参考。本课题组在实际操作中应用多级概念层初步构建了该知识图谱,发现其可合理表达指南中的概念与语义关系。但该方法仍存在诸多不足。
首先,较少的层级结构虽然可确保输入知识图谱的数据质量,但仍需临床工作者和工程师对临床实践指南进行整理和总结。本研究主要针对指南的基本信息、背景和方法进行建模表征,在概念层设计中,考虑到与其他本体的映射,使用了统一规范的医学术语指标体系增强指南计算机化中知识表达的规范性和互操作性。对于部分语义关系设计的指向概念,综合参考和借用现有的医学本体,权衡信息涵盖粒度和实用性,某些指向概念无需进一步区分,直接使用“文本”“数字”等数值类型的属性来表示。后续需从多部不同类型的指南、临床路径和书籍中尽可能系统检索出与指南相关的不同的实例,并尽可能罗列出每个概念层下所包含的术语,讨论每个实例应该归类到哪些概念层中。若某些实例无法归类到当前的概念层中,则需考虑增加层级结构或归类到新的概念层中,且后续工作中还需参考一体化医学语言系统(Unified Medical Language System,UMLS)、医学主题词表(Medical Subject Headings,MeSH)、医学系统命名法——临床术语(Systematized Nomenclature of Medicine -- Clinical Terms,SNOMED CT)等术语集补充类和类的层级体系及添加新的概念层。
其次,语义间关系的建立也需反复推敲,后续可借鉴UMLS等语义关系网,并结合专家论证,补充或修正语义关系,包括逆向关系、继承关系和反向继承关系等。此外,概念及语义之间关系的编码组织方式也需进一步研究。
最后,在指南中方法学部分最为重要的内容之一——证据质量与推荐意见分级标准的建模表征中,对于证据质量与推荐意见分级标准类型,本研究参考GRADE及中医药相关证据质量与推荐意见分级体系,考虑不同的证据质量与推荐意见分级体系共有的特征和区别进行建模表征,两级概念层设计为依据研究设计的分级标准、依据研究设计及质量的分级标准和依据证据体的分级标准。对于相同的临床问题,在不同指南中采用不同的分级体系并同时给出了相应的证据质量等级与推荐意见,此时需通过专家论证,讨论不同体系的证据质量对应关系,如GRADE证据质量等级对应美国卫生保健和质量机构(Agency for Healthcare Research and Quality,AHRQ)中的证据质量等级,赋予相应的权重,则在多个指南的知识图谱融合中,检索相同的临床问题时,可将推荐意见按照证据质量等级高低的顺序进行排序呈现,从而体现图数据库的优势。
综上所述,本文以非肌层浸润性膀胱癌临床实践指南为例,提出的指南基本信息、背景和方法知识图谱框架设计,可以为指南数字智能化提供基础,有利于推动指南的实施、推广与传播。
参考文献|References
1.Institute of Medicine Committee on Standards for Developing Trustworthy Clinical Practice G. In: Clinical Practice Guidelines We Can Trust. edn. Edited by Graham R, Mancher M, Miller Wolman D, Greenfield S, Steinberg E. Washington (DC): National Academies Press (US) 2011.
2.Grando MA, Glasspool D, Fox J. A formal approach to the analysis of clinical computer-interpretable guideline modeling languages[J]. Artif Intell Med, 2012, 54(1): 1-13. DOI: 10.1016/j.artmed.2011.07.001.
3.Wang D, Peleg M, Tu SW, et al. Representation primitives, process models and patient data in computer-interpretable clinical practice guidelines: a literature review of guideline representation models[J]. Int J Med Inform, 2002, 68(1-3): 59-70. DOI: 10.1016/s1386-5056(02)00065-5.
4.Wang D, Peleg M, Tu SW, et al. Representation of clinical practice guidelines for computer-based implementations[J]. Stud Health Technol Inform, 2001, 84(Pt 1): 285-289. https://pubmed.ncbi.nlm.nih.gov/11604750/.
5.Nicholson DN, Greene CS. Constructing knowledge graphs and their biomedical applications[J]. Comput Struct Biotechnol J, 2020, 18: 1414-1428. DOI: 10.1016/j.csbj.2020.05.017.
6.Heen AF, Vandvik PO, Brandt L, et al. A framework for practical issues was developed to inform shared decision-making tools and clinical guidelines[J]. J Clin Epidemiol 2021, 129: 104-113. DOI: 10.1016/j.jclinepi.2020.10.002.
7.中国研究型医院学会泌尿外科学专业委员会, 中国医疗保健国际交流促进会泌尿健康促进分会, 中国医疗保健国际交流促进会循证医学分会, 等. 中国非肌层浸润性膀胱癌治疗与监测循证临床实践指南(2018年标准版) [J]. 现代泌尿外科杂志, 2019, 24(7): 516-542. [Urological Association of Chinese Research Hospital Association, Uro-Health Promotive Association of China International Exchange and Promotive Association for Medical and Health Care, Evidence-Based Medicine Chapter of China International Exchange and Promotive Association for Medical and Health Care, et al. Evidence-based clinical practice guidelines for the treatment and monitoring of non-muscular invasive bladder cancer in China (2018 Standard Edition)[J]. Journal of Modern Urology, 2019, 24(7): 516-542.] DOI: 10.3969/j.issn.1009-8291.2019.07.004.
8.王永博, 高旷, 李绪辉, 等. 临床实践指南实施性促进研究之二:基于非肌层浸润性膀胱癌指南的知识图谱框架设计[J]. 医学新知, 2021, 31(6): 419-432.[Wang YB, Gao K, Li XH, et al. Research on promotion of implementation of clinical practice guidelines (Ⅱ): framework design of knowledge graph construction based on guidelines for non-muscle invasive bladder cancer[J]. Yixue Xinzhi Zazhi, 2021, 31(6): 419-432.] DOI: 10.12173/j.issn.1004-5511.2020111058.
9.郭静, 司宜蓓, 王永博,等.临床实践指南实施性促进研究之三:中医/ 中西医结合指南知识图谱框架设计[J]. 医学新知, 2022, 32(1): 2-9. [Guo J, Si YB, Wang YB, et al. Research on the promotion of implementation of clinical practice guidelines (Ⅲ): conceptual level design of a knowledge graph for clinical guidelines for Traditional Chinese Medicine/Integrated Traditional Chinese and Western Medicine[J]. Yixue Xinzhi Zazhi, 2022, 32(1): 2-9.] DOI: 10.12173/j.issn.1004-5511.202111057.
10.司宜蓓, 郭静, 王永博,等. 临床实践指南实施性促进研究之四:中医/ 中西医结合指南知识图谱知识抽取、存储与实例展示[J]. 医学新知, 2022, 32(2): 99-107. [Si YB, Guo J, Wang YB, et al. Research on the promotion of implementation of clinical practice guidelines (IV): knowledge extraction, storage and example presentation of a knowledge garph for clinical guidelines for Traditional Chinese Medicine/Integrated Traditional Chinese and Western Medicine[J]. Yixue Xinzhi Zazhi, 2022, 32(2): 99-107.] DOI: 10.12173/j.issn.1004-5511.202112007.
11.刘续宝, 孙业桓. 临床流行病学与循证医学(第五版) [M]. 人民卫生出版社, 2018. [LiuXB, Sun YH. Clinical Epidemiology and Evidence-Based Medicine (5th Ed) [M]. People's Medical Publishing House, 2018.]
12.黄悦勤. 临床流行病学(第五版) [M]. 人民卫生出版社,2020. [Huang YQ. Clinical Epidemiology (5th edition) [M]. People's Medical Publishing House, 2020.]
13.陈耀龙. GRADE在系统评价和实践指南中的应用(第二版)[M]. 中国协和医科大学出版社,2021. [Chen YL.Application of GRADE in systematic review and practice guidelines (second edition) [M]. Peking Union Medical University Press, 2021.]
14.Zhang LY, Yin HF. A Knowledge Graph Query Algorithm Based on OAN[J]. Software, 2018, 39(1): 54-59. https://xueshu.baidu.com/usercenter/paper/show?paperid=1d3906d0hx620gs0vx0q0pc001340187&site=xueshu_se.
热门文章
-
热淋清颗粒治疗尿路感染的多中心、开放性、Ⅳ期临床研究
2024年07月30日3026
-
“AI+教育”时代背景下医学实践课程教学模式现状与改革趋势
2024年08月31日2531
-
1990—2021年我国慢性肾脏病疾病负担及其危险因素分析
2024年09月30日2476
-
基于人工智能LLM技术的虚拟患者系统构建与临床教学应用
2024年07月30日1881
-
膝骨关节炎患者下肢表面肌电信号特征及其运动康复的研究进展
2024年08月31日1877
-
1990—2019年中国出生窒息/创伤所致新生儿脑病疾病负担分析
2024年08月31日1757
-
CD24在肿瘤微环境中的作用及治疗研究进展
2024年08月31日1681
-
长期卧床老年患者营养不良危险因素及风险预测模型构建
2024年08月31日1652