XGboost prediction model for osteoarthritis risk based on community big data
-
摘要:
目的 探索社区医疗大数据和机器学习模型构建骨关节炎风险预警模型,为社区骨关节炎的早期预警提供定量工具,以期为老年人骨关节炎防治提供更高效的管理方法。 方法 集成2019年1月1日—12月31日上海6家社区卫生服务中心2019年健康档案、健康体检和诊疗数据形成包含4万多个样本和126个变量的原始数据库,经过数据预处理和复合特征选择筛选入模特征,采用XGBoost算法构建骨关节炎患者风险评估模型。 结果 本研究筛选纳入模型14个,包括饮食是否荤素均衡、身高、体重、BMI、每次锻炼时间、总胆固醇、高密度脂蛋白、低密度脂蛋白、是否患有高血压、是否有肢体外伤等。其中重要性排名前5位的特征因素分别为高密度脂蛋白、总胆固醇、BMI、低密度脂蛋白、饮酒频率,其特征重要度均超过0.1。以“是否骨关节炎”作为输出变量,特征工程筛选后的14个特征作为输入变量,构建骨关节炎风险评估的XGBoost模型,采用8折交叉验证的方法训练后,在测试集上验证模型准确率为92%,精确率为71%,召回率为65%,F1_score为0.68,AUC达到0.82,KS值为0.48。 结论 本研究采用社区医疗大数据构建了骨关节炎风险预警模型,模型的整体拟合度和特征合理性较好,为社区骨关节炎的早期预警提供了工具,有利于社区骨关节炎的早诊早治。 Abstract:Objective To explore the construction of osteoarthritis risk warning model by community medical big data and machine learning model, provide a quantitative tool for the early warning of osteoarthritis in the community, to provide an efficient management method for the prevention and treatment of osteoarthritis in the elderly. Methods The data of health records, health examinations and diagnosis and treatment data of six community health service centres in Shanghai from January 1, 2019 to December 31, 2019, were integrated to form an original database containing more than 40 000 samples and 126 variables. After data pre-processing and compound feature selection to screen the model characteristics, the XGBoost algorithm was used to construct a risk assessment model for osteoarthritis patients. Results Fourteen characteristics were screened in this study: diet with balanced meat and vegetables, height, weight, body mass index (BMI), time of each exercise, total cholesterol, high-density lipoprotein, low-density lipoprotein, hypertension, limb trauma, etc. High-density lipoprotein, total cholesterol, BMI, low-density lipoprotein and frequency of drinking were the top five characteristic factors in importance ranking, and their characteristic importance was more than 0.1. The XGBoost model of osteoarthritis risk assessment was constructed with 'osteoarthritis' as the output variable, and 14 features were screened by feature engineering as the input variable. After the XGBoost model was trained by eightfold cross-validation, the model was validated on the test set with an accuracy rate of 92%, a precision rate of 71% and recall rate of 65%, F1_score was 0.68, the area under the receiver operating characteristic curve reached 0.82, and the KS value was 0.48. Conclusion In this study, a risk warning model of osteoarthritis is constructed using community medical big data, and the overall fit and feature rationality of the model are good, which provides a tool for the early warning of osteoarthritis in the community and is conducive to the early diagnosis and treatment of osteoarthritis in the community. -
Key words:
- Community /
- Osteoarthritis /
- Risk prediction /
- Big data
-
骨关节炎(osteoarthritis,OA)是一种临床多见、发病周期慢、致残性高、不可逆性的关节病变,以中老年患者多见,60岁以上人群患病率可达50%,75岁以上人群则达到80%,前期预防是最有效果的干预措施[1]。然而我国骨关节炎患者对骨关节炎缺乏早期防治意识,一般在身体有了明显异常症状之后选择就诊,91.6%的患者在出现关节疼痛时才就诊,因此亟需对社区层面的骨关节炎风险进行准确评估和预警[2-3]。
现阶段关于骨关节炎风险预警的研究大多建立在专家知识和实践经验基础上,利用meta分析和指标评分进行评价[4-5];部分研究采用定量方法分析骨关节炎的危险因素及其重要性[6-7],但因样本量较小,且疾病风险评估模型多采用一般统计学回归模型方法进行建模分析,其适用性和预测结果存在局限性[8]。而以机器学习为代表的大数据分析方法对疾病风险预测能够有效解决模型的覆盖面和实用性的问题[9-10]。基本机器学习的方法主要包括决策树、逻辑回归、支持向量机、贝叶斯学习等,随着机器学习的发展,集成学习和深度学习成为主流[11]。极端梯度提升(eXtreme Gradient Boosting,XGBoost)是基于梯度提升(Boosting)树的集成学习法,可处理复杂数据变量交互和共线问题[12]。
本研究采用社区多中心的真实世界大数据,运用XGBoost集成学习算法构建基于社区大数据的签约居民骨关节炎患病风险预警模型,提高对骨关节炎预测的准确度及灵敏度,以此作为慢病防治理念与社区卫生服务内涵的契合点,建立以社区为平台的骨关节炎风险预警体系,从而降低骨关节炎发病率,及时控制病程进展。
1. 资料与方法
1.1 资料来源
本研究数据来源于2019年1月1日—12月31日上海6家社区卫生服务中心居民健康档案系统、健康体检系统、医院HIS系统,包括基本信息、饮食习惯、生活习惯、查体信息、检验信息、影像学检查结果、患病情况等7个方面。
在数据抽取和集成过程中由于不同医疗机构的字段命名有所差异,不同的系统间存在重复的字段,因此本研究首先按照统一的字段命名标准对不同机构和系统的数据进行标化,按照统一的名称和格式对各类数据进行集成和合并,最终形成了包含4万多个样本和126个变量的原始数据库。
1.2 数据预处理
1.2.1 变量剔除
对于缺失值比例超过20%的变量整体剔除;对于某些分类变量,如果其中某个类别数目构成比超过95%则予以剔除;对于按业务逻辑与骨关节炎关系完全不可解释的变量予以剔除。
1.2.2 变量衍生
对于变量值包含多个内容的文本变量通过自然语言处理进行变量拆分,便于后期数据处理分析及结果解释;例如从“症状”变量中衍生出“是否水肿”“是否关节疼痛”“是否活动障碍”等变量。
1.2.3 异常值清除
基于原始数据质量分析结果,结合医学专业知识对各变量范围进行界定,对所有变量值表示格式进行规范,在此基础上判断变量值是否异常并剔除异常值。
1.2.4 缺失值填补
根据不同变量缺失量及变量自身特点不同,决定采用均值填补、众数填补、空值、业务填补等不同方式处理。例如用相似样本的均值来填补缺失值,用另外的机器学习方法来预测缺失值;直接丢掉有缺失值的样本。
1.2.5 数据分箱
对连续变量离散化,将多状态的离散变量合并成少状态,特征离散化后模型会更稳定,降低了模型过拟合的风险,易于模型的快速迭代。采用业务设定分箱和决策树分箱两步:第一步先根据变量是否有医学意义的区间,对于特征有明确分级区间的变量,按照专业概念对特征分箱,第二步采用决策树算法根据数据分布进行分箱。
经过数据预处理最终形成了包含40 261个样本和93个变量的特征选择数据库。
1.3 特征选择
目前,特征选择的方法可分为过滤式、嵌入式和封装式3类[13]。首先,过滤式主要按照发散性或者相关性对各个特征进行评分,设定阈值选择特征,独立于模型算法之外,具有较好的灵活性,但精确度较低。嵌入式先使用某些算法和模型进行训练,得到各个特征的权值系数,根据系数从大到小选择特征,这是相对快速且具有较优泛化性能的方法。封装式算法主要是基于某个基准模型的多轮迭代选择最优特征子集,但大量的搜索空间导致高计算复杂度,且该方法通用性有限。本研究采用过滤式和嵌入式相结合的方式进行特征选择。
1.3.1 过滤式特征选择
对所有离散变量(连续型变量已分箱)根据因变量计算证据权重(weight of evidence, WOE)和信息量(information value, IV),将IV从大到小进行排序,根据变量IV值选择>0.02的特征变量,IV值用来衡量变量预测能力的,IV值越大,表示该变量的预测能力越强;对所有离散变量使用Kendall相关系数计算自变量的相关性,选择自变量相关系数绝对值>0.65,如果≤0.65则剔除两两比较特征变量中IV值比较低的自变量。
1.3.2 嵌入式特征选择
在上一步过滤式特征筛选后的变量基础上,采用随机森林算法进行特征选择,评估每个特征在随机森林中的每棵树上的平均贡献度,最后比较不同特征之间的贡献大小,通过阈值判断特征是否保留。本研究首先通过随机森林算法和模型进行训练得到所有变量的特征贡献度,从低到高排列划分成n个阈值区间,按照不同的阈值区间筛选特征重新训练,循环计算所有阈值区间对应特征的交叉验证分数,找到对应交叉验证分数最高的值对应的阈值,作为特征选择的阈值,重要性低于这个阈值的特征都将被删除。
1.4 预警模型
1.4.1 模型算法
GBDT全称梯度下降树(gradient boosting decision tree),在机器学习集成算法里面是对真实分布拟合的最好的几种算法之一,通过降低偏差来不断提高最终分类器的精度。但GBDT的每一步优化均依赖于上一步的误差,大数据量处理速度较慢。XGBoost是GBDT算法的一种优化,使用梯度上升框架,适用于分类和回归。XGBoost的优点是通过并行处理加快训练速度;通过正则化减少过拟合提升训练效果;支持自定义损失函数、优化目标和评价标准等。XGBoost核心算法在于目标函数,目标函数共分两大项,前一项是每个样本的损失和,XGBoost的损失函数是可以自定义的,并且其自带的损失函数也有很多种;第二项是正则项,包含2个部分,一个是对树进行制约,另一个是对叶子节点进行制约,均能够避免过拟合[14]。
1.4.2 评价指标
(1) 准确率(accuracy):评价分类问题的性能指标一般是分类准确率,即对于给定的数据,分类正确的样本数占总样本数的比例。(2)F1-Score:对于二分类问题常用的评价指标是精确率(precision)和召回率(recall)。精确率是指在预测为正类的样本中真正类所占的比例,召回率是指在所有的正类中被预测为正类的比例。但是精确率和召回率是一对相互矛盾的量,一般使用F1-Score作为评价标准来衡量分类器的综合性能,是精确率和召回率二者调和平均,取值范围为[0, 1]。F1=2×精确率×召回率/(精确率+召回率)。(3)ROC曲线和AUC:使用FPR作为横坐标,TPR作为纵坐标得到ROC曲线,ROC曲线越靠近左上角,该分类器的性能越好。AUC为ROC曲线下面积,取值范围为[0, 1],AUC的面积越大,分类效果越好。(4)KS(Kolmogorov-Smirnov)指标:KS是模型区分度评价指标,通过衡量好坏样本累计分布之间的差值,来评估模型的风险区分能力。KS值的取值范围为[0, 1],通常>0.2说明模型有一定的区分能力,一般情况下KS≤0.75。
2. 结果
2.1 特征选择结果
40 261个样本中患有骨关节炎的数量为3 297个,骨关节炎的患病率为8.9%。经过过滤式特征选择和嵌入式特征选择后,筛选纳入的模型为14个,包括性别、年龄、吸烟情况(吸烟≥1支/d,连续或累计吸烟≥6个月定义为吸烟)、饮酒情况(每周饮酒至少4 d,且每次饮入乙醇含量≥50 g)、饮食是否荤素均衡、身高、体重、BMI、每次锻炼时间、总胆固醇、高密度脂蛋白、低密度脂蛋白、是否患有高血压、是否有肢体外伤,其基本描述见表 1。
表 1 骨关节炎风险预警模型入模特征描述性分析Table 1. Descriptive analysis of risk warning model for osteoarthritis变量名 是否骨关节炎 无骨关节炎 有骨关节炎 性别[例(%)] 女性 21 414(57.9) 2 115(64.1) 男性 15 550(42.1) 1 182(35.9) 吸烟状况[例(%)] 不吸烟 27 326(73.9) 2 283(69.2) 已戒烟 1 817(4.9) 249(7.6) 吸烟 3 503(9.5) 325(9.9) 缺失 4 318(11.7) 440(13.3) 饮酒情况[例(%)] 不饮酒 25 761(69.7) 2 472(75.0) 已戒酒 4 364(11.8) 210(6.4) 饮酒 1 930(5.2) 152(4.6) 缺失 4 909(13.3) 463(14.0) 饮食荤素平衡[例(%)] 否 5 787(15.7) 794(24.1) 是 31 177(84.3) 2 503(75.9) 是否高血压[例(%)] 否 14 301(38.7) 922(28.0) 是 22 663(61.3) 2 375(72.0) 肢体外伤[例(%)] 否 34 283(92.7) 2 784(84.4) 是 2 681(7.3) 513(15.6) 年龄(x±s,岁) 72.5±7.7 71.3±6.7 身高(x±s,cm) 159.8±8.4 159.1±8.4 体重(x±s,kg) 63.7±10.8 64.3±10.9 BMI(x±s) 24.8±3.4 25.2±3.4 每次锻炼时间(x±s,min) 40.8±20.2 38.7±14.4 高密度脂蛋白(x±s,mmol/L) 1.3±0.3 1.5±0.3 低密度脂蛋白(x±s,mmol/L) 2.9±0.9 3.0±0.9 总胆固醇(x±s,mmol/L) 4.8±1.1 5.2±1.0 2.2 模型预测结果
本次建模将数据集按照7∶ 3的比例将数据随机分为训练集和测试集。以“是否骨关节炎”作为输出变量,特征工程筛选后的14个特征作为输入变量,构建骨关节炎风险评估的XGBoost模型,在模型训练中采用8折交叉验证的方法在训练集上训练最佳超参数,通过测试集验证模型的效果。模型评价结果显示(表 2),在测试集上模型计算分类预测的准确率为92%,精确率为71%,召回率为65%,F1_score为0.68,模型区分度KS值为0.48(图 1),AUC达到0.82(图 2)。
表 2 骨关节炎风险预警模型评价指标Table 2. Evaluation index of osteoarthritis risk warning model数据集 准确率(%) 精确率(%) 召回率(%) F1_score KS值 AUC 训练集 94 69 71 0.69 0.42 0.86 测试集 92 71 65 0.68 0.48 0.82 2.3 特征权重分析
分析模型特征重要性得分可以发现(图 3),重要性排名前5位的特征因素分别为高密度脂蛋白、总胆固醇、BMI、低密度脂蛋白、饮酒频率,其特征重要度均>0.10,而是否有高血压、锻炼时间、性别、饮食习惯等特征重要度相对较低,均 < 0.03。
3. 讨论
骨关节炎是一种严重影响患者生活质量的关节退行性疾病,早期临床表现不明显而易被忽视,导致患者就诊不及时、病情控制不佳等诸多问题,目前仍没有彻底治愈骨关节炎的方案。因此,及时预警、早期发现、提早就诊是骨关节炎防治的重要任务。目前针对骨关节炎预警预测的研究多集中在影响因素层面,且阐述某一个或某几个影响因素对骨关节炎的影响,而缺少骨关节炎综合预警的客观评价指标。
本研究集成4万条社区医疗大数据,经过数据预处理和特征选择,运用XGBoost算法构建骨关节炎风险预警模型,生成骨关节炎评估风险得分,对骨关节炎疾病风险量化评价。模型的准确率达到92%,AUC超过80%,说明模型具有较高的准确性和稳定性。F1_score为0.68,KS值为0.48,说明模型的辨识度和区分度较好,但有一定的增长空间,这主要是因为骨关节炎的确诊率相对较低,在“未有骨关节炎”的分组人群中本身就存在一定的假阴性。
经过特征选择筛选纳入的模型为15个,其中个人一般特征包括性别、年龄、身高、体重、BMI[15-16],生活习惯特征包括吸烟、饮酒、饮食荤素、锻炼时间,疾病特征包括高血压、肢体外伤,检验指标特征包括总胆固醇、高密度脂蛋白、低密度脂蛋白。所有特征因素均被相关研究证明与骨关节炎存在关联,说明模型在特征层面具备较高的可信度[17]。
从特征的重要度来看,BMI的特征重要度达到0.136,排在第3位,这与众多研究的结果相一致。超重和肥胖与骨关节炎发病率存在很大联系,各个年龄层的肥胖人群骨关节炎发病率均高于正常人群。肥胖对骨关节炎的影响一方面是超重导致的关节过度负荷,另一方面也与肥胖的代谢机制有关。这一结论从高密度脂蛋白、胆固醇和低密度脂蛋白的重要度可以看出,三者在模型中的重要度均>0.1,分别排在1、2、4位。这与国内外的研究结果相一致,国内的一项研究[18]表明中国40岁以上成人的骨关节炎发生与低密度脂蛋白、高总胆固醇、高甘油三酯相关。德国一项研究[19]表明高密度脂蛋白与软骨下骨髓病变骨髓损伤相关,而骨髓损伤是骨关节炎的疼痛来源。一项探讨代谢综合征与骨关节炎发病率关系的研究[20]发现,关节炎患者血清中胆固醇浓度显著高于正常人,胆固醇代谢紊乱可能是OA的发病因素之一。目前正从临床、动物、分子、基因等多方面研究脂质代谢异常导致OA的机制,但是尚无明确的直接证据表明两者的直接相关性[21-22]。
综上所述,本研究采用社区医疗大数据和机器学习模型构建了骨关节炎风险预警模型,模型的整体拟合度和特征合理性较好,为社区骨关节炎的早期预警提供了工具,有利于社区骨关节炎的早诊早治。然而本研究也存在一定的局限性,由于数据缺失问题,潮湿环境、负重劳动等骨关节炎相关因素未纳入到模型中,后续拟在社区建立骨关节炎人群队列,进一步收集数据完善模型。
-
表 1 骨关节炎风险预警模型入模特征描述性分析
Table 1. Descriptive analysis of risk warning model for osteoarthritis
变量名 是否骨关节炎 无骨关节炎 有骨关节炎 性别[例(%)] 女性 21 414(57.9) 2 115(64.1) 男性 15 550(42.1) 1 182(35.9) 吸烟状况[例(%)] 不吸烟 27 326(73.9) 2 283(69.2) 已戒烟 1 817(4.9) 249(7.6) 吸烟 3 503(9.5) 325(9.9) 缺失 4 318(11.7) 440(13.3) 饮酒情况[例(%)] 不饮酒 25 761(69.7) 2 472(75.0) 已戒酒 4 364(11.8) 210(6.4) 饮酒 1 930(5.2) 152(4.6) 缺失 4 909(13.3) 463(14.0) 饮食荤素平衡[例(%)] 否 5 787(15.7) 794(24.1) 是 31 177(84.3) 2 503(75.9) 是否高血压[例(%)] 否 14 301(38.7) 922(28.0) 是 22 663(61.3) 2 375(72.0) 肢体外伤[例(%)] 否 34 283(92.7) 2 784(84.4) 是 2 681(7.3) 513(15.6) 年龄(x±s,岁) 72.5±7.7 71.3±6.7 身高(x±s,cm) 159.8±8.4 159.1±8.4 体重(x±s,kg) 63.7±10.8 64.3±10.9 BMI(x±s) 24.8±3.4 25.2±3.4 每次锻炼时间(x±s,min) 40.8±20.2 38.7±14.4 高密度脂蛋白(x±s,mmol/L) 1.3±0.3 1.5±0.3 低密度脂蛋白(x±s,mmol/L) 2.9±0.9 3.0±0.9 总胆固醇(x±s,mmol/L) 4.8±1.1 5.2±1.0 表 2 骨关节炎风险预警模型评价指标
Table 2. Evaluation index of osteoarthritis risk warning model
数据集 准确率(%) 精确率(%) 召回率(%) F1_score KS值 AUC 训练集 94 69 71 0.69 0.42 0.86 测试集 92 71 65 0.68 0.48 0.82 -
[1] 中华医学会骨科学分会关节外科学组. 骨关节炎诊疗指南(2018年版)[J]. 中华骨科杂志, 2018, 38 (12): 705-715. doi: 10.3760/cma.j.issn.0253-2352.2018.12.001Group of Joint Surgery, Chinese Society of Osteology. Clinical Guidelines for Osteoarthritis (2018 edition)[J]. Chinese Journal of Orthopaedics, 2018, 38 (12): 705-715. doi: 10.3760/cma.j.issn.0253-2352.2018.12.001 [2] 郑双, 徐建华, 黄淑婷, 等. 某三甲医院148例膝骨关节炎患者就医及治疗现状分析[J]. 中华疾病控制杂志, 2015, 19(1): 91-92, 106. https://www.cnki.com.cn/Article/CJFDTOTAL-JBKZ201501024.htmZHENG S, XU J H, HUANG S T, et al. Cross-sectional study of the hospitalizing behavior and therapeutic status of 148 knee osteoarthritis patients in a third-level first-calss hospital[J]. Chinese Journal of Disease Control & Prevention, 2015, 19(1): 91-92, 106. https://www.cnki.com.cn/Article/CJFDTOTAL-JBKZ201501024.htm [3] CROSS M, SMITH E, HOY D, et al. The global burden of hip and knee osteoarthritis: Estimates from the global burden of disease 2010 study[J]. Ann Rheum Dis, 2014, 73(7): 1323-1330. doi: 10.1136/annrheumdis-2013-204763 [4] 任燕, 石娅娅, 谭波, 等. 中国人群膝骨关节炎危险因素的Meta分析[J]. 现代预防医学, 2015, 42(12): 2282-2284, 2292. https://www.cnki.com.cn/Article/CJFDTOTAL-XDYF201512053.htmREN Y, SHI Y Y, TAN B, et al. Meta-analysis of the risk factors for knee osteoarthritis among the Chinese population[J]. Modern Preventive Medicine, 2015, 42(12): 2282-2284, 2292. https://www.cnki.com.cn/Article/CJFDTOTAL-XDYF201512053.htm [5] 陈颂春, 王欣欣, 高翔. 膝骨关节炎危险因素的系统评价与Meta分析[J]. 老年医学与保健, 2016, 22(6): 405-410. doi: 10.3969/j.issn.1008-8296.2016.06.23CHEN S C, WANG X X, GAO X. Risk Factors for Knee Osteoarthritis: a Systematic Review and Meta-analysis[J]. Geriatrics & Health Care, 2016, 22(6): 405-410 doi: 10.3969/j.issn.1008-8296.2016.06.23 [6] 杨迎春, 于晓璐, 顾海伦, 等. 辽宁省某三甲医院膝关节骨性关节炎患者常见影响因素的调查[J]. 现代预防医学, 2018, 45(8): 1516-1519. https://www.cnki.com.cn/Article/CJFDTOTAL-XDYF201808046.htmYANG Y C, YU X L, GU H L, et al. Survey of influencing factors on patients with knee osteoarthritis in a hospital of Liaoning province[J]. Modern Preventive Medicine, 2018, 45(8): 1516-1519. https://www.cnki.com.cn/Article/CJFDTOTAL-XDYF201808046.htm [7] 沈锋, 夏正明, 周满春. 广州市南石头社区中老年群体膝骨关节炎的危险因素分析[J]. 江西医药, 2019, 54(2): 144-146. https://www.cnki.com.cn/Article/CJFDTOTAL-JXYY201902021.htmSHEN F, XIA Z M, ZHOU M C. Risk factors analysis of knee osteoarthritis in the aged population in Nanshitou Community, Guangzhou City[J]. Jiangxi Medical Journal, 2019, 54(2): 144-146. https://www.cnki.com.cn/Article/CJFDTOTAL-JXYY201902021.htm [8] 张洪逵, 陈国华, 叶壮益. 膝骨关节炎发生的影响因素分析[J]. 实用中西医结合临床, 2018, 18(7): 120-121. https://www.cnki.com.cn/Article/CJFDTOTAL-SZXL201807066.htmZHANG H K, CHEN G H, YE Z Y. Analysis of influencing factors of knee osteoarthritis[J]. Practical Clinical Journal of Integrated Traditional Chinese and Western Medicine, 2018, 18(7): 120-121. https://www.cnki.com.cn/Article/CJFDTOTAL-SZXL201807066.htm [9] 许永超. 基于多标签体检数据的疾病风险分析方法研究[D]. 郑州: 郑州大学, 2017.XU Y C. Study on disease risk analysis method based on multi-label physical examination data[D]. Zhengzhou: Zhengzhou University, 2017. [10] 夏涛, 徐辉煌, 郑建立. 基于机器学习的冠心病住院费用预测研究[J]. 智能计算机与应用, 2019, 9(5): 35-39. https://www.cnki.com.cn/Article/CJFDTOTAL-DLXZ201905008.htmXIA T, XU H H, ZHENG J L. Prediction of hospitalization expenses for coronary heart disease based on machine learning[J]. Intelligent Computer and Applications, 2019, 9(5): 35-39. https://www.cnki.com.cn/Article/CJFDTOTAL-DLXZ201905008.htm [11] 安莹, 黄能军, 杨荣, 等. 基于深度学习的心血管疾病风险预测模型[J]. 中国医学物理学杂志, 2019, 36(9): 1103-1112. https://www.cnki.com.cn/Article/CJFDTOTAL-YXWZ201909021.htmAN Y, HUANG N J, YANG R, et al. Deep learning-based model for risk prediction of cardiovascular diseases[J]. Chinese Journal of Medical Physics, 2019, 36(9): 1103-1112. https://www.cnki.com.cn/Article/CJFDTOTAL-YXWZ201909021.htm [12] 彭佳丽, 刘春容, 李旭, 等. 采用XGBoost和随机森林探索中国西部女性乳腺癌危险因素[J]. 现代预防医学, 2020, 47(1): 1-4. https://www.cnki.com.cn/Article/CJFDTOTAL-XDYF202001001.htmPENG J L, LIU C R, LI X, et al. Applying XGBoost and random frost to explore the risk factors of breast cancer among western Chinese women[J]. Modern Preventive Medicine, 2020, 47(1): 1-4. https://www.cnki.com.cn/Article/CJFDTOTAL-XDYF202001001.htm [13] 李占山, 刘兆赓. 基于XGBoost的特征选择算法[J]. 通信学报, 2019, 40(10): 101-108. https://www.cnki.com.cn/Article/CJFDTOTAL-TXXB201910010.htmLI Z S, LIU Z G. Feature selection algorithm based on XGBoost[J]. Journal on Communications, 2019, 40(10): 101-108. https://www.cnki.com.cn/Article/CJFDTOTAL-TXXB201910010.htm [14] 岳鹏, 侯凌燕, 杨大利, 等. 基于XGBoost特征选择的疾病诊断XLC-Stacking方法[J]. 计算机工程与应用, 2020, 56(17): 136-141. https://www.cnki.com.cn/Article/CJFDTOTAL-JSGG202017020.htmYUE P, HOU L Y, YANG D L, et al. XLC-Stacking Method for Disease Diagnosis Based on XGBoost Feature Selection[J]. Computer Engineering and Applications, 2020, 56(17): 136-141. https://www.cnki.com.cn/Article/CJFDTOTAL-JSGG202017020.htm [15] RASHEED Z, RASHEED N, Al-SHOBAILI H A, et al. Epigallocatechin-3-O-gallate up-regulates microRNA-199a-3p expression by down-regulating the expression of cyclooxygenase-2 in stimulated human osteoarthritis chondrocytes[J]. J Cell Mol Med, 2016, 20(12): 2241-2248. [16] 卢敏强, 钟庆, 贾兆锋, 等. 雌激素与骨关节炎[J]. 国际骨科学杂志, 2018, 39(1): 41-44. https://www.cnki.com.cn/Article/CJFDTOTAL-GWGK201801015.htmLU M Q, ZHONG Q, JIA Z F, et al. Estrogen and osteoarthritis[J]. International Journal of Orthopaedics, 2018, 39(1): 41-44. https://www.cnki.com.cn/Article/CJFDTOTAL-GWGK201801015.htm [17] 沈明球, 刘俊昌, 王新军, 等. 新疆北疆牧区维、哈、汉族膝骨性关节炎致病因素的流行病学调查[J]. 中国组织工程研究, 2015, 19(29): 4614-4618. https://www.cnki.com.cn/Article/CJFDTOTAL-XDKF201529007.htmSHEN M Q, LIU J C, WANG X J, et al. An epidemiological investigation on the pathogenic factors of knee osteoarthritis in Uygur, Kazakh and Han populations in pastoral areas of northern Xinjiang Uygur Autonomous Region, China[J]. Chinese Journal of Tissue Engineering Research, 2015, 19(29): 4614-4618. https://www.cnki.com.cn/Article/CJFDTOTAL-XDKF201529007.htm [18] LIU Y, ZHANG H F, LIANG N X, et al. Prevalence and associated factors of knee osteoarthritis in a rural Chinese adult population: An epidemiological survey[J]. BMC Public Health, 2016, 16: 94. [19] ANTONY B, VENN A, CICUTTINI F, et al. Correlates of knee bone marrow lesions in younger adults[J]. Arthritis Res Ther, 2016, 18: 31 [20] 石银朋, 奚阳, 张志毅, 等. 血脂对骨关节炎影响研究进展[J]. 中国实用内科杂志, 2020, 40(1): 67-69. https://www.cnki.com.cn/Article/CJFDTOTAL-SYNK202001016.htmSHI Y P, XI Y, ZHANG Z Y, et al. Research progress in the effect of blood lipids on osteoarthritis[J]. Chinese Journal of Practical Internal Medicine, 2020, 40(1): 67-69. https://www.cnki.com.cn/Article/CJFDTOTAL-SYNK202001016.htm [21] 吴鹏, 茆军. 代谢组学在中医药治疗膝骨关节炎中应用的研究进展[J]. 中国医药, 2021, 16(9): 1420-1422. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGYG202109032.htmWUP, MAO J. Research progress on metabolomics in the treatment of knee osteoarthritis with traditional Chinese medicine[J]. China Medicine, 2021, 16(9): 1420-1422. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGYG202109032.htm [22] 陈江水, 杨华瑞, 方志, 等. 脂质代谢异常与骨关节炎关系研究进展[J]. 海南医学, 2018, 29(5): 682-684. https://www.cnki.com.cn/Article/CJFDTOTAL-HAIN201805029.htmCHEN J S, YANG H R, FANG Z, et al. Relationship between abnormal lipid metabolism and progression of osteoarthritis[J]. Hainan Medical Journal, 2018, 29(5): 682-684. https://www.cnki.com.cn/Article/CJFDTOTAL-HAIN201805029.htm 期刊类型引用(2)
1. 徐大星,纪木强,涂泽松,许伟鹏,徐伟龙,牛维. 机器学习分析肱骨近端内侧柱不稳定骨折术后失效的风险因素. 中国组织工程研究. 2024(33): 5295-5301 . 百度学术
2. 张威,胡舫瑞,綦巍,彭琳,王咏林,陈枫. 基于XGBoost和云模型的地质灾害易发性评价. 中国地质灾害与防治学报. 2023(06): 136-145 . 百度学术
其他类型引用(2)
-