目的探讨基于人口统计学信息和肿瘤特征构建的模型预测胃腺癌患者远处转移的效果。方法收集2001-2021年监测、流行病学和结果(SEER)数据库7 788例胃癌患者数据作为训练集,收集2019年1月至2024年10月南充市嘉陵区人民医院259例胃腺癌患者临床资料作为测试集。采用4种机器学习算法构建胃腺癌远处转移风险预测模型,多因素logistic回归分析胃腺癌患者远处转移的影响因素。 结果训练集中801例(10.3%)存在远处转移,测试集中25例(9.7%)存在远处转移。多因素logistic回归分析结果显示,分化程度高、T分期晚、阳性淋巴结对数比(LODDS)多为胃腺癌患者发生远处转移的危险因素(P<0.05),年龄大、肿瘤原发部位为胃食管结合部和总淋巴结检出数多为胃腺癌患者发生远处转移的保护因素(P<0.05)。4种模型测试集验证结果显示,随机森林的预测能力优于logistic回归、K最近邻算法(KNN)和支持向量机(SVM),SVM的预测能力优于logistic回归和KNN,而logistic回归和KNN两个模型的预测能力相当。Delong检验结果显示,随机森林的预测性能优于logistic回归、KNN和SVM。校准曲线分析结果显示,随机森林的预测准确性优于logistic回归、KNN和SVM。随机森林中前5位重要因素为阴性淋巴结数、肿瘤大小、转移淋巴结数、T分期和年龄。 结论随机森林构建的胃腺癌远处转移风险预测模型性能最优。
朱超 ,李玲 ,蒲敏 .基于机器学习和SEER数据库的胃腺癌远处转移预测效果评价[J].重庆医学,2025,54(11):2643-2648