机器学习可以帮助诊断酒精相关性肝炎和其他疾病

导读 急性胆管炎是一种可能危及生命的细菌感染,通常与胆结石有关。症状包括发烧、黄疸、右上腹疼痛和肝酶升高。虽然这些症状看起来像是独特的、

急性胆管炎是一种可能危及生命的细菌感染,通常与胆结石有关。症状包括发烧、黄疸、右上腹疼痛和肝酶升高。虽然这些症状看起来像是独特的、明显的症状,但它们与一种截然不同的疾病相似:酒精相关性肝炎。这对需要诊断和治疗肝酶异常和全身炎症反应患者的急诊科工作人员和其他医疗保健专业人员提出了挑战。

梅奥诊所的新研究发现,机器学习算法可以帮助医护人员区分这两种情况。在MayoClinicProceedings上发表的一篇文章“机器学习技术区分全身性炎症和肝酶升高患者的酒精相关性肝炎与急性胆管炎”中,科学家们展示了算法如何使用一些变量和常规可用的结构化临床数据来成为有效的预测工具信息。

“[该研究的目的是]开发机器学习算法(MLA),可以使用简单的实验室变量区分急性胆管炎(AC)和酒精相关性肝炎(AH)患者。一项研究对2010年1月1日至2019年12月31日期间罗切斯特梅奥诊所收治的459名患有AH(n=265)或AC(n=194)的成年患者进行了研究。十个实验室变量(白细胞计数、血红蛋白、平均红细胞计数)收集体积、血小板计数、天冬氨酸转氨酶、丙氨酸转氨酶、碱性磷酸酶、总胆红素、直接胆红素、白蛋白)作为输入变量。

“八个监督MLA(决策树、朴素贝叶斯、逻辑回归、k最近邻、支持向量机、人工神经网络、随机森林、梯度提升)经过训练和测试,用于AC与AH的分类。对MIMIC-III数据库中的AC(n=213)和AH(n=92)患者进行了外部验证。使用特征选择策略来选择最佳的5变量组合。有143名医生参加了在线测验,仅使用相同的10个实验室变量来区分AC和AH。

“MLAs表现出了出色的性能,准确度高达0.932,曲线下面积(AUC)高达0.986。在外部验证中,MLAs显示出高达0.909的相当准确度和高达0.970的AUC。信息论测量方面的特征选择是有效的,最佳5变量子集的选择产生了高性能,AUC高达0.994。医生的表现更差,平均准确度为0.790。结论:使用一些常规实验室变量,MLAs可以区分AC和AH患者,并且在诊断不确定的情况下可能发挥有价值的辅助作用。

“这项研究的动机是看到急诊科或ICU的许多医疗服务提供者很难区分急性胆管炎和酒精相关性肝炎,这是非常不同的情况,但可能表现相似,”三年级胃肠病学和临床医生JosephAhn医学博士说。罗彻斯特梅奥诊所的肝病学研究员,也是该研究的第一作者。“我们开发并训练了机器学习算法,使用所有这些患者都应具备的一些常规实验室值来区分这两种情况。机器学习算法在区分这两种情况方面表现出了出色的性能,准确率超过93%。

研究人员分析了2010年1月1日至2019年12月31日期间入住罗切斯特梅奥诊所的459名18岁以上患者的电子健康记录。这些患者被诊断患有急性胆管炎或酒精相关性肝炎。入院时收集了十个常规可用的实验室值。剔除数据不完整的患者后,剩下260例酒精相关性肝炎患者和194例急性胆管炎患者。这些数据用于训练八种机器学习算法。

分析电子健康记录

研究人员还使用2001年至2012年间在波士顿贝斯以色列女执事医疗中心就诊的ICU患者队列对结果进行了外部验证。该算法的表现也优于参与在线调查的医生,如文章中所述。

“这项研究凸显了机器学习算法在不确定情况下协助临床决策的潜力,”Ahn说。“有很多胃肠科医生接受紧急内镜逆行胰胆管造影咨询的例子,患者最初否认饮酒史,但后来发现患有酒精相关性肝炎。在某些情况下,无法从精神状态改变的患者那里获得可靠的病史,或者在服务不足的地区无法获得成像方式,可能会迫使提供者根据有限的客观数据做出决定。”

研究表明,如果可以通过在线计算器或智能手机应用程序轻松访问机器学习算法,它们可能会帮助紧急救治肝酶异常的急症患者的医护人员。

Ahn表示:“对于患者来说,这将提高诊断准确性,并减少额外检查的数量或不适当的侵入性手术顺序,这可能会延迟正确的诊断或使患者面临不必要的并发症的风险。”

韩国首尔汉阳大学计算机科学系的一个团队也参与了这项研究。