科学家联合数据宝库EMR预测住院时间与患者死亡率

  电子医疗记录(EMR)是数据科学家真正的宝库,其中一些人建立了  人工智能 学习数据点之间的关系,以预测疾病发生率、治疗反应和其他患者结果。但EMR通常分布在不同的地理位置,这使得分析有些复杂,因为数据集必须首先传输到人工智能系统所在的机器(或多个机器)。

 科学家联合数据宝库EMR预测住院时间与患者死亡率_行业应用_通信网络
人工智能

麻省理工学院CSAIL、哈佛大学医学院和清华大学艺术与设计学院的研究人员已经开发出了首批联合EMR模型培训方法之一,在一份新发表的论文中,他们描述了一种从当地医院获取数据的架构,为每个社区分配一个模型,并在服务器上聚合计算结果。

他们表示,他们的技术不仅降低了医院和模型托管服务器之间的数据传输成本,而且暴露了社区之间的不同之处,否则这些差异可能会被忽视。

该团队表示:“EMR由不同的患者个体和医院/诊所产生,其本质上是分布式的,而且非常敏感。这可能会阻碍在现实中将机器学习应用于EMR,而且研究人员需要面对集中存储EMR数据在安全性、经济效益、隐私保护和共享医疗数据可用性方面的问题。这些问题可以通过联合机器学习来解决,将数据和计算本地保留在分布式孤岛中,然后聚合本地计算结果来训练全局预测模型。”

为了验证他们的方法,这些研究人员收集了280,000个样本形成语料库。然后,科学家根据他们的共同特征将28,000名患者分为五个社区,他们将这些疾病聚集在医院层面以揭示潜在的偏差来源,并发现一些社区比其他社区偏差更大,从地理分布上看,一个主要来自南部医院,而另一个来自西部各州的医院。

利用手头的预处理数据,论文作者们着手预测了两件事:死亡率和住院时间。他们表示,来自相同和不同医院的训练和测试数据集的测试都表明,他们算法的准确性接近于集中学习的模型,并且在每一个预测任务上都优于现有的技术。

他们也注意到这个模型的局限性,主要是它没有考虑更多的功能和它的聚类方法的缺点,不过尽管如此,这仍是一项重大的进步。

16
40
0
2

相关资讯

  1. 1、从客厅到网络的“战争”!《娘道》被吐槽三观不正,收视率却很高3539
  2. 2、《国土》发第2季预告男主角困在荣耀与痛苦中2546
  3. 3、年度最强生存挑战《这个世界不看脸》,看看吴倩的人生必备法宝!1489
  4. 4、《西虹市首富》女主一句话遭抵制,单日损失千万票房上热搜4123
  5. 5、《花木兰》定妆照曝光,刘亦菲不再是仙女形象,眉毛粗面孔不惊艳4496
  6. 6、阿汤哥要求重写《壮志凌云2》剧本,好莱坞明星为何权力这么大?103
  7. 7、“7嫂”朴寒星独自赴京《笔仙2》女主身份曝光183
  8. 8、杨幂逆生长!《爱的二八定律》搭档许凯,精英遇上宅男1372
  9. 9、刘青云放假不是和老婆去逛街买名牌而是每天去超市买菜做饭3461
  10. 10、芒果台周播剧互动创新“呼啦”拉长整周注意力3404
全部评论(0)
我也有话说
0
收藏
点赞
顶部