让机器读懂200万份病历,达到三甲医院主任水平,零氪科技要做帮医生下棋的AlphaGo

全国每天约1万人确诊癌症,

相当于平均每7分钟就有一个人得癌症;

肺癌为发病率、死亡率第一;

小城市男性和大城市女性癌症发病率高;

……

在接受手术治疗的早期肺癌患者中,有3%-5%会发生淋巴结跳跃转移。因为患者在手术后身体非常虚弱,跳跃转移至淋巴结中的癌细胞会很快扩散。病症复发,患者可能在短时间内去世。

是否发生跳跃转移难以确认,此前,只能通过医生的主观判断来决定是否切除较远的一组淋巴结。而随着人工智能大数据技术在医疗行业的应用,目前肿瘤大数据平台零氪科技的训练模型已经能够较为准确地找出这3%到5%的患者,让他们体内发生跳跃转移的淋巴结得到切除。

全国每年有近30万肺癌患者接受手术,准确预测跳跃转移能让患者的复发延迟10个月以上。零氪科技CEO张天泽表示,目前预测跳跃转移的业务已经在临床得以验证,如果铺开应用就能产生一年近10万人/月的寿命延长。

创业邦获悉,成立于2014年12月的零氪科技目前已完成C轮融资,前几轮的投资方包括了宽带资本、荟桥资本、千骥资本、长岭资本、TEMASEK、NEA等,累计融资额近十亿元。

让机器读懂200万份病历,达到三甲医院主任水平,零氪科技要做帮医生下棋的AlphaGo

零氪科技创始人兼CEO张天泽

张天泽2005年毕业于北京邮电大学,中欧商学院EMBA,曾就职于腾讯、阿里巴巴(雅虎-中国)。在阿里担任雅虎邮箱运营副总监时,因为邮箱业务调整,张天泽需要被调配到其他岗位。这时,在医生世家出身的张天泽选择了在医疗领域进行自己的创业,“索性要从头开始,那不如开始一个自己比较有想法,有情感在的业务”。

2009年,张天泽成立了零氪科技的前身信石科技,主要业务是医疗信息系统集成和应用软件开发,帮助包括华西医院、湘雅医院等医疗机构获得了亚州管理大奖。然而,三甲医院对信息化的需求,并不是所有医院都需要的。

“为医院提供数据服务来优化管理运营的业务很难向下复制,金字塔尖的需求很难铺到塔腰和塔基”,张天泽谈到。

三甲医院、二级医院和社区诊所的管理运营思路是完全不一样的,属于不同用户。但在临床来说,专家和普通专科医生的需求都是一致的,就是看好病。同时,各类临床专家的需求也是一致的,就是不断产生有质量的学术成果和学术文章。临床专家们属于一群标准化较高,业务诉求一致,需求一致的群体。

当零氪科技团队把业务视角从院长,转移到科室主任、学科专家层面时,发现这个群体有很强的标准性、可复制性和互相影响的网络效应。

“从服务学科专家的科研需求入手,帮他们管理好自己的病历,变成可以用的科研数据产生科研成果,能产生科研成果,就有机会产生辅助诊断”,张天泽告诉创业邦。

2014年12月,张天泽把数据业务从信石剥离出来,成立了零氪科技,希望构建一个肿瘤大数据平台,用人工智能帮医生和临床专家发掘病历中的研究价值,并实现辅助诊疗。

一本肿瘤患者的病历多达60余页,涵盖患者的检查报告、拍片、处方、诊断书、手术记录和出院报告等,其中有着大量的临床数据。一名主任级医生所接触的病历不过数万份,如果能让机器读懂所有医院HIS系统(医院管理信息系统)中的病历,其意义不亚于在医疗行业创造一个AlphaGo。

目前在大多数医院,HIS系统已经得到了普及,患者病历由医生在电脑前用键盘鼠标输入,已经过了医生在一张白纸上写狂草的时代。然而,录入到HIS系统中的病历是非结构化的“Word”,让机器读懂,需要输入结构化的“Excel”。

一份病历就像一篇作文一样,每名医生文风、措辞不一样,写出来的病历并不一样。同时,由人书写的病历中会存在部分俚语、俗语。想要让机器读懂,首先需要把病历进行结构化处理。

在CRO外包业务中,一位肿瘤患者的病历结构化费用近万元。通常是新药在进行临床试验,针对数百名志愿者做数据管理和统计分析时使用。这种结构化病历的方式价格昂贵,不适合大规模应用。

零氪科技在2015年获得恩颐投资的A轮融资时,招募了上百个有医学背景的标记员,对涉及到患者隐私的信息做脱敏处理后,把一本病历拆分成十多个部分,以类似流水线的分工模式处理病历,人均每天能对约30本病历进行结构化处理。目前,在引入自行开发的人工智能系统Fellow-X后,零氪科技能在人工智能的辅助下,5分钟内即可完成一本病历的结构化处理。

在处理完肺癌这一病种近10万份病历的时候,零氪开始用算法做训练,尝试让机器读懂病历。

零氪科技CTO罗立刚告诉创业邦,一本肿瘤病历中有上千个关键信息点,而每个信息点都会有近百种表述方式。单是肺癌中关于吸烟的表述,就有200多种。

基于此前对各类头部医院的病历梳理,零氪能够准确地对病历中的俚语、俗语进行识别,从而让机器获得准确而结构化的数据样本进行学习。在数据足够多后,零氪的AI系统已经可以读懂一本病历中各种信息点的不同描述。

“单纯用算法是不能完成病历的结构化处理的,即使在硅谷也做不到,所以Google收购了Flatiron”,张天泽谈到,“此前我们花了一年多的时间来让人在机器的帮助下对病历进行结构化处理,就是为了有一天人可以不做或者少做这项工作”。

2016年4月,零氪科技获得了宽带资本领投的B轮融资。宽带资本合伙人蒋健告诉创业邦,人工介入结构化处理的必要性体现在两方面,一是保证了初期为医生服务过程中数据的高质量;二是为机器学习奠定了样本基础。

近50年来,肺癌发病率和死亡率均明显增高,男性肺癌发病率和死亡率均占所有恶性肿瘤的第一位。

在肺癌的治疗中,用外科手术切除肺癌原发病灶及转移淋巴结是最为重要的治疗方法。然而,癌细泡可能在淋巴结间发生跳跃转移,即部分患者体内的癌细胞绕过了最近的淋巴结,直接向较远的一组淋巴结(第二站或第三站)转移。

如果在手术时没有切除发生跳跃转移的淋巴结,就让癌细胞继续留在了患者体内。

这类发生淋巴节跳跃转移的患者,大概占到全部接受手术早期肺癌患者的3%到5%。由于患者在手术后身体非常虚弱,癌细胞会很快扩散,病症复发,患者极有可能在短时间内去世。

零氪科技通过上千例的良性案例(即医生果断进行了扩大淋巴结清扫后,确在切除下来的淋巴结中发现癌细胞的案例),来训练自己的AI模型。目前已经能很好地预测一个新发早期肺癌患者发生淋巴结跳跃转移的可能性,准确地找出这3%到5%的患者,让他们体内发生跳跃转移的淋巴结得到切除,而让另外95%的患者免于切除过多的良性器官,避免对身体造成多余的伤害。

全国每年有近30万肺癌患者接受手术,切除发生跳跃转移的淋巴结能让癌症的复发延迟10个月以上。准确预测30万患者中3%-5%发送跳跃转移的患者,能产生一年近10万人/月的寿命延长。

此外,肾脏是人体的主要排泄器官,容易受到药物的影响,接受化疗的患者易产生肾毒性反应。在AI辅助诊疗的帮助下,医生可以根据患者的体质和以往的药物过敏史,选择对部分患者伤害较小的化疗药物。

张天泽告诉创业邦,目前零氪科技的人工智能已经能够达到三甲医院主任级医师的临床诊断水平。

对于病历数据来说,拿到上十万份病历数据并不难,一家大型三甲医院一天产生的病历就可能接近10万,难的是拿到足够多的单一病种数据。目前,零氪科技数据库内拥有超过200万份结构化病历,覆盖肺癌、胃癌、肝癌、乳腺癌等50余瘤种3000余种疾病,合作的医院超过500家,而且都是华西、湘雅等全国排名靠前的三甲综合及专科医院。

鼻咽癌在全球大部分地区发病率较低,一般在10万分之一以下。然而,居住在广东省中部以及讲粤语的男性,其发病率为30/10万-50/10万。零氪科技通过与广州当地三甲医院合作,已经对超过2万份鼻咽癌患者的脱敏病历数据进行了结构化处理。

同时,零氪科技入驻了由亚信集团董事长田溯宁、雅虎创始人杨致远担任院长的广州国际人工智能产业研究院,与联想、华芯等企业的实验室在广州实现人工智能的转化和应用。2017年12月6日,零氪科技入选第四届世界互联网大会《2017年世界互联网发展最佳实践案例集》。

让机器读懂200万份病历,达到三甲医院主任水平,零氪科技要做帮医生下棋的AlphaGo

零氪科技·Hubble人工智能辅助决策系统

“医疗是一个很谨慎很严肃的行业,张天泽谈到,“在医疗服务中,一次处方药物就包含药物研发,药物配送,医生诊断,诊疗指南指导等环节,背后要驱动影响的东西太多,很难像其他服务业一样,通过变革服务提供方的效率来提供一个更高效的服务”。

下一步,零氪科技将继续把肿瘤大数据平台以接近免费的模式开放给医生和临床专家,同时尝试通过对药企的2B服务,提供药物研发的相关数据进行商业变现。

PS:如果您想和业内技术大牛交流的话,请加qq群(527933790)或者关注微信公众 号(AskHarries),谢谢!

转载请注明原文出处:Harries Blog™ » 让机器读懂200万份病历,达到三甲医院主任水平,零氪科技要做帮医生下棋的AlphaGo

赞 (0)

分享到:更多 ()

评论 0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址