集成“自然语言处理+知识图谱”技术的“AI医生”，在儿科上岗了

作者&投稿：纳左（若有异议请与网页底部的电邮联系）

让AI技术与基础医学理论结合，成为AI用于临床探索的新思路。目前这一新思路已被证实确有更大潜力——

最近，由广州市妇女儿童医疗中心教授夏慧敏和加州大学圣地亚哥分校教授张康领衔、人工智能公司依图科技等共同参与的科研团队设计出一套基于AI的疾病诊断系统，就将医学知识图谱加入其中，使AI可以像人类医生一样根据读取的电子病历来“诊病”。

结果也颇为乐观：用纳入系统的55种常见儿科疾病和部分危急重症作测试，AI的诊断水平可达到儿科主治医生的专业水准。

目前，这一研究成果《使用人工智能评估和准确诊断儿科疾病》已于2月中旬在线发表于《自然—医学》杂志。

将深度学习技术与专业医学知识图谱进行结合，是该人工智能辅诊平台的最大特色。依图医疗总裁倪浩在接受笔者采访时说，未来对临床数据进行学习、为医生提供更多的辅助诊断能力（病种），采用深度学习+知识图谱的方式“很可行”。

为了使AI辅诊平台拥有专业的儿科医学知识，科研团队让它学习了56.7万名儿童136万份电子文本病历中的诊断逻辑。这些来自广州市妇女儿童医疗中心2016年1月至2017年7月间的电子病历，覆盖了初始诊断包括儿科55种病例学中常见疾病的1.016亿个数据点。

除了将医疗知识进行整合，科研团队还利用依图科技的自然语言处理（NLP）技术构建了一个自然语言处理模型，以对这些电子病历进行注释——通过将病历变得标准化，该模型在未经过“培训”的情况下可以粗略地将临床信息进行分类。

“粗略分类是指，将整个电子病历当作输入，将专家诊断结果作为输出，以达到粗略的分类。但这样并没有真正理解疾病本身，也很难解释为何做出了这个诊断。”倪浩告诉笔者， NLP模型虽然突破了病历文本语言和计算机语言之间的障碍，但知识图谱才是让AI诊断平台获取专家能力的关键 。

这也是他们接下来的一项重要工作：由30余位高级儿科医师和10余位信息学研究人员组成的专家团队，手动给电子病历上的6183张图表进行注释、持续检验和迭代，以保证诊断的准确性。

通过资深医疗专家注释的图表对AI诊断平台进行“培训优化验证”后，研究人员发现，经过深度学习的NLP模型可以对电子病历进行很好的注释，在体检和主诉项目的注释上分别达到最高灵敏度和精确度。也就是说， 深度学习的NLP模型能够准确地读取电子病历中记录的信息，并可以准确作出符合临床标准的批注。而这也是整个研究中最为关键的部分。

“通过引入知识图谱将每种疾病的电子病历深入解构，使得NLP模型具备了理解电子病历的能力。例如手足口病与哪些特征密切相关，川崎病最相关的特征是什么，让模型在给出准确诊断的基础上，能够具备更好的医学可解释性。”倪浩解释说，“有了知识图谱，再用深度学习技术来解构电子病历，就能够真正理解临床数据。基于此，机器学习分类等算法就有用武之地，否则把电子病历当成‘黑盒子’，是无法构建高精度可解释的模型的。”

综合利用深度学习技术与医学知识图谱对电子病历数据进行解构，研究人员据此构建了高质量的智能病种库，这使得后续可以较容易地利用智能病种库建立各种诊断模型。

构建一个多层级的诊断模型，是研究人员把AI诊断平台打造成为儿科医生的第二步。倪浩介绍说，这一基于逻辑回归分类器创建的诊断模型，首先会按呼吸系统疾病、胃肠道疾病、全身性疾病等几大系统分，然后在每一类下面做细分—— 这是让AI模拟人类医生的诊疗路径，对目标患儿的数据进行逐级判定 。

结果显示，基于NLP模型准确读取的数据，AI诊断模型能够对儿科疾病作出精确诊断： 平均准确率达90%，对神经精神失调疾病的诊断准确率更是高达98%。

在对相应儿科疾病的划分和诊断上，该诊断模型同样表现不俗。系统对上呼吸道疾病和下呼吸道疾病的诊断准确率分别为89%和87%。同时，该系统对普通系统性疾病以及高危病症也有很高的诊断准确率，例如传染性单核细胞增多症准确率为90%，水痘为93%，玫瑰疹93%，流感94%，手足口病为97%和细菌性脑膜炎为93%。

这揭示出，该诊断系统可以根据NLP系统注释的临床数据信息对常见儿科疾病作出较高准确度的判断。

研究人员随后运用11926个临床病例比较了AI诊断系统和5个临床治疗组诊断儿科疾病的水平，其中参与研究的治疗组从事临床工作时间和资历逐渐增加。结果显示， AI诊断系统反映模型综合性能的F1评分均值高于2个年轻医生组成的治疗组，但稍逊于3个高年资医生组成的治疗组。

论文认为，这说明该AI诊断系统可以协助年轻治疗团队进行疾病诊断，提升团队诊疗水平。

今年1月1日，该系统在广州市妇女儿童医疗中心投入临床应用。 仅1月1日至1月21日短短20天，该院医生实际调用它开展辅助诊断30276次，诊断与临床符合率达到87.4%。广州市妇儿中心医务部主任孙新在体验该系统后表示，这套系统在对疾病进行分组分类方面“比较科学”。

上述论文发表后，《纽约时报》点评这项研究称，“前后访问了儿科医院18个月中数十万名中国就医儿童的数据，能有这么庞大的数据量用于研究，也是中国在全球人工智能和竞赛中的优势。”

“数据确实是我们此次研究成果的核心关键之一。”倪浩说，“不过，高质量标准数据来源于强大的联合团队，我们专门开发了数据标准系统，进行了大量的数据标注。”

论文通讯作者之一、广州市妇女儿童医疗中心教授夏慧敏表示，这篇文章的启示意义在于“通过系统学习文本病历，AI或将诊断更多疾病”。不过他提醒道， 当下还须清醒认识到，仍有很多基础性工作要做扎实，比如高质量数据的集成便是一个长期的过程。

笔者了解到，该医院在近3年里注重将数据标准化、结构化处理，实现了50多个诊断数据子系统的相互交流和互联互通，为该系统应用打下了基础。

“此外，A I学习了海量数据后，其诊断结果的准确性仍然需要更大范围的数据对其进行验证和比对。 ”夏慧敏说。

AI技术落地的4元素之中，场景也非常重要。论文的另一位通讯作者张康认为，该研究以儿科疾病为对象意义重大。

“对儿科疾病的诊断是医疗中的一大痛点。一些儿科疾病威胁程度较大需要尽快得到治疗，而儿童恰恰不善于表达病情，因此快速、准确地对儿科疾病进行诊断非常必要。”张康表示，当前儿科医生供不应求，论文中构建的AI诊断系统对于严重不足的医疗资源会有很大的辅助作用。

相关论文信息：DOI:10.1038/s41591-018-0335-9

生成式人工智能的技术基础有哪些
生成式人工智能的技术基础包括机器学习、深度学习和自然语言处理等。1.机器学习：机器学习是生成式人工智能的核心技术之一。它通过将大量数据输入到算法模型中，并通过分析数据的模式和规律来不断优化模型，从而实现自主学习和预测能力。机器学习的关键在于构建合适的模型和算法以及有效的训练方法。2.深度学习：...

自然语言处理和语音的关系是什么?
自然语言处理（NLP），广义上来讲包括对各种形式的自然语言的处理，即既包括文本，也包括语音。不过，因为对语音的处理涉及信号处理，跟文本处理的感觉不太一样，所以常常把语音单独拿出来说。这样，狭义的 NLP 就单指对文本的处理了。对文本和语音的「处理」，也是一个很广的概念。对文本的处理（即 ...

自然语义理解和自然语言生成的区别
两个词的区别是侧重点不同。NLU的重点在于“理解”文本的意义和语境，而NLG的重点是“生成”有意义的文本。自然语言处理（NLP）是一种计算机科学技术，旨在处理和理解人类语言。自然语言生成（NLG）则是根据给定的信息生成文本内容自然语言理解（NLU）是NLP的一个子领域，主要目标是解析和理解非结构化信息...

语音交互技术主要有哪些
语音交互技术主要包括语音识别、语音合成、自然语言处理与对话管理等几个核心部分。语音识别是语音交互的基础，它负责将人的语音转换成计算机可理解的文本信息。这一技术通过声学模型和语言模型的结合，能够识别不同口音、语速甚至背景噪音中的语音指令。例如，智能家居中的语音助手，如小米AI音箱，就能准确识别...

语音交互技术包括哪些方面
语音交互技术主要涵盖语音识别、语音合成、自然语言处理以及语音交互界面设计等方面。语音识别是语音交互技术的核心之一，它负责将人的语音转换成计算机可识别的文本信息。这一过程依赖于大规模的语音数据库和先进的机器学习算法，以确保准确识别不同口音、语速和语境下的语音指令。例如，智能家居系统通过语音识别...

gpt是啥意思
GPT是是一种由深度学习算法GPT系列构建而成的自然语言处理模型。GPT是Generative Pre-trained Transformer的缩写，GPT系列的模型解决了诸如自然语言生成、文本摘要、对话生成等多方面的问题，在很多自然语言处理任务中取得非常优越的成果。GPT系列模型是基于transformer数据结构构建的，transformer数据结构是相对于...

自然语言处理,句子语义模板自动生成?
比如“张三出生在上海”,“马化腾创建了腾讯公司”我想从这这两句话里自动提取出“【】出生在【】”,“【】创建了【】”这种关系语义模版,应该用哪种自然语言处理工具或者方法啊?... 比如“张三出生在上海”,“马化腾创建了腾讯公司”我想从这这两句话里自动提取出“【】出生在【】”,“【】创建了【】”这种...

什么是人工智能的核心
一个自然语言处理系统并不了解人类处理文本的方式，但是它却可以用非常复杂与成熟的手段巧妙处理文本。例如，自动识别一份文档中所有被提及的人与地点；识别文档的核心议题；在一堆仅人类可读的合同中，将各种条款与条件提取出来并制作成表。以上这些任务通过传统的文本处理软件根本不可能完成，后者仅针对简单...

chatbotts是什么东西
ChatGPT是一种自然语言处理模型，它是基于GPT-2模型开发的。GPT是“Generative Pre-trained Transformer”的缩写，是一个由OpenAI开发的人工智能语言模型。它是一种基于深度学习的人工神经网络，用于文本生成和自然语言处理。GPT-2是GPT的第二个版本，是一个由175亿个参数构成的超大型深度学习模型。ChatGPT...

最新的科技成果有哪些
1. 人工智能领域的新科技成果包括自然语言处理技术的重大突破，例如GPT-4等大型语言模型的出现。这些模型能够理解和生成人类语言，广泛应用于搜索引擎、智能客服、内容创作等领域，极大地提高了语言处理的效率和准确性。2. 在生物技术领域，基因编辑技术如CRISPR-Cas9系统的不断完善，使得科研人员能够更精确地...

金秀瑶族自治县19652644214： 学习人工智能有哪些就业方向?？
夔鬼野菊： 人工智能可以说是一门高尖端学科,属于社会科学和自然科学的交叉,涉及了数学、心理学、神经生理学、信息论、计算机科学、哲学和认知科学、不定性论以及控制论.研究范畴包括自然语言处理、机器学习、神经网络、模式识别、智能搜索等.就业方向为:科学研究工程开发计算机方向软件工程应用数学电气自动化通信机械制造

金秀瑶族自治县19652644214： 什么是赢达库? - ？
夔鬼野菊： 赢达库(YinDaoKu)是一种基于计算机模拟和数据挖掘技术的知识图谱构建工具,旨在实现大规模、高效、准确的知识抽取和知识管理.赢达库基于人工智能技术,包括自然语言处理、机器学习和数据挖掘等技术,利用大数据分析方法,自动...

金秀瑶族自治县19652644214： 人工智能和虚拟现实技术那个前景好?？
夔鬼野菊： 人工智能技术关系到人工智能产品是否可以顺利应用到我们的生活场景中.在人工智能领域,它普遍包含了机器学习、知识图谱、自然语言处理、人机交互、计算机视觉、生物特征识别、AR/VR七个关键技术.一、机器学习机器学习(...

金秀瑶族自治县19652644214： 百分点的动态知识图谱有什么优势? - ？
夔鬼野菊： 易用性,基于本体理论基础, 聚合后的知识(图谱)让业务人员直观理解和使用.拥有扩展性,运行中的知识图谱亦可更改结构,自适应新增数据源需求,降低使用、维护成本.高性能,分布式地构建客户大规模知识图谱,缩短构建知识图谱时间.可视化,配置化构建动态知识图谱、构建过程进度可视,降低构建知识图谱成本和风险.

金秀瑶族自治县19652644214： 智能行业有哪些类别? - ？
夔鬼野菊： 1、人工智能的领域分类——深度学习深度学习是基于现有的数据进行学习操作,是机器学习研究中的一个新的领域,机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本.深度学习是无监督...

金秀瑶族自治县19652644214： 智能系统主要依靠的关键基础和技术不包括(). - 上学吧继续教育考...？
夔鬼野菊： 电子类的智能是指:具有全开放式平台,搭载了操作系统,在使用的同时,可自行安装和卸载各类应用软件,并对功能进行扩充和升级.如各类智能手机、智能电视等.人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等.主要区别就是智能产品不“机械”可供人有选择地订制、应用;人工智能代替人的部分劳动.(参考百度百科)

金秀瑶族自治县19652644214： 怎么利用知识图谱构建智能系统 - ？
夔鬼野菊： 要构建分子遗传图谱首先要根据遗传材料选择合适的作图群体,再应用分子标记技术对基因型进行标记分析,确定标记间的连锁关系.主要包括构建合适的遗传群体,包括亲本的选择,分离群体类型的选择及群体大小的确定等;利用...

你可能想看的相关专题

星空见康网

集成“自然语言处理+知识图谱”技术的“AI医生”，在儿科上岗了

你可能想看的相关专题