科学家们构建了一个先进的医学知识语言模型

   EPFL的研究团队最近推出了Meditron,这是全球性能最优的开源大型语言模型,专为医疗行业设计,旨在辅助临床决策。...

  medical data

EPFL的研究团队最近推出了Meditron,这是全球性能最优的开源大型语言模型,专为医疗行业设计,旨在辅助临床决策。

大型语言模型(llm)是基于海量文本训练的深度学习算法,旨在学习单词之间数十亿的数学关系(即“参数”)。我们大多数人对它们并不陌生,因为它们是聊天机器人的核心算法,例如OpenAI的ChatGPT和谷歌的Bard所使用的PaLM。目前最大的模型拥有数千亿个参数,训练成本高达数十亿美元。

尽管像ChatGPT这样的通用模型能够帮助用户完成从电子邮件到诗歌的多种任务,但专注于特定知识领域的模型可以更小,更易于使用。例如,经过高质量医学知识训练的法学硕士可能会使循证信息的获取更加普及,从而更好地支持临床决策。

虽然已有许多努力旨在提升法学硕士的医学知识和推理能力,但迄今为止,所产生的人工智能要么是封闭源(如MedPaLM和GPT-4),要么是规模有限,约130亿个参数,这限制了它们的可访问性和能力。

为改善可访问性和代表性,EPFL计算机与通信科学学院的研究人员开发了MEDITRON 7B和70B,这是一对分别具有70亿和700亿参数的开源法学硕士,专为医疗领域设计,并在他们发布在预印服务器arXiv上的文章中进行了详细描述,“MEDITRON-70B:扩展大型语言模型的医疗预训练。”

MEDITRON基于meta发布的开放获取lama-2模型,在临床医生和生物学家的持续参与下,接受了精心挑选的高质量医疗数据的训练。这些数据包括来自PubMed等开放存取库的同行评审医学文献,以及一系列独特的多种临床实践指南,涵盖多个国家、地区、医院和国际组织。

“在开发MEDITRON后,我们进行了四项主要医疗基准评估,结果显示其性能超越了所有其他可用的开源模型,以及封闭的GPT-3.5和Med-PaLM模型。

在一个许多人对人工智能快速发展感到怀疑甚至恐惧的时代,机器学习和优化实验室(MLO)负责人Martin Jaggi教授强调了EPFL MEDITRON开源的重要性,包括管理医学预训练语料库和模型权重的代码。

“MEDITRON的训练方式和使用的数据都是透明的。我们希望研究人员能够对我们的模型进行压力测试,并通过他们的改进使其更加可靠和健壮,从而在长期和必要的实际验证过程中建立工具的安全性。这些都是大型科技公司开发的封闭模型所无法实现的。”

由世卫组织和耶鲁大学医学院联合主办的全球智能卫生技术实验室主任、医学博士Mary-Anne Hartley教授正在负责这项研究的医学方面工作。“我们在设计MEDITRON时就考虑到了安全性。它的独特之处在于,它从透明的高质量证据来源对医学知识进行编码。现在,重要的工作是确保该模型能够恰当、安全地传递这些信息。”

这些高质量证据的来源之一是红十字国际委员会的临床实践指南。

红十字国际委员会数字卫生项目负责人哈维尔·埃尔金博士表示:“新的卫生工具往往对人道主义环境的需求不敏感。”红十字国际委员会是人道主义原则的关键守护者,我们很高兴与EPFL的这项倡议合作,使我们能够将我们的指导方针纳入技术中。”

12月初,在日内瓦举行的联合研讨会将探讨这种技术的潜力、局限性和风险,并由作者在MEDITRON上举行特别会议。

“我们开发MEDITRON是因为获取医学知识应该是一项普遍的权利,”Bosselut总结道。“我们希望这将成为研究人员在实践中安全地适应和验证这项技术的一个有用的起点。”

更多信息:陈泽明等,MEDITRON-70B: Scaling Medical Pretraining for Large Language Models, arXiv(2023)。DOI: 10.48550/ arXiv .2311.16079

由洛桑联邦理工学院提供
引用:研究人员开发了医学知识的大型语言模型(2023年,11月28日),检索于2023年11月29日https://techxplore.com/news/2023-11-large-language-medical-knowledge.html 作品受版权保护。除为私人学习或研究目的而进行的任何公平交易外,未经书面许可,不得转载任何部分。的有限公司 内容仅供参考之用。

本文来自作者[雅旋小公主]投稿,不代表光诉信息立场,如若转载,请注明出处:https://m.xrwohh.cn/zheh/202507-462.html

(5)

文章推荐

  • 桐庐疫情什么店可以开(疫情什么店能开)

    桐庐这个星期可以办喜宴吗1、可以。根据桐庐县疫情防控中心显示:截止至2022年12月9日,桐庐县全域属于是低风险地区,城市一切正常运营,所以是可以办喜宴的,桐庐县,是浙江省杭州市辖县,位于浙江省西北部、杭州市中部低山丘陵区。2、桐庐里面有个乡叫莪山畲族乡,是

    2025年07月05日
    0
  • 许昌疫情74(许昌疫情何时解除)

    许昌调整中心城区封控管控区通告许昌调整中心城区封控管控区通告最新...自5月20日12时起,对中心城区部分封控、管控区域进行调整,现将调整情况通告如下:以下区域由封控区调整为管控区魏都区西大街道:曹魏古城,魏源广场;南关街道:思故台市场,开源市场,新世纪市场

    2025年07月05日
    0
  • 山西天镇疫情最新情况(山西天朔最新消息)

    大同云沁园有几个感染阳性1、阳性感染者F67,男,居住在平城区德盛嘉园小区,系阳性感染者F66的儿子。11月20日,9:47到小区采样点采集核酸;11月22日,8:00到大同三中(扫场所码);11月23日,9:53到小区采样点采集核酸;11月26日,8:00

    2025年07月05日
    0
  • 湖南攸县最新疫情(湖南攸县疫情轨迹)

    攸县有没有疫情湖南攸县小学不会延迟开学。湖南攸县没有疫情,攸县教育局没有发布延迟开学的通知,所以,湖南攸县小学不会延迟开学。攸县教育局只发布过开学通知:根据上级通知精神,结合我县实际,我县中小学校、幼儿园开学时间安排如下:高中8月29日,初中8月30日,小学

    2025年07月05日
    0
  • 象山县疫情防控办(象山县疫情防控办电话)

    宁波象山竟陵谷受疫情影响暂时封闭还有刺激的山地卡丁车,景点特别适合亲子旅游。不过最近宁波受疫情影响,象山精灵谷暂时关闭。当前位置女士们、先生们:当前新冠肺炎疫情形势严峻,必须有效遏制疫情蔓延。根据新冠肺炎疫情防控相关规定,象山竟陵谷景区将于2021年12月1

    2025年07月05日
    0
  • 漳平市疫情防控中心电话(漳平市防疫站)

    厦门高崎是低风险地区吗?月已经公布为低风险地区含厦门思明区、湖里区等。高崎属于低风险地区范畴。属于。根据查询相关资料显示:截止到2022年8月24日,厦门高崎机场是我国低风险地区,属于疫情风险区,高崎机场位于厦门湖里区翔云一路,湖里区有2个中风险地区,除中风

    2025年07月05日
    0
  • 临泽县最新疫情(临泽县属于哪个地区)

    张掖现在能进去吗1、张掖丹霞地貌进入的入口选择:北门:适合想要热闹、住宿更方便、想去丹霞小镇游玩的游客。但需要注意的是,北门的人流量可能较大。西门:适合想要尽快进入园区、喜欢看风景并避开一部分人流的游客。根据个人的旅游需求和偏好,可以选择合适的入口进入张掖丹

    2025年07月05日
    0
  • 广东从化市疫情确诊最新消息(广州从化疫情数据)

    2021从化初中分数线分。根据查询从化中学官网信息显示,广州市普通高中录取最低的控制分数线为515分,但是从化中学作为省重点中学,录取分数线应该在第一到第三个梯度控制线之间,也就是最低610分。分。查询广州市教育网显示2021广州市从化区流溪中学录取分数线:

    2025年07月05日
    0
  • 江苏如皋疫情最新消息(江苏如皋新冠)

    从上海青浦回到江苏如皋需要做哪些事?目前两地都是疫情低风险地区,上海青浦回江苏如皋不需要核酸检测和隔离,只需要向社区或者村委报备一下就可以。不需要隔离,因为上海和南通都属于新冠低风险区域。你可以到你那的汽车站直接买去青浦的汽车票,或买到上海其它汽车站的都可以

    2025年07月05日
    0
  • 山东临沂疫情消息(山东临沂疫情最新情况播报)

    10月21日临沂新增3例无症状(10月21日临沂新增3例无症状感染)临沂市在集中隔离人员中发现3例无症状感染者2022年10月21日0时至24时,临沂市在集中隔离人员中发现3例新冠肺炎阳性感染者,经专家组诊断均为新冠肺炎无症状感染者。无症状感染者1:学生,居

    2025年07月05日
    0

发表回复

本站作者后才能评论

评论列表(4条)

  • 雅旋小公主
    雅旋小公主 2025年07月04日

    我是光诉信息的签约作者“雅旋小公主”!

  • 雅旋小公主
    雅旋小公主 2025年07月04日

    希望本篇文章《科学家们构建了一个先进的医学知识语言模型》能对你有所帮助!

  • 雅旋小公主
    雅旋小公主 2025年07月04日

    本站[光诉信息]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 雅旋小公主
    雅旋小公主 2025年07月04日

    本文概览:   EPFL的研究团队最近推出了Meditron,这是全球性能最优的开源大型语言模型,专为医疗行业设计,旨在辅助临床决策。...