​ITCOW牛新网 1月14日消息,谷歌今日推出新一代医疗AI模型MedGemma 1.5 4B及专用语音识别系统MedASR。此次发布的产品针对医疗场景优化,其中MedGemma 1.5 4B作为可本地化部署的轻量级模型,在文本和医学影像分析能力上实现显著提升,并首次支持CT、MRI等三维医疗数据的处理。

谷歌发布MedGemma 1.5医疗AI模型

新模型在准确率方面表现突出。测试数据显示,MedGemma 1.5 4B在多项基准测试中的得分不仅超越前代产品MedGemma 1 4B,甚至部分指标优于参数规模更大的MedGemma 1 27B模型。同步推出的MedASR语音识别系统专门针对医学术语优化,对胸部X光片相关对话的转录错误率低至5.2%,显著优于OpenAI的Whisper large-v3模型12.5%的错误率。

谷歌发布MedGemma 1.5医疗AI模型
谷歌发布MedGemma 1.5医疗AI模型
谷歌发布MedGemma 1.5医疗AI模型

据ITCOW牛新网了解,MedGemma系列模型已形成完整生态。前代产品支持胸部X光片、病理组织图像等二维医学影像分析,而MedGemma 1.5 4B进一步扩展至三维影像领域。目前该系列已衍生出超过500款定制化模型,开发者可基于开源版本进行针对性优化。谷歌表示,MedASR的转录结果可直接作为MedGemma系列的输入指令,形成完整的诊疗辅助工作流。

谷歌发布MedGemma 1.5医疗AI模型
谷歌发布MedGemma 1.5医疗AI模型

谷歌强调,MedGemma系列模型将持续免费向开发者开放。此次升级的重点在于提升模型实用性和易用性,特别是轻量级设计使得算力有限的医疗机构也能本地部署高性能AI辅助诊断工具。随着医疗AI技术的快速发展,此类专业模型有望在临床诊断、医学研究和医疗教育领域发挥更大作用。