谷歌发布MedGemma 1.5医疗AI模型：支持3D医学影像分析，语音识别错误率低至5.2%

ITCOW牛新网 1月14日消息，谷歌今日推出新一代医疗AI模型MedGemma 1.5 4B及专用语音识别系统MedASR。此次发布的产品针对医疗场景优化，其中MedGemma 1.5 4B作为可本地化部署的轻量级模型，在文本和医学影像分析能力上实现显著提升，并首次支持CT、MRI等三维医疗数据的处理。

新模型在准确率方面表现突出。测试数据显示，MedGemma 1.5 4B在多项基准测试中的得分不仅超越前代产品MedGemma 1 4B，甚至部分指标优于参数规模更大的MedGemma 1 27B模型。同步推出的MedASR语音识别系统专门针对医学术语优化，对胸部X光片相关对话的转录错误率低至5.2%，显著优于OpenAI的Whisper large-v3模型12.5%的错误率。

据ITCOW牛新网了解，MedGemma系列模型已形成完整生态。前代产品支持胸部X光片、病理组织图像等二维医学影像分析，而MedGemma 1.5 4B进一步扩展至三维影像领域。目前该系列已衍生出超过500款定制化模型，开发者可基于开源版本进行针对性优化。谷歌表示，MedASR的转录结果可直接作为MedGemma系列的输入指令，形成完整的诊疗辅助工作流。

谷歌强调，MedGemma系列模型将持续免费向开发者开放。此次升级的重点在于提升模型实用性和易用性，特别是轻量级设计使得算力有限的医疗机构也能本地部署高性能AI辅助诊断工具。随着医疗AI技术的快速发展，此类专业模型有望在临床诊断、医学研究和医疗教育领域发挥更大作用。

谷歌发布MedGemma 1.5医疗AI模型：支持3D医学影像分析，语音识别错误率低至5.2%

相关文章

银河通用机器人完成25亿元融资，春晚“真干活”获资本青睐

阿里巴巴AI品牌统一为“千问”，春节DAU暴涨940%成国民级应用

阿里通义发布语音双模型：一句话自由生成，支持多语种复刻与场景化音频

更多资讯

苹果iPhone 17e正式发布：A19芯片加持，起售价4499元

小鹏第二代VLA发布：端到端架构重构智驾范式，大众成首发客户

OpenAI疑似收购GPT.com域名，重定向至ChatGPT官网

联想发布2026款ThinkPad T系列：AI算力升级，轻薄与可维修性并重