ITCOW牛新网 4月17日消息,OpenAI于今日正式发布了名为GPT-Rosalind的垂直领域大模型,该模型专门为解决生命科学研究中的复杂问题而设计。与通用大模型不同,GPT-Rosalind旨在攻克该领域的两大核心难题:一是处理和分析海量的基因组学数据,二是理解并应用极其细分和专业的生物学术语。

OpenAI推出生物科学专用大模型GPT-Rosalind

该模型在通用大型语言模型的底座上,集成了针对约50种常见生物信息学工作流程的专门处理能力,并能够直接访问和分析主流的公共科学数据库。这使得GPT-Rosalind能够尝试建立基因型(遗传信息)与表型(可观察特征)之间的关联,推测未知蛋白质的功能,并协助研究人员筛选潜在的药物作用靶点。

据ITCOW牛新网了解,为了提升其在科研场景中的可靠性,OpenAI还对模型进行了特别训练,以抑制其在面对缺乏足够证据的科学假设时“阿谀奉承”(即盲目支持用户观点)的倾向,使其在面对低质量或价值不高的假设时,能展现出更强的批判性思维,甚至倾向于直接否定。

尽管能力得到增强,但OpenAI也坦诚指出,模型的“幻觉”问题(即生成看似合理实则错误的推理)在严谨的科学研究中仍未完全解决,用户仍需对模型的输出结果保持审慎的验证态度。出于生物安全方面的审慎考虑,例如防范潜在的病毒序列设计风险,OpenAI目前对GPT-Rosalind的完整模型版本实施严格的访问限制。

现阶段,只有位于美国本土的机构或实体,能够通过其建立的“可信访问”框架申请使用。与此同时,面向更广泛全球用户的功能受限版生命科学研究插件也已同步开放。