关键模型发布2026-06-18 06:32:28

OpenAI推出专家认证生命科学AI评估基准LifeSciBench

OpenAI在更新GPT-Rosalind生命科学大模型的同时，推出专家开发评审的LifeSciBench基准，用于评估AI处理真实生命科学研究任务的能力。和现有单一维度基准不同，它覆盖多领域任务，更贴合真实科研流程。

编辑视角

生命科学是AI高价值落地赛道，该基准推动AI生命科学模型评估系统化，帮助业界衡量模型真实能力，对行业发展有重要参考价值。

深度解读

主旨：OpenAI配合GPT-Rosalind生命科学大模型更新，推出LifeSciBench评估基准，解决现有基准仅覆盖单一模块或生物领域的缺陷，提供贴合真实科研流程的系统化评估方案。证据：官方信息显示该基准由173位生物技术、制药领域科学家合作开发，包含750项专家编写任务，覆盖七个生物学研究工作流程，经外部专家评审。边界：目前未公开该基准是否完全开源，也未披露普通第三方可免费使用的获取途径，当前仅服务于OpenAI自身模型评估。后续观察点：需关注该基准是否对外开放，能否成为行业通用评估标准。

核心要点

OpenAI推出专家开发评审的生命科学AI评估基准LifeSciBench
该基准覆盖多领域任务，比现有基准更贴合真实科研流程
配合GPT-Rosalind更新推出，用于衡量生命科学AI模型性能