首页 > 快讯
OpenAI首席执行官:评估并非最重要的事 —— 最重要的是我们认为这个模型会有多大用处 —— 但它在评估中的表现确实不错。例如,在 SWE-bench(软件工程师基准测试)和其他众多指标上都创下了新高。这是我们迄今为止推出的最可靠、最贴合事实的模型。
OpenAI首席执行官:评估并非最重要的事 —— 最重要的是我们认为这个模型会有多大用处 —— 但它在评估中的表现确实不错。例如,在 SWE-bench(软件工程师基准测试)和其他众多指标上都创下了新高。这是我们迄今为止推出的最可靠、最贴合事实的模型。