首页 > 快讯
OpenAI:GPT-5 在回答健康相关问题时表现更出色。在衡量 AI 模型健康主题回应准确性的测试 “HealthBench Hard Hallucinations” 中,GPT-5(启用思考功能时)的幻觉率仅为 1.6%。这远低于该公司此前的 GPT-4o 和 o3 模型,后两者的幻觉率分别为 12.9% 和 15.8%。
OpenAI:GPT-5 在回答健康相关问题时表现更出色。在衡量 AI 模型健康主题回应准确性的测试 “HealthBench Hard Hallucinations” 中,GPT-5(启用思考功能时)的幻觉率仅为 1.6%。这远低于该公司此前的 GPT-4o 和 o3 模型,后两者的幻觉率分别为 12.9% 和 15.8%。