首页　 >　快讯

李飞飞团队s1模型基于Qwen训练？阿里云确认：基于Qwen2.5-32B-Instruct模型训练

1年前

【李飞飞团队s1模型基于Qwen训练？阿里云确认：基于Qwen2.5-32B-Instruct模型训练】今日，李飞飞等斯坦福大学和华盛顿大学研究人员以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型，该模型在数学和编码能力测试中的表现与OpenAl的o1和Depsek的R1等尖端推理模型类似，引发广泛关注。不过很快，该s1模型被指“并非从零开始训练”，其基座模型为“阿里通义千问(Qwen)模型”。对此，新浪科技向阿里云方面求证，阿里云方面确认了这一消息，并回应称：“他们以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座，在16块H100 GPU上监督微调26分钟，训练出新模型s1-32B，取得了与OpenAI的o1和DeepSeek的R1等尖端推理模型数学及编码能力相当的效果，甚至在竞赛数学问题上的表现比o1-preview高出27%。”（新浪科技）

最新快讯搜索

OpenAI 智能驾驶特朗普汽车 AI 中国 A股 deepseek 中信建投资产重组新能源越南贝莱德上交所比特币降息半导体 st 中信证券阿里存量房贷利率涨停股票交易异常波动中国平安新能源汽车美国大选孚能科技上证指数北汽蓝谷大选蔚来腾讯控股房贷瑞幸咖啡贵州茅台中芯国际动力电池茅台稀土存量房贷破净理想汽车宁德时代黑神话：悟空以旧换新投票黑神话江淮汽车电池回收小红书哪吒汽车曲江文旅泸州老窖欣旺达润和软件三连板四连板绝地求生白马股 3000点广交会连板股今日收评茅台酒价蜀道装备 88952634-0 无人潜水器 88952634s3 88952634 三元电池寻呼机弹匣电池 AI模型公司悟空 AI出海 88952634'`"( 破净发存量房贷下调