• 登录/注册

登录失败,用户名或者密码错误


登录

首页  > 快讯

李飞飞团队s1模型基于Qwen训练?阿里云确认:基于Qwen2.5-32B-Instruct模型训练

1年前
【李飞飞团队s1模型基于Qwen训练?阿里云确认:基于Qwen2.5-32B-Instruct模型训练】今日,李飞飞等斯坦福大学和华盛顿大学研究人员以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型,该模型在数学和编码能力测试中的表现与OpenAl的o1和Depsek的R1等尖端推理模型类似,引发广泛关注。不过很快,该s1模型被指“并非从零开始训练”,其基座模型为“阿里通义千问(Qwen)模型”。对此,新浪科技向阿里云方面求证,阿里云方面确认了这一消息,并回应称:“他们以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座,在16块H100 GPU上监督微调26分钟,训练出新模型s1-32B, 取得了与OpenAI的o1和DeepSeek的R1等尖端推理模型数学及编码能力相当的效果,甚至在竞赛数学问题上的表现比o1-preview高出27%。”(新浪科技)

最新快讯搜索

中国 阿里 OpenAI 中国平安 涨停 汽车 以旧换新 越南 deepseek AI 半导体 稀土 上证指数 欣旺达 投票 理想汽车 腾讯控股 中信证券 特朗普 A股 宁德时代 小红书 比特币 上交所 新能源 黑神话:悟空 降息 新能源汽车 存量房贷利率 大选 股票交易异常波动 茅台 蔚来 瑞幸咖啡 存量房贷 动力电池 房贷 资产重组 st 贝莱德 孚能科技 美国大选 北汽蓝谷 中信建投 中芯国际 电池回收 智能驾驶 悟空 黑神话 哪吒汽车 泸州老窖 贵州茅台 四连板 曲江文旅 蜀道装备 88952634s3 88952634-0 88952634'`"( 88952634 江淮汽车 三连板 广交会 弹匣电池 连板股 今日收评 茅台酒价 破净 3000点 AI模型公司 无人潜水器 三元电池 AI出海 白马股 绝地求生 破净发 寻呼机 润和软件 存量房贷下调