• 验证码登录/注册
  • 密码登录

登录失败,用户名或者密码错误


备注:已注册帐号可切换到密码登录,初始密码为123456。
收不到验证码请联系微信客服:shifenyuedukf
登录

首页  > 快讯

对话中国工程院院士:DeepSeek,究竟厉害在哪里?

2月前
【对话中国工程院院士:DeepSeek,究竟厉害在哪里?】1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。DeepSeek究竟厉害在哪里?今日,中国工程院院士、清华大学计算机系教授郑纬民及多位AI圈人士在与新浪科技沟通中,指出了DeepSeek其成功出圈的关键所在。在郑纬民看来,DeepSeek通过自研的MLA架构和DeepSeek MOE架构,为其自身的模型训练成本下降,起到了关键作用。他指出,“MLA主要通过改造注意力算子压缩了KV Cache大小,实现了在同样容量下可以存储更多的KV Cache,该架构和DeepSeek-V3模型中FFN 层的改造相配合,打造了目前公开最大的稀疏MoE 层,这成为DeepSeek训练成本低最关键的原因。” 此外,据郑纬民透露,DeepSeek还解决了“非常大同时非常稀疏的MoE模型”使用的性能难题,而这也成了“DeepSeek训练成本低最关键的原因”。

最新快讯搜索

新能源 汽车 特朗普 st 降息 宁德时代 半导体 中国 股票交易异常波动 deepseek A股 蔚来 以旧换新 涨停 茅台 理想汽车 比特币 中芯国际 阿里 资产重组 AI 孚能科技 中信证券 中国平安 贝莱德 小红书 新能源汽车 哪吒汽车 上交所 中信建投 大选 曲江文旅 稀土 OpenAI 瑞幸咖啡 动力电池 房贷 美国大选 三连板 投票 腾讯控股 破净发 存量房贷利率 江淮汽车 上证指数 欣旺达 北汽蓝谷 越南 泸州老窖 智能驾驶 贵州茅台 悟空 存量房贷 黑神话 寻呼机 破净 润和软件 无人潜水器 今日收评 绝地求生 AI出海 AI模型公司 弹匣电池 黑神话:悟空 电池回收 蜀道装备 3000点 茅台酒价 连板股 广交会 三元电池 四连板 存量房贷下调 白马股