DeepSeek大模型上新 关联下代中国芯

新闻要闻 2025-09-14 22:09:23 8

  【大公报讯】据中通社报道:中国人工智能(AI)公司深度求索(DeepSeek)21日宣布,模型其最新大语言模型DeepSeek-V3.1正式发布。上新

  据DeepSeek介绍,关联新讯速报新升级版本变化体现在三方面:混合推理架构、下代芯更高的中国思考效率、更强的模型Agent(智能体)能力。通过“深度思考”按钮切换,上新DeepSeek-V3.1实现一个模型同时支持两种模式:面对简单问题时,关联能以“非思考模式”快速回答。下代芯处理复杂问题时,中国新讯速报可切换到“思考模式”,模型给出更具深度和逻辑的上新解答。此外,关联DeepSeek-V3.1使用了UE8M0 FP8 Scale的下代芯参数精度。DeepSeek官方公众号在其文章置顶留言里说,中国UE8M0 FP8是针对即将发布的下一代中国产芯片设计。

  官方数据显示,与今年5月发布的旗舰推理模型DeepSeek R1升级版本“R1-0528”相比,DeepSeek-V3.1在思考模式下效率大幅提升,能在更短时间给出答案,token(大模型文本处理的最小单位)消耗量可减少20%至50%,各项任务平均表现与R1-0528持平。

本文地址:http://yaowen.thinknovo.com/html/79c93898982.html
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

全站热门

2025年首次“中国好人榜”发布

北京交通部门全力抢修保通 怀柔、平谷实现全区道路断点应急连通

微动漫|汛期安全“必修课”,这些避险知识能救命!

遇到山洪不要怕!收好这份避险指南!

科学报国正当时|名字玄、门槛高?看量子信息科学如何重塑未来

友情链接