DeepSeek大模型上新 关联下代中国芯
【大公报讯】据中通社报道:中国人工智能(AI)公司深度求索(DeepSeek)21日宣布,模型其最新大语言模型DeepSeek-V3.1正式发布。上新
据DeepSeek介绍,关联新讯速报新升级版本变化体现在三方面:混合推理架构、下代芯更高的中国思考效率、更强的模型Agent(智能体)能力。通过“深度思考”按钮切换,上新DeepSeek-V3.1实现一个模型同时支持两种模式:面对简单问题时,关联能以“非思考模式”快速回答。下代芯处理复杂问题时,中国新讯速报可切换到“思考模式”,模型给出更具深度和逻辑的上新解答。此外,关联DeepSeek-V3.1使用了UE8M0 FP8 Scale的下代芯参数精度。DeepSeek官方公众号在其文章置顶留言里说,中国UE8M0 FP8是针对即将发布的下一代中国产芯片设计。
官方数据显示,与今年5月发布的旗舰推理模型DeepSeek R1升级版本“R1-0528”相比,DeepSeek-V3.1在思考模式下效率大幅提升,能在更短时间给出答案,token(大模型文本处理的最小单位)消耗量可减少20%至50%,各项任务平均表现与R1-0528持平。
本文地址:http://yaowen.thinknovo.com/html/79c93898982.html
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。