DeepSeek自研大模型V3.2亮相!华为、寒武纪芯片同步适配开源,API成本将降低50%以上

内容分享6小时前发布
2 19 0

国庆长假在即,Deepseek又放大招了!

9月29日,DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。

该版本作为迈向下一代架构的重大中间步骤,在 V3.1-Terminus的基础上引入了团队自研的DeepSeek Sparse Attention (DSA)稀疏注意力机制,旨在对长文本的训练和推理效率进行探索性优化与验证。这种架构能够降低计算资源消耗并提升模型推理效率。

目前,华为、寒武纪已完成对 DeepSeek-V3.2-Exp模型的适配工作,最大可支持160K长序列上下文长度。

DeepSeek自研大模型V3.2亮相!华为、寒武纪芯片同步适配开源,API成本将降低50%以上

核心技术突破:DeepSeek Sparse Attention (DSA)

DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制。DeepSeek 方面表明,这项技术在几乎不影响模型输出效果的前提下,大幅提升了长文本场景下的训练和推理效率

DeepSeek自研大模型V3.2亮相!华为、寒武纪芯片同步适配开源,API成本将降低50%以上

为了确保评估的严谨性,DeepSeek-V3.2-Exp 的训练设置与前代 V3.1-Terminus 进行了严格对齐。测试结果显示,该模型在各大公开评测集上的表现与 V3.1-Terminus 基本持平,有效性得到了初步验证。

DeepSeek自研大模型V3.2亮相!华为、寒武纪芯片同步适配开源,API成本将降低50%以上

API成本将降低50%以上

随着新模型服务成本的显著降低,DeepSeek 同步采取了重磅举措:大幅下调官方 API 价格,降价幅度超过 50%,新价格已即刻生效。目前,官方 App、网页端和小程序均已同步更新至 DeepSeek-V3.2-Exp 版本。

DeepSeek自研大模型V3.2亮相!华为、寒武纪芯片同步适配开源,API成本将降低50%以上

DeepSeek 现已将 DeepSeek-V3.2-Exp 模型在 Huggingface 和 ModelScope 平台上全面开源,相关论文也已同步公开。

作为一款实验性版本,DeepSeek 认识到模型仍需在更广泛的用户真实场景中进行大规模测试。为便于开发者进行效果对比,DeepSeek 为 V3.1-Terminus 版本临时保留了 API 访问接口,且调用价格与 V3.2-Exp 保持一致。该对比接口将保留至北京时间 2025 年 10 月 15 日 23:59。

此外,为支持社区研究,DeepSeek 还开源了新模型研究中设计和实现的 GPU 算子,包括 TileLang 和 CUDA两种版本。团队提议社区在进行研究性实验时,优先使用基于 TileLang 的版本,以便于调试和快速迭代。

值得注意的是,寒武纪在深度求索发布新模型的同时宣布完成适配,并开源vLLM-MLU推理引擎源代码,开发者可在寒武纪软硬件平台上即时体验新模型功能。

AI行业资深专家指出,芯片与大模型的适配涉及底层架构优化、算力资源匹配、兼容性调试等复杂工作,绝非短时间内能够完成。如此快速的适配响应表明寒武纪早在DeepSeek-V3.2发布前就已启动相关研发工作,双方技术团队的沟通协作早已悄然展开。

本文来自华尔街见闻,欢迎下载APP查看更多

© 版权声明

相关文章

19 条评论

  • 头像
    文文亘 投稿者

    底层用的谷歌技术框架

    无记录
    回复
  • 头像
    一分钟快三技巧数学公式 读者

    民族英雄梁文峰,堪称伟大

    无记录
    回复
  • 头像
    读者

    小艺盘古大模型确定不高了?可是我觉得小艺很聪明,理解能力很强

    无记录
    回复
  • 头像
    打工人的摸鱼日常 投稿者

    deepseek要载入史册了

    无记录
    回复
  • 头像
    席林S 投稿者

    群雄毕至,星辉灿烂,群策群力,必会硕果累累!

    无记录
    回复
  • 头像
    不是李ooo 投稿者

    主要是降本,Transformer技术面临瓶颈,哪一家都不可能有重大的突破。

    无记录
    回复
  • 头像
    一分钟快三技巧与规律经验总结 读者

    deepseek团队伟大

    无记录
    回复
  • 头像
    海碗炸炸 投稿者

    AI应用又要启动了

    无记录
    回复
  • 头像
    燕翔云天 读者

    我什么时候可以用上呢

    无记录
    回复
  • 头像
    赫章 读者

    DpSK::助力寒武纪,海光信息等等AI 算力 芯片组,又要开始大涨了!

    无记录
    回复
  • 头像
    cinderella1644344793 投稿者

    还得努力啊!我慢慢转向gpt5了!准确率高很多!不过简单问题还是会去ds

    无记录
    回复
  • 头像
    趋势为王 读者

    又是一次小更新,V4啥时候出来

    无记录
    回复
  • 头像
    善瑞堂 读者

    英伟达还在涨

    无记录
    回复
  • 头像
    白鹿视频 投稿者

    很好用

    无记录
    回复
  • 头像
    丝ssgirl 读者

    160K目前已经不算很长的了

    无记录
    回复
  • 头像
    不爱你的人5 投稿者

    deepseek很强大,很聪明

    无记录
    回复
  • 头像
    轻舞飞扬 读者

    美国真慌了

    无记录
    回复
  • 头像
    高兴 读者

    太好了,兴奋

    无记录
    回复
  • 头像
    总店主理人阿米 读者

    自建?

    无记录
    回复