DeepSeek-V4正式发布:百万上下文+全面开源,国产大模型再突破

事件概述

4月24日,国产AI公司深度求索(DeepSeek)正式发布新一代旗舰大模型DeepSeek-V4,并同步开源全部模型权重。这是继V3版本之后的重大迭代,核心突破在于将上下文窗口从128K扩展至100万Token级别,同时保持MIT协议完全开源。

核心亮点

1. 百万级上下文能力
V4系列支持最高100万Token的上下文窗口,约等于一次性处理300万中文字符。这一能力让AI能够真正"读完整本书再讨论",在长文档分析、代码库理解等场景实现质的飞跃。

2. 稀疏注意力技术创新
V4采用DSA稀疏注意力机制,在百万上下文设置下,每个Token的算力消耗仅为V3的27%,KV缓存占用仅为10%。这意味着更低的推理成本和更快的响应速度。

3. Agent能力专项优化
V4针对OpenClaw、Claude Code等主流AI智能体产品进行了深度适配,在代码任务、文档生成等场景表现显著提升。官方建议复杂Agent场景使用"思考模式-极限"。

4. 国产算力深度适配
华为昇腾超节点宣布全面支持DeepSeek-V4,寒武纪同步完成Day 0适配。这标志着国产AI生态在算力层实现关键突破。

5. 价格延续高性价比
V4-Flash API定价为输入1元/百万Token、输出2元/百万Token,V4-Pro为12元和24元。官方表示下半年昇腾950批量上市后,Pro版本价格将大幅下调。

行业影响

DeepSeek-V4的发布对行业有三重意义:

对开发者:开源+低价+长上下文的组合,让中小团队也能构建复杂的AI应用,不再受限于算力成本。

对行业竞争:V4与OpenAI同天发布的GPT-5.5形成正面竞争,两者在技术路线上殊途同归(均强调Agent能力),但在商业模式上各走极端(开源vs闭源)。

对国产生态:华为、寒武纪等国产芯片的快速适配,证明了国产AI产业在摆脱外部依赖方面迈出关键一步。

开源不是终点,而是生态卡位战的起点。

上一篇:

发表回复

评论列表

    Loading...

    联系我们

    在线咨询: QQ交谈

    微信:叁叁

    邮件:794033364@qq.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    微信