DeepSeek V4 彻底抛弃英伟达,GPT-6 下周来袭:AI 芯片战场的新格局

科技1个月前发布 leso
30 0 0

同一个星期,中美AI圈各扔出一颗重磅炸弹,凑在一起看,画面相当有意思。

先说国内这边。DeepSeek 官宣,V4 版本训练和推理全面切换华为昇腾 950PR,底层代码从英伟达的 CUDA 迁移到了华为的 CANN 框架,彻底断开对英伟达的依赖。这不是嘴上说说——华为专门为 V4 的万亿参数 MoE 架构定制了大规模专家并行方案,配合 OptiQuant 量化技术,INT8 精度跑出了和 FP8 持平的效果,单卡解码吞吐达到 1920 Tokens/s,时延低到 50ms。三大运营商云、神州数码已经在用”昇腾 + DeepSeek”的组合上线商用服务了。这件事的意思很直白:国产 AI 从模型到算力,第一次跑通了完整的自主链路。

另一边,OpenAI 的内部消息也兜不住了。代号”土豆”的 GPT-6 据传定档 4 月 14 日发布,性能较 GPT-5.4 提升约 40%,上下文窗口直接拉到 200 万 Token,原生支持文本、图像、音频、视频四合一多模态,不需要外挂插件。更关键的是,为了给 GPT-6 让路,Sora 项目已经暂停,OpenAI 内部重组出一个”AGI 部署部”,奥特曼这把是真梭哈了。GPT-5 预览版刚在旧金山演示完没几天,GPT-6 就要接着上——这个节奏,大概是AI史上迭代最快的时期之一。

两件事放在一起,有种微妙的对称感:一边是中国用国产芯片跑通了世界顶级大模型,一边是美国下一代旗舰模型准备登场。接下来这一周,AI 圈估计没人敢刷太快——随时可能错过什么。

你更期待哪个:DeepSeek V4 正式对外开放,还是 GPT-6 的首发体验?

© 版权声明

相关文章

暂无评论

none
暂无评论...