DeepSeek
中国 AI 研究公司,以开源大语言模型闻名。
DeepSeek V4(2026-04-24)
正式发布 V4 模型,核心参数:
- 1 万亿参数
- 100 万 token 上下文窗口
- 运行在华为昇腾芯片上(非 NVIDIA GPU)
此前因华为芯片供应瓶颈多次延期。HN 首页 299 分、93 条评论。
意义
- 首个在国产芯片上运行的万亿参数级模型,突破 US 芯片制裁限制
- 100 万 token 上下文窗口达到行业领先水平
- 展示了非 NVIDIA 生态在 AI 训练上的可行性
华为芯片训练扩展(2026-04-30)
DeepSeek 进一步扩大采用华为昇腾芯片进行 AI 模型训练,从 V4 推理扩展到训练工作负载。这反映北京在美国出口管制升级背景下推进 AI 基础设施全面自主化的战略决心。AI 芯片竞赛正在沿地缘政治路线加速分裂。来源:Reuters。
V4 Pro Benchmark 与开源 LLM 竞争(2026-05-06)
DeepSeek V4 Pro 发布详细基准测试成绩:
- SWE-Bench Verified: 80.6 分
- GPQA Diamond: 90.1 分
- 100 万 token 上下文窗口
同期开源 LLM 竞争极其激烈,30 天内密集发布:Llama 4、Qwen 3.5、Gemma 4、Mistral Medium 3.5、Kimi K2.6、GLM-5.1。分析师认为 V4 可能提振国产 AI 芯片需求。
首轮融资估值 450-500 亿美元(2026-05-07)
据报道中国正准备以约 500 亿美元估值投资 DeepSeek。首轮融资估值可能达到 450 亿美元,显示中国在主权 AI 模型领域的重大布局。DeepSeek 凭借 V4 在华为昇腾芯片上的成功训练,获得了来自国家层面的强力支持。来源:TechCrunch / WSJ。