DeepSeek首轮融资3亿美元,V4模型将彻底摆脱英伟达依赖
DeepSeek打破“从不融资”铁律
今早,AI圈因一则重磅消息沸腾:外媒The Information爆料,DeepSeek正寻求首次外部融资,目标是以不低于100亿美元的估值筹集至少3亿美元。作为幻方量化旗下的明星项目,DeepSeek此前一直拒绝国内顶级风投和科技巨头的投资意向,坚持保持独立性。然而,在AI大模型开发竞赛愈发烧钱的背景下,DeepSeek终于选择启动融资。
V4:一场万亿参数的硬仗
据路透社报道,DeepSeek V4原定于今年2月发布,但已多次跳票,最新时间窗口指向“未来几周内”。V4的规模和野心远超前代,参数量跃升至万亿级别,并采用MoE架构,每个token仅激活约370亿参数,推理成本与V3持平。此外,V4还将引入名为Engram的条件记忆架构,支持100万token上下文窗口,信息召回率高达97%。
V4将是DeepSeek首个原生多模态模型,支持文本、图像和视频生成,同时大幅强化代码能力。内部benchmark显示,其在SWE-bench和HumanEval测试中分别取得超过80%和90%的成绩,能够处理整个代码仓库级别的复杂bug修复。
脱离英伟达生态的战略抉择
V4的核心亮点之一是其底层硬件的迁移。DeepSeek工程师花费大量时间将V4从英伟达CUDA生态迁移到华为CANN架构。如果V4能在华为昇腾芯片上跑出有竞争力的性能,它将成为全球首个不依赖英伟达的前沿AI模型。这一技术决策也引发了英伟达创始人黄仁勋的关注,他在近期采访中直言:“这对美国来说将是一个糟糕的结果。”
融资背后的压力与机遇
尽管DeepSeek以“花小钱办大事”著称,但在中美AI竞争日益激烈的背景下,每一步追赶的边际成本都在攀升。根据斯坦福大学2026年度AI指数报告,截至今年3月,美国顶级模型与中国最强竞品之间的性能差距仅剩2.7个百分点。此次融资不仅为DeepSeek提供了更多算力支持,还帮助其防止顶尖研究者流失。
据悉,V4预计将分两个版本发布:完整版超万亿参数,针对高级推理和复杂代码任务优化;轻量版约2000亿参数,面向通用对话和API服务。DeepSeek计划以Apache 2.0协议开放权重,延续一贯的开源策略。
大规模部署进入倒计时
多个信源指向V4将于4月底正式发布。3月9日,一个名为“V4 Lite”的版本曾短暂出现在DeepSeek平台上,随后被撤下。4月初,开发者发现API节点上出现了V4 Lite的测试版本,推理速度提升30%,128K上下文的信息召回率从45%跃升至94%。
近日,DeepSeek还在内蒙古乌兰察布发布了服务器运维工程师和交付经理的招聘岗位,这是该公司首次公开招聘算力基础设施相关的驻场人员。种种迹象表明,V4已经不在实验室里,而是在为大规模部署做最后准备。






