Image Image

新闻资讯

DeepSeek 转投华为芯片

时间:2026/04/20

返回列表

4 月 18 日消息,DeepSeek 创始人梁文锋启动公司创立以来首轮融资。这家此前坚持不融资的头部大模型企业,计划以不低于 100 亿美元估值,

募资至少 3 亿美元,为持续激烈的 AI 赛道长期竞争储备资金。

AI 大模型研发耗资巨大,资金储备直接决定技术研发上限。同时 DeepSeek 将于本月底正式发布全新 V4 大模型。该版本虽历经多次延期,

但其搭载的万亿参数 MoE 架构依旧备受业界期待。

V4 延续品牌高效轻量化研发思路,整体参数规模达 1 万亿,单 Token 仅激活 370 亿参数,可将推理成本维持在 V3 前代水平,高性价比依旧是其核心优势。

据内部消息,版本延期并非模型技术问题,而是底层硬件全栈迁移。DeepSeek 过往模型均基于英伟达芯片训练,此次 V4 将全面切换至华为最新昇腾芯片。

研发团队完成了底层架构重构,重写核心代码,实现从英伟达 CUDA 生态向华为 CANN 架构的完整迁移。本次 DeepSeek 未对英伟达、

AMD 开放先期适配权限,优先独家适配国产芯片,战略转向意义重大。

若 V4 在国产芯片上实现高性能稳定运行,将成为全球首款脱离英伟达硬件生态的前沿大模型,实现 AI 软硬件自主闭环,推动国产 AI 产业链实现关键突破。

英伟达 CEO 黄仁勋对此表达担忧,其公开表示,顶尖大模型适配国产芯片或将带来不利影响,一旦模型在国产硬件上性能领先,

英伟达长期构筑的生态壁垒将受到严重冲击。

803f2900be18494b8572269e79f9ff05.jpg


提交需求

泰盛国际提供您需要的电子元件。泰盛国际代表将在 24 小时内就产品定价和供货情况与您联系。
看不清,请点击图片更换
提交