新闻动态
如果你相信 AI 将是 21 世纪"人类科技树"上最重要的技能点的话,那么中国正在抢占先机。
1 月 27 日,中国公司深度求索(DeepSeek)旗下生成式 AI 产品 DeepSeek(与公司同名)同时登顶中国区和美国区苹果 AppStore 免费榜。这是第一次,有中国科技产品 APP 实现双榜登顶。被 DeepSeek 压在身后的,包括了 OpenAI 旗下的 ChatGPT 以及 Google Gemini 等 AI 产品。
造成 DeepSeek 登顶的推动力,是其在 1 月 20 日发布的推理大模型 DeepSeek-R1。
这款免费的推理大模型在大模型排行榜" Chatbot Arena "上,已经和 OpenAI 旗下 ChatGPT-4o(最新版)并列基准测试排名第三, 并和 OpenAI 的旗下的 o1 模型在 Chatbot Arena 风格控制类模型分类(即 StyleCtrl)中并列第一名。根据 DeepSeek 自己公布的信息" DeepSeek-R1 在 Codeforces、GPQA Diamond、MATH-500、MMLU、SWE-bench Verified 等测试中,得分与 o1 正式版接近,部分测试中得分还超过 o1 正式版。"
两个关键词,让 DeepSeek 在"评测排名"之外引发滔天热度:开源 + 性价比。
DeepSeek-R1 是一款开源推理大模型。基于 MIT 许可协议(即 MIT License,起源于 1988 年,是科技圈最主流的开源软件许可协议之一)DeepSeek-R1 允许全球开发者自由地修改、使用、分发模型。甚至 DeepSeek-R1 允许开发者进行衍生开发和商用。
作为对比,OpenAI 旗下主流产品产品(GPT-3.5、GPT-4、GPT-o1、GPT-o3、ChatGPT、DALL-E),截至目前都是闭源产品。OpenAI 曾把 GPT-2 进行了"部分开源",但基于 GPT-2 的"开源"并非基于 MIT 许可协议,使用者有相当多的限制和前置条件。同样,OpenAI 曾在一些场合公开展示过 Codex 的部分代码,但这和真正的开源模式全然不同。
DeepSeek 开源带给 OpenAI 的巨大挑战是,当开源产品的"能力"和闭源产品接近甚至反超后者时,对闭源产品的冲击将是巨大的。DeepSeek 下载热度的激增,背后的核心原因之一正是开源:用户可以在自己的服务器或云端免费部署 DeepSeek-R1,且大幅降低(甚至不需要)API 调用费用。根据 DeepSeek 和 OpenAI 公布的信息显示,DeepSeek-R1 的输入 token 定价为 0.55 美元 / 百万,输出 token 为 2.19 美元 / 百万;而 OpenAI 相应的输入 token 定价约为 15 美元 / 百万,输出 token 为 60 美元 / 百万。相当于,OpenAI 的"使用成本"接近于 27.3 倍。
而 DeepSeek 第二个惊人之处,则是其预训练成本了。公开信息显示, DeepSeek-V3 的预训练成本约为 557.6 万美元,整体消耗了 278 万 GPU 小时训练时长。作为对比,OpenAI 仅仅是 GPT-4 的训练成本就接近 1 亿美元(虎嗅注:《斯坦福大学人工智能指数数据报告 2024》认为 GPT-4 的训练成本约为 7800 万美元)。
DeepSeek 对 OpenAI 模式说"不"
DeepSeek 的迅速火爆,尚不能说直接戳破过去几年 OpenAI 所塑造的" AI 神话",但确实证明了,在 OpenAI 之外,存在一种完全不同的 AI 生存逻辑。
OpenAI 的模式本质上基于研发和产品侧的高投入,这也是英伟达等美国科技巨头在过去几年所力推的"算力无限主义",通过无限堆砌算力不断拉高人工智能的边界。而一系列诸如英伟达的公司,扮演着 OpenAI 模式里的"生态位"公司,与 OpenAI 形成攻守同盟。
OpenAI 最大投入是"硬件算力"和"训练及数据成本"。前者,OpenAI 通过多笔融资,以及被纳入"微软联盟"后依托微软提供的"算力券"模式获得补给;后者 OpenAI 通过大量雇佣训练相关人员并与大量数据公司合作,形成稳定的"数据收集、清洗、标注闭环"。在这两大基本轴的共同运转下,OpenAI 成为了过去几年 AI 圈的绝对明星。
这一模式,形成了一个由不同"生态位"公司构筑成的" AI 有机体",这个" AI 有机体"形成了美国 AI 内核的基石之一。
在 OpenAI 的上游,微软扮演着提供基础给养的角色,而为了提供足够的云和算力,微软也成为英伟达等公司的关键客户,每年数以百亿美元计地采购相关硬件。在这一" AI 有机体"里,不只是微软和英伟达这样的超级巨头,还包括了 Crusoe Energy 这样专注于数据中心、基础设施的公司,它们都成为这个" AI 有机体"的关键一环。
在" AI 有机体"里还有大量围绕"数据"而存活的公司,诸如 Scale AI 等数据标注类公司,源源不断给 OpenAI 提供养料。
这个" AI 有机体"本身,绝非是简单的订单采购的供给关系。OpenAI 的大部分产品,多数需要在英伟达等公司的高级芯片上布置,一些低端芯片是无法布置 OpenAI 产品的。同样,微软不只是 OpenAI 的股东、算力提供者,OpenAI 也是其 AI 产品的供应商,二者本质上是一种深层的同盟关系。
也就是说,围绕 OpenAI 模式(高额的训练投入、高额的算力供给、布置在高端芯片上、闭源的)实际上衍变出来的正是这样的一个涵盖了巨额生意的"美式 AI 生态有机体"。
甚至这一模式与有机体,决定着美国 AI 道路的方向。在不久前特朗普的 5000 亿美元星际之门计划中,OpenAI 创始人奥特曼正是重要参与者。这一计划被视为美国 AI 领域的"曼哈顿计划"。
而当 2025 年初,DeepSeek 把自己开源、更低成本投入的模型拿到台面上时。真正感受到危机的,正是这个"美式 AI 生态有机体"。
1 月 27 日美股盘前,英伟达股价一度跌幅达到 12%,截至收盘时英伟达股价暴跌 17%。"造成英伟达股价暴跌的核心原因有二 : 其一,DeepSeek-R1 等产品并不"必须"在英伟达高端芯片上部署,甚至可以在一些中低端芯片上部署;其二,DeepSeek 所公布的训练成本和投入,对于高度依赖巨额算力投入、在预训练上需要大量 GPU 时长的" OpenAI- 英伟达"模式直接 Say No。这可能预示着,在"挖矿"之后,英伟达在 AI 大模型圈找到的饭票,已经不再保险。
而更深刻的一击是来自于"开源"本身。在微软、OpenAI、英伟达等公司构筑出的这个"美式 AI 生态有机体"中,商业化的前体是"不能开源"——要通过 AI 模型本身收费或者将其纳入付费产品之中完成商业闭环。
当 DeepSeek 举起"开源大旗"时,一种不同于"美式 AI 生态有机体"的 AI 世界正在开启大门:当圣何塞硅谷、北京中关村、新德里诺伊达、巴黎九区的创业者都可以免费地部署不属于 OpenAI 产品的开源大模型并研发自己领域的项目和产品时,AI 本身更像是人们在本世纪初对于其"新生产资料"的设定和预期。
讽刺的是,开源本是 OpenAI 最早的梦想,但最终这个大旗被一家中国的、原本做量化基金的公司不经意间举起来了。
这是一次"马镫与蒸汽机"般的里程碑事件吗?
大概率是的。
我们先回顾一段历史,这一幕有可能是今天 AI 世界的前传。
在 1765 年英国人瓦特发明出蒸汽机后,瓦特以及后续的英国发明家马修 · 博尔顿、和乔治 · 斯蒂芬逊接连在蒸汽机商业化、蒸汽火车等领域继续研发,并推动英国的蒸汽化。
但一个关键的节点事件是 1807 年美国人罗伯特 · 富尔顿发明了第一个蒸汽商用轮船,这是美国第一次去分享英国在"蒸汽化"这件事上的科技及产品话语权。而在不久后,美国人奥利弗 · 埃文斯等人,开始推动蒸汽化在美国工厂的落地,于是美国出现了最早一批基于蒸汽机的自动化工业生产线——也就是说,英国人发明出的蒸汽机,但他们并未能独占蒸汽时代的"母基发明"。
而随之而来的是,当美国成为"蒸汽时代"领头者之一并凭借更庞大的国力底蕴去完成了"围绕新关键科技的全盘进化"后,其彻底在英国开启的霸主时代中撕开了一条缝隙,并最终取而代之。
这个故事里的关键逻辑是,当人类的科技树出现"超级节点"时,最先探索出这个技术节点的国家 / 民族,有时候并未能品尝到这个超级技术节点完整红利:推动关键技术国民级商业化的效率以及整体国力的深层底蕴才是博弈的关键。同样的事情在蒸汽机之后的多个"天才技术时刻"都再次重演了,在 AI 时代这一幕可能继续。
DeepSeek 这件事的意义,不仅仅是技术侧。甚至我们应该一点也不奇怪,几个月后中国或者美国或者什么地方,又诞生出了更先进的大模型产品。
但我们应该看到这件事背后的深层意义:一家诞生在中国的民营公司,绕开了美国人所探索的"成功模式道路",并采取了代表"开放、普惠价值"内核的"开源精神"。如果考虑到 DeepSeek 大量工程师是一群只在中国本国高校求学过的本土 95 后甚至 00 后才俊的话,不难洞察到一场更深层的、涉及人类时代科技话语权的交接,可能已经发生了。
在不久前,一家国内头部端侧大模型公司创始人在与虎嗅交流时分享了一个有趣的细节:" 2024 年上半年,我去参加国际上的 AI 论坛,大部分面孔是美国人、印度人,但是 2024 年下半年这些 AI 国际学术峰会论坛里,中国人的面孔已经占一半以上。"
接下来,这场围绕全球 AI 角力关键视角有三:
其一,在中端视角中,能否确保 DeepSeek 以及更多的本土 DeepSeek 诞生、崛起、并长成国民级商业体;这包括了 DeepSeek 创始人梁文锋近期所提及的如何让硬核科技创业者得到足够大的正向反馈问题。而延展而来的是,在过去 20 年间,国内多数获得正向反馈的"科技"创业,多为模式创新,最终这些公司进化为平台型巨头,掌握流量出入口,然后反向重塑诸如餐饮、超市等一系列日常生意。少有的恰恰是,更为纯粹的硬核科技创新。
其二,在更大的视角中,在这场人类 21 世纪的 AI 浪潮里,比拼谁哪个经济体可以更快速地完成工业与生活 AI 化,从单纯的"器"的研究,率先进入到"机理"的探索与推广。即上文提及的推动关键技术国民级商业化的效率以及如何借力于雄厚的整体国力迅速建立足够高的竞争壁垒。
当然,回归更小的视角中,对于中国本土那几个尚在模仿 OpenAI 的大模型公司而言,2025 年初所发生的事情,可能已经不只是引起"警觉",而是引发"惊悚"了。
毕竟,素来乐于研究美国硅谷的中国投资圈,一定会重新审视此前那些投入额数以十亿、百亿计的本土生成式 AI 项目了。
下一篇:没有了