2025年年初,人工智能领域被一则重磅消息引爆:来自中国团队“深度求索”(DeepSeek)的全新大模型 DeepSeek-R1 在1月下旬发布。作为一款开源的6710亿参数推理大模型,R1在数学、编程、逻辑推理等关键任务上表现出媲美OpenAI顶尖模型的实力。尤其引人瞩目的是,R1通过强化学习大幅提升了复杂问题求解能力,其开放的MIT许可更是打破了大模型商用壁垒。R1横空出世后,不仅一夜之间刷屏科技圈,更撼动了资本市场,据报道其发布后一周内曾引发AI板块股票大跌。

DeepSeek-R1的出现,标志著中国开源AI力量在高端大模型上取得重大突破。面对这支“小分队”的突袭,全球AI格局瞬息万变:美国科技巨头和中国本土公司纷纷加速应对,在技术演进和战略布局上亮出各自底牌。中美AI公司围绕R1所展开的一场大模型“军备竞赛”就此拉开帷幕。

接下来,我们就盘点R1发布后,中美主要AI玩家——Meta、Google、OpenAI、Anthropic 以及阿里巴巴、百度——是如何各显神通、正面迎战的。

Meta:LLaMA 4厚积薄发,以效率与规模抗衡

作为开源大模型阵营的领军者,Meta 在 DeepSeek R1 问世后不久推出了下一代模型 LLaMA 4。2025 年 4 月,Meta 宣布其有史以来最强大的模型 LLaMA 4 正式上线,并率先通过 Cloudflare 等平台提供 API 服务。与以往不同的是,LLaMA 4 在架构上采用 Mixture-of-Experts(MoE)混合专家技术:模型由多个子模型组成,每次推理仅激活其中一小部分,从而兼顾超大参数规模与推理效率。

LLaMA 4 系列包含多个子型号:其中“Scout”模型总参数 1090 亿,但活跃参数仅 170 亿,可在单张 H100 卡上运行;“Maverick”模型总参数达 4000 亿(128 个专家),活跃参数仍为 170 亿,需要 DGX 集群支持。这种设计让 LLaMA 4 拥有惊人的上下文窗口长度——最高可达 1000 万 Token,成为首批支持千万级上下文的开源模型之一。这一优势在长文档总结、大型代码库分析等任务中表现突出。

得益于 MoE 架构,LLaMA 4 在保持高知识覆盖率的同时,依然具备快速响应能力,并支持多模态输入,为图像、音频、视频等任务提供强大基础。Meta 显然选择了一条“以巧破力”的策略,在 DeepSeek 强攻推理能力时,自己则强化多模态能力和效率优势,从另一条路径稳固其开源地位。

Google:Gemini 进化,加速迈向自主智能代理

在 OpenAI 与 DeepSeek 双重夹击下,Google 选择通过技术路线升级寻求突围。2025 年 2 月,Google 发布 Gemini 2.0 系列模型,包括 Flash、Pro 和 Lite 多种版本,标志著其 AI 模型进入“智能代理”阶段。

Gemini 2.0 的最大突破在于代理能力。模型不仅能进行多模态理解,还能主动调用搜索引擎、使用代码沙盒、执行网络浏览等任务,真正成为可以替用户“动手做事”的 AI。通过 Project Mariner 计划,Google 实现了 AI 驱动的 Chrome 浏览器操作原型,让 AI 可完成填写表单、点击按钮等真实互动任务。

为了支撑代理化生态,Google 还发布 Agent2Agent 协议,允许不同智能体之间协作通信,意图建立未来 AI 协作的底层标准。此外还推出了 Agent Garden 工具和开发套件,鼓励第三方开发者加入。

在 AI 朝著工具化、自主化演进的趋势下,Google 不再专注于与 DeepSeek、OpenAI 的参数军备,而是率先定义下一个时代的核心场景:智能代理协同。Gemini 的进化,不只是模型升级,更是战略转型。

OpenAI:模型迭代与生态整合,追求可靠与领先

OpenAI 在 DeepSeek R1 的发布后,明显加快了模型迭代和产品布局。2025 年 2 月,OpenAI 正式推出 GPT-4.5,作为 GPT-4 的过渡版本,不仅优化了逻辑一致性与事实准确性,也为即将登场的 GPT-5 做好铺垫。

GPT-4.5 被认为是最后一款不集成链式思维(Chain-of-Thought)的主力模型,GPT-5 将整合此前实验性质的推理模型 o3-mini 和 GPT 系列的功能,打造统一架构的“通用认知模型”。OpenAI 还透露 GPT-5 将具备高度可调的智能等级和工具使用能力。

为抵御开源浪潮的用户迁移风险,OpenAI 决定 ChatGPT 免费用户也将可使用 GPT-5 的基础版本,付费用户则享有更高级功能。这一策略旨在以广覆盖维持用户粘性。

在功能整合方面,OpenAI 也不再将插件、浏览器、代码执行器等能力分离,而是统一纳入 GPT 核心模型之中,打造“全功能 AI”。面对 R1 的挑战,OpenAI 选择以系统化整合、提升智能密度的方式应战。

Anthropic:混合推理与思考预算,深耕稳健智能

2025 年 2 月,Anthropic 推出 Claude 3.7 Sonnet,主打“混合推理”和“思考预算”两个核心创新。在这一版本中,用户可以选择“标准模式”进行快速响应,也可以启用“扩展模式”,让模型进行更深入、分步的思考。

这种模式有点类似人类面对复杂任务时“多想一下”的行为,允许 AI 延长推理时间以提升准确率。同时,Anthropic 允许用户配置“思考时间”,以控制推理深度与调用成本之间的平衡。

在多项基准测试中,Claude 3.7 在编程、推理等高难度任务上超过前代 3.5,成为行业内少数专注推理过程透明化的模型之一。其代码能力更在最新测评中达到 70.3% 正确率。

Claude 3.7 体现了 Anthropic 对“可控智能”的坚持:并不追求参数堆叠,而是专注打造可解释、稳定、可自定义思维模式的模型。在 R1 带动的“推理竞赛”中,Anthropic 用自己的节奏稳步推进。

阿里巴巴:Qwen 开源突围,建立中国开源生态高地

在 DeepSeek R1 推出仅一周后,阿里巴巴达摩院迅速更新其 Qwen 模型家族,于 2025 年 2 月发布 Qwen 2.5 系列,并在 4 月底重磅推出全新 Qwen 3 系列,全面开源,展现出极强的产品响应力和战略眼光。

Qwen 3 系列包括从 6 亿到 2350 亿参数的多个模型版本,采用 MoE 架构,在减少计算资源消耗的同时保持模型性能。旗舰模型 Qwen3-235B-A22B 通过优化激活参数,仅需4张高性能 GPU 即可部署,显著降低企业落地大模型门槛。Qwen 3 的整体性能在多个标准测试中超过 DeepSeek R1、OpenAI o1 和 Gemini 2.5 Pro 等国际顶级模型。

除了技术上的竞争力,阿里更注重开源生态建设。Qwen 3 在 Apache 2.0 协议下全面开源,权重、训练代码、部署工具均开放,支持多语言(119种)和多模态应用,致力于打造全球开发者可直接使用和定制的基础模型。

阿里这种“技术+生态”并进的策略,与 DeepSeek 走轻量突破的风格形成互补。一个强调快速迭代、推理领先;一个注重生态构建、规模与多样性兼顾。在国内市场,Qwen 逐步确立了开源大模型的“生态中枢”地位,是对 DeepSeek 引发行业震荡后的稳健回应。

百度:文心一言升级,加码多模态与插件工具

百度则在今年 3 月对其旗舰模型文心一言进行重大升级,发布了文心大模型 4.5 和 ERNIE X1,并对外开放试用。其中,ERNIE X1 被定位为“深度思考模型”,重点增强 AI 对复杂任务的理解、规划、执行能力。

文心 4.5 是百度首个原生多模态大模型,支持文本、图像、音频、视频的多模态联合建模。同时,该版本显著减少了幻觉生成,提升了代码理解与逻辑推理能力,在多个中文场景任务中超越 GPT-4.5 水平。

更具实用价值的是百度正在构建的“AI 工具生态”。X1 模型可调用包括搜索、文档问答、PDF 阅读、代码执行、图像识别、网页访问、商业信息查询等功能,真正实现 AI 的“动手能力”,与 Google Gemini 的代理路线互为呼应。

此外,百度宣布将于 2025 年 6 月底开源文心模型部分参数,并进一步扩大与企业级客户的应用集成。文心系列正在从闭环产品转向平台生态,通过 API 与插件体系吸引开发者和企业加入。

百度并未选择与 R1、Qwen 在开源方向上直接对抗,而是依托自身在中文内容、搜索服务和知识图谱方面的深厚积累,将模型与搜索、办公、信息流等产品场景深度融合,打造更接地气的 AI 产品组合。

结语:R1 引发的全球连锁反应,揭开新一轮 AI 军备竞赛

DeepSeek R1 的发布不仅是一次技术突破,更是一颗扔进全球 AI 竞技场的“催化弹”。它在技术层面逼迫巨头提高推理性能,在生态层面刺激国内企业争相开源,在战略层面促使美国公司加快代理、集成、多模态的发展。

中美 AI 巨头的应对方式虽各有不同,但目标一致:打造更强、更可靠、更灵活的大模型,赢得技术、生态和用户的三重竞争。这一进程还远未结束。随著 GPT-5、Gemini 3、Claude 4 乃至 DeepSeek R2、Qwen 4 等相继发布,全球 AI 正在进入“螺旋上升”的新阶段。

而对于企业用户和开发者而言,这场竞赛带来的将是更多选择、更低成本、更强功能的大模型工具。全球 AI 能力正在以前所未有的速度扩散和民主化,下一场决定性技术突破或许已在路上。
 

要看最快最熱資訊,請來Follow我們 《東方日報》WhatsApp Channel.

热门新闻

阅读全文

警队大地震 刑事一哥调任AKPS总监

阅读全文

谁敢接单?殡仪馆深夜叫外卖备注“往里走” 警方介入

阅读全文

鱼儿上钩成催命符!男子遭鳄鱼袭击 岳父目睹无力救援

阅读全文

墨西哥最致命地底奇景 奈卡水晶洞待15分钟就会毙命

阅读全文

集会燃放烟雾弹 警方遏阻场面紧张

阅读全文

【LIVE】人民厌贪集会2.0

阅读全文

马岩岩:苹果搬回美国不现实

名家

如果美国科技巨头苹果公司搬回美国,其下场将和当年的美国电讯公司摩托罗拉一样。2013年,摩托罗拉就在美国德克萨斯州沃斯堡...

阅读全文

林德宜——乌克兰与北约:和平协议的最大输家

名家

所谓一图胜千语,美国总统特朗普和乌克兰总统泽连斯基出席于罗马举行的教宗方济各葬礼时交谈的照片,强力的表明了特朗普将兑现其...

阅读全文

郭朝河:美国政策害我送不出菜

名家

“看谁要就快点来拿,不然就要丢了。”朋友听完语音后告知,金马伦的菜农要免费送菜。是因为滞销还是菜快烂了?我好奇。是收购商...

阅读全文

冯振豪:国盟进入自我否定期

名家

4月26日亚亦君令补选投票结果揭晓,国阵候选人莫哈末尤斯里获得1万1065票完成守土大业,来自国盟的伊斯兰党候选人阿都慕...

阅读全文

孙和声:美国关税战的挑战

名家

特朗普的关税战能否彻底执行?应该说,它只能执行到一定程度。之所以在于美国的货物贸易逆差是个长期积累形成的结构性问题,是无...

阅读全文

黄春罐:新加坡大选,人民行动党稳守江山?

名家

就在这个周末(5月3日),新加坡将会迎来新一届的大选,投选出新加坡国会33个选区的97名国会议员。此次大选,最受人关注的...

阅读全文

张孝仪:穷教育还是饿肚子?沙巴与砂拉越SPM缺考的真实写照

名家

上周,2024年大马教育文凭考试(SPM)成绩公布,全国平均积分为4.49分,优于2023年的4.60分,并创下自201...

阅读全文

陈锦松:国旗失误致总编辑停职乃错误示范

名家

近期,马来西亚国旗出错事件,再次引发舆论关注。首先,事缘配合中国国家主席习近平访马,4月15日《星洲日报》在封面刊登一张...

阅读全文

郑庭河:印尼土生华人的“民族宗教”

名家

在印尼,部分土生华人精英从上个世纪初即开创了一个民族宗教——孔教。虽其在官方意义上自称为跨族裔的宗教,不过显然深具民族色...

阅读全文

潘永强:华总领导偷步延任:侵蚀百年社会资本

名家

马来西亚华人社会历来重视结社自由与组织治理,透过各类社团、会馆、组织等建构出具高度自治参与的社会网络。这套累积超过百年的...