一周AI大事：砍价30%！OpenAI 联手谷歌“背刺”英伟达？

发布时间：2025-12-05 16:06:33 作者：玩站小弟

作者 | 辰辰出品 | 网易科技旧王还没来得及切蛋糕，新王们就已经提着刀杀到了门口。ChatGPT刚满三周岁生日，却没能等来安稳的庆生。谷歌Gemini 3强势反超，逼得奥特曼喊话“准备过冬”；Ant 。

作者 | 辰辰

出品 | 网易科技

旧王还没来得及切蛋糕，背刺新王们就已经提着刀杀到了门口。事砍手谷

ChatGPT刚满三周岁生日，歌英佛山市某某环保机械设备制造厂却没能等来安稳的伟达庆生。谷歌Gemini 3强势反超，背刺逼得奥特曼喊话“准备过冬”；Anthropic 不讲武德，事砍手谷反手甩出 Claude Opus 4.5，歌英重夺“代码之神”的伟达称号。就连“卖铲子”的背刺英伟达也不安稳，谷歌 TPUv7的事砍手谷出现让 OpenAI 都有了砍价的底气。

从模型互搏到芯片暗战，歌英这一周的伟达信息量大到需要吸氧。别急，背刺我们帮你把这些“瓜”都切好了。事砍手谷

一、歌英周末热点：OpenAI王座动摇，英伟达垄断不再

1. Gemini 3反超GPT-5，谷歌市值逼近4万亿美元

在ChatGPT发布三周年之际，这家估值5000亿美元的独角兽正面临自创立以来最大的危机。据英国《金融时报》报道，佛山市某某环保机械设备制造厂随着谷歌Gemini 3的强势发布，业内普遍认为该模型在训练工艺上实现了对OpenAI GPT-5的跨越式反超，OpenAI曾经“遥遥领先”的护城河正在被填平。Hugging Face联合创始人直言“世界已经变了”，OpenAI CEO萨姆·奥特曼（Sam Altman）也罕见地向员工预警，要准备好迎接“艰难时刻”。相比之下，谷歌凭借全栈技术整合不仅将Gemini App月活推高至6.5亿，更推动母公司市值逼近4万亿美元大关。就连Salesforce CEO马克·贝尼奥夫（Marc Benioff）在试用Gemini 3后也惊呼“回不去了”，这场AI王座争夺战已正式进入白热化的新阶段。

2. 打破英伟达垄断：谷歌TPUv7“大杀四方”，OpenAI借势砍价30%

软件层的激战也离不开硬件格局的重塑，谷歌TPU正撕开英伟达的铁幕。随着Gemini 3和Claude 4.5 Opus两大SOTA模型均在TPU上完成训练，谷歌开始激进地向Anthropic等外部客户出售其最新的TPUv7 Ironwood算力，订单规模甚至突破1GW。半导体行业知名研究资讯公司SemiAnalysis最新发布的TPUv7与英伟达竞争分析引发业界广泛关注。

其中爆料称，TPU极致的性价比（TCO）已成为巨头博弈的筹码：OpenAI甚至尚未正式部署TPU，仅凭引入这一竞争选项，就成功在与英伟达的谈判中将其算力机队的整体成本压低了约30%。谷歌正用行动证明，打破CUDA护城河的最佳方式，就是让客户真正体验到“买TPU越多，省下的GPU资本开支就越多”。

二、本周重磅：Claude Opus 4.5重夺“代码之神”

本周最受瞩目的焦点，莫过于Anthropic发布的Claude Opus 4.5。在大模型王座被GPT-5.1和Gemini 3 Pro轮流坐庄数周后，Claude终于亮出了它的底牌，誓要夺回“全球最强AI模型”的桂冠。

· 代码能力屠榜：在SWE-bench Verified基准测试中，Opus 4.5拿下了80.9%的惊人成绩，一举超越GPT-5.1（77.9%）和Gemini 3 Pro（76.2%）。

· 智能体能力SOTA：在Terminal-bench 2.0、OSWorld（计算机操作）等复杂智能体基准测试中，Opus 4.5均达到State-of-the-Art（SOTA）水平。

· 实测体验：知名开发者Gene Dai评价道：“Opus 4.5有一种果断的气质——它会先动手把事情做完，再告诉你它做了什么。它甚至能通过单次提示解决巨大Bug。”

价格与市场：目前定价为输入5美元/百万token，输出25美元/百万token。虽然比上一代Opus便宜了三分之二，但相比Gemini 3 Pro依然昂贵。

Opus 4.5上线后，各行人士纷纷下场试用，并发表自己的切身感受。

网红博主@peakcooper周末发布Opus 4.5完整评测，称其为编程史上最佳发布，逻辑无误、代码优雅、自主调试、严格执行指令，长上下文表现完美；效率提升25%到35%，媲美2025 Sonnet 3.5。

沃顿商学院研究AI的教授伊桑·莫利克（Ethan Mollick）周末也发布了AI诗作挑战的结果，称从ChatGPT-3.5到Claude Opus 4.5，AI诗作挑战从失败到精妙，展示出创造力的不断跃升。

随着Claude的更新，全球三大顶尖AI模型在过去两周内全部完成了迭代。如果你还在纠结用哪个写代码，知名博主麦凯·里格利（McKay Wrigley）此前已经开发出一套工作流，你可以借此一次性对比三巨头的表现。

三、视觉革命：Flux.2与腾讯混元

本周视觉生成领域同样热闹非凡，从图像到视频，从闭源到开源，开发者们有了更多选择。

· Flux.2：Black Forest Labs推出备受期待的FLUX.2套件（包含Pro, Flex, Dev三个版本），致力于解决“角色一致性”痛点。

· 杀手级功能：支持“多参考图生成”。用户最多可上传10张参考图，这意味着生成的AI角色可以保持高度一致的画风或面部特征，完美适配漫画或设计需求。

· 技术细节：采用Mistral-3 24B视觉语言模型（VLM）作为核心，支持原生400万像素输出。

· 性价比：质量对标Nano Banana Pro，但成本仅为后者的三分之一。

· 腾讯混元：腾讯发布的HunyuanVideo 1.5堪称消费级显卡的福音。

· 配置亲民：仅8.3B参数，配合Diffusion Transformer架构，让普通消费级GPU也能跑得起来。

· 能力强悍：支持生成720p（可上采样至1080p）、时长10秒的视频，且物理规律和动作连贯性表现优异。权重已在Hugging Face开源。

· 阿里Z-Image Turbo：阿里通义实验室推出文生图模型Z-Image Turbo。天下武功，唯快不破，这款6B参数的文生图模型，主打极致速度。在H800上生成图片仅需亚秒级，且能轻松塞进16GB显存的显卡中，同时保持了照片级的逼真度。

四、硬核科研与新模型

· INTELLECT-3 (106B MoE)： Prime Intellect发布的新开源模型，虽然总参数大，但激活参数仅12B。它在数学和代码上表现极其出色（AIME 2024/2025准确率约90%），是目前同尺寸下的最强模型。

· Fara-7B：微软新推出一款基于Qwen 2.5微调的端侧智能体模型。它能在本地设备上预测鼠标和键盘操作（如订票、网页浏览），WebVoyager得分73.5%，主打隐私保护。

· DeepSeek Math V2： DeepSeek（深度求索）新推出的开源大模型，专供数学推理。其核心突破在于引入自我验证机制，在多项国际数学竞赛中达到金牌水平，并成为首个开源的奥数金牌级模型。

· NVIDIA Nemotron-Elastic-12B：英伟达探索了“弹性推理”架构。通过嵌套模型提取，这一个模型可以无损变身为6B或9B的小版本，无需重新训练，极大提升了部署灵活性。

· HunyuanOCR（1B参数）：腾讯发布HunyuanOCR（1B参数），在文档解析和视频字幕提取上超越Qwen3-VL-72B等大模型。

五、行业快讯：你方唱罢我登场

除了上述重磅发布，本周还有这些值得关注的动态：

——硬件：

· 阿里发布Quark AI眼镜，搭载通义大模型，售价1899元人民币，对标Meta Ray-Ban。

——应用：

· Character.AI上线“Stories”功能，用户可与喜欢的AI角色共同创作互动式冒险故事。

· LTX Studio推出“Retake”功能，允许用户精准修改视频中的特定镜头或台词，而无需重新生成全片。

· 谷歌在美推出Agent通话功能，AI可代替用户直接给商家打电话核实价格或库存。

——市场：

· Anthropic发布报告预测，AI的广泛应用将在未来十年内使美国劳动生产率增速翻倍。

· 由于需求过大，谷歌和OpenAI已被迫对Sora及Nano Banana Pro等高算力模型进行限流。

· 国家发展和改革委有关负责人提示，人形机器人投资过热，需警惕行业泡沫。

· Suno与华纳音乐集团达成合作，将利用正版授权音乐库开发AI音乐工具。

六、番外篇：ChatGPT三周年历史时刻

最后，我们要把目光投向三年前。

本周是ChatGPT发布三周年纪念。回望2022年11月，一个简单的聊天框开启了人类历史上最波澜壮阔的技术革命。

三年间，我们见证了它从一个只会聊天的Chatbot，进化为拥有记忆、能看图、能写代码、能推理（o1/o3系列）乃至如今GPT-5.1的全能助手。正如本文所述，虽然如今AI圈早已群雄逐鹿，但ChatGPT依然是那个推倒第一块多米诺骨牌的传奇。

历史的车轮滚滚向前，我们正处在最好的时代。

热门资讯

知识

热点

综合

休闲

娱乐

时尚

焦点

一周AI大事：砍价30%！OpenAI 联手谷歌“背刺”英伟达？

相关文章

最新评论

文章分类

大家感兴趣的内容

最近更新的内容

友情链接