一周AI大事:砍价30%!OpenAI 联手谷歌“背刺”英伟达?

  发布时间:2025-12-05 16:06:33   作者:玩站小弟   我要评论
作者 | 辰辰出品 | 网易科技旧王还没来得及切蛋糕,新王们就已经提着刀杀到了门口。ChatGPT刚满三周岁生日,却没能等来安稳的庆生。谷歌Gemini 3强势反超,逼得奥特曼喊话“准备过冬”;Ant 。

作者 | 辰辰

出品 | 网易科技

旧王还没来得及切蛋糕,背刺新王们就已经提着刀杀到了门口。事砍手谷

ChatGPT刚满三周岁生日,歌英佛山市某某环保机械设备制造厂却没能等来安稳的伟达庆生。谷歌Gemini 3强势反超,背刺逼得奥特曼喊话“准备过冬”;Anthropic 不讲武德,事砍手谷反手甩出 Claude Opus 4.5,歌英重夺“代码之神”的伟达称号。就连“卖铲子”的背刺英伟达也不安稳,谷歌 TPUv7的事砍手谷出现让 OpenAI 都有了砍价的底气。

从模型互搏到芯片暗战,歌英这一周的伟达信息量大到需要吸氧。别急,背刺我们帮你把这些“瓜”都切好了。事砍手谷

一、歌英周末热点:OpenAI王座动摇,英伟达垄断不再

1. Gemini 3反超GPT-5,谷歌市值逼近4万亿美元

在ChatGPT发布三周年之际,这家估值5000亿美元的独角兽正面临自创立以来最大的危机。据英国《金融时报》报道,佛山市某某环保机械设备制造厂随着谷歌Gemini 3的强势发布,业内普遍认为该模型在训练工艺上实现了对OpenAI GPT-5的跨越式反超,OpenAI曾经“遥遥领先”的护城河正在被填平。Hugging Face联合创始人直言“世界已经变了”,OpenAI CEO萨姆·奥特曼(Sam Altman)也罕见地向员工预警,要准备好迎接“艰难时刻”。相比之下,谷歌凭借全栈技术整合不仅将Gemini App月活推高至6.5亿,更推动母公司市值逼近4万亿美元大关。就连Salesforce CEO马克·贝尼奥夫(Marc Benioff)在试用Gemini 3后也惊呼“回不去了”,这场AI王座争夺战已正式进入白热化的新阶段。

2. 打破英伟达垄断:谷歌TPUv7“大杀四方”,OpenAI借势砍价30%

软件层的激战也离不开硬件格局的重塑,谷歌TPU正撕开英伟达的铁幕。随着Gemini 3和Claude 4.5 Opus两大SOTA模型均在TPU上完成训练,谷歌开始激进地向Anthropic等外部客户出售其最新的TPUv7 Ironwood算力,订单规模甚至突破1GW。半导体行业知名研究资讯公司SemiAnalysis最新发布的TPUv7与英伟达竞争分析引发业界广泛关注。

其中爆料称,TPU极致的性价比(TCO)已成为巨头博弈的筹码:OpenAI甚至尚未正式部署TPU,仅凭引入这一竞争选项,就成功在与英伟达的谈判中将其算力机队的整体成本压低了约30%。谷歌正用行动证明,打破CUDA护城河的最佳方式,就是让客户真正体验到“买TPU越多,省下的GPU资本开支就越多”。

二、本周重磅:Claude Opus 4.5重夺“代码之神”

本周最受瞩目的焦点,莫过于Anthropic发布的Claude Opus 4.5。在大模型王座被GPT-5.1和Gemini 3 Pro轮流坐庄数周后,Claude终于亮出了它的底牌,誓要夺回“全球最强AI模型”的桂冠。

· 代码能力屠榜: 在SWE-bench Verified基准测试中,Opus 4.5拿下了80.9%的惊人成绩,一举超越GPT-5.1(77.9%)和Gemini 3 Pro(76.2%)。

· 智能体能力SOTA: 在Terminal-bench 2.0、OSWorld(计算机操作)等复杂智能体基准测试中,Opus 4.5均达到State-of-the-Art(SOTA)水平。

· 实测体验: 知名开发者Gene Dai评价道:“Opus 4.5有一种果断的气质——它会先动手把事情做完,再告诉你它做了什么。它甚至能通过单次提示解决巨大Bug。”

价格与市场: 目前定价为输入5美元/百万token,输出25美元/百万token。虽然比上一代Opus便宜了三分之二,但相比Gemini 3 Pro依然昂贵。

Opus 4.5上线后,各行人士纷纷下场试用,并发表自己的切身感受。

网红博主@peakcooper周末发布Opus 4.5完整评测,称其为编程史上最佳发布,逻辑无误、代码优雅、自主调试、严格执行指令,长上下文表现完美;效率提升25%到35%,媲美2025 Sonnet 3.5。

沃顿商学院研究AI的教授伊桑·莫利克(Ethan Mollick)周末也发布了AI诗作挑战的结果,称从ChatGPT-3.5到Claude Opus 4.5,AI诗作挑战从失败到精妙,展示出创造力的不断跃升。

随着Claude的更新,全球三大顶尖AI模型在过去两周内全部完成了迭代。如果你还在纠结用哪个写代码,知名博主麦凯·里格利(McKay Wrigley)此前已经开发出一套工作流,你可以借此一次性对比三巨头的表现。

三、视觉革命:Flux.2与腾讯混元

本周视觉生成领域同样热闹非凡,从图像到视频,从闭源到开源,开发者们有了更多选择。

· Flux.2:Black Forest Labs推出备受期待的FLUX.2套件(包含Pro, Flex, Dev三个版本),致力于解决“角色一致性”痛点。

· 杀手级功能: 支持“多参考图生成”。用户最多可上传10张参考图,这意味着生成的AI角色可以保持高度一致的画风或面部特征,完美适配漫画或设计需求。

· 技术细节: 采用Mistral-3 24B视觉语言模型(VLM)作为核心,支持原生400万像素输出。

· 性价比: 质量对标Nano Banana Pro,但成本仅为后者的三分之一。

· 腾讯混元:腾讯发布的HunyuanVideo 1.5堪称消费级显卡的福音。

· 配置亲民: 仅8.3B参数,配合Diffusion Transformer架构,让普通消费级GPU也能跑得起来。

· 能力强悍: 支持生成720p(可上采样至1080p)、时长10秒的视频,且物理规律和动作连贯性表现优异。权重已在Hugging Face开源。

· 阿里Z-Image Turbo:阿里通义实验室推出文生图模型Z-Image Turbo。天下武功,唯快不破,这款6B参数的文生图模型,主打极致速度。在H800上生成图片仅需亚秒级,且能轻松塞进16GB显存的显卡中,同时保持了照片级的逼真度。

四、硬核科研与新模型

· INTELLECT-3 (106B MoE): Prime Intellect发布的新开源模型,虽然总参数大,但激活参数仅12B。它在数学和代码上表现极其出色(AIME 2024/2025准确率约90%),是目前同尺寸下的最强模型。

· Fara-7B: 微软新推出一款基于Qwen 2.5微调的端侧智能体模型。它能在本地设备上预测鼠标和键盘操作(如订票、网页浏览),WebVoyager得分73.5%,主打隐私保护。

· DeepSeek Math V2: DeepSeek(深度求索)新推出的开源大模型,专供数学推理。其核心突破在于引入自我验证机制,在多项国际数学竞赛中达到金牌水平,并成为首个开源的奥数金牌级模型。

· NVIDIA Nemotron-Elastic-12B: 英伟达探索了“弹性推理”架构。通过嵌套模型提取,这一个模型可以无损变身为6B或9B的小版本,无需重新训练,极大提升了部署灵活性。

· HunyuanOCR(1B参数): 腾讯发布HunyuanOCR(1B参数),在文档解析和视频字幕提取上超越Qwen3-VL-72B等大模型。

五、行业快讯:你方唱罢我登场

除了上述重磅发布,本周还有这些值得关注的动态:

——硬件:

· 阿里发布Quark AI眼镜,搭载通义大模型,售价1899元人民币,对标Meta Ray-Ban。

——应用:

· Character.AI上线“Stories”功能,用户可与喜欢的AI角色共同创作互动式冒险故事。

· LTX Studio推出“Retake”功能,允许用户精准修改视频中的特定镜头或台词,而无需重新生成全片。

· 谷歌在美推出Agent通话功能,AI可代替用户直接给商家打电话核实价格或库存。

——市场:

· Anthropic发布报告预测,AI的广泛应用将在未来十年内使美国劳动生产率增速翻倍。

· 由于需求过大,谷歌和OpenAI已被迫对Sora及Nano Banana Pro等高算力模型进行限流。

· 国家发展和改革委有关负责人提示,人形机器人投资过热,需警惕行业泡沫。

· Suno与华纳音乐集团达成合作,将利用正版授权音乐库开发AI音乐工具。

六、番外篇:ChatGPT三周年历史时刻

最后,我们要把目光投向三年前。

本周是ChatGPT发布三周年纪念。回望2022年11月,一个简单的聊天框开启了人类历史上最波澜壮阔的技术革命。

三年间,我们见证了它从一个只会聊天的Chatbot,进化为拥有记忆、能看图、能写代码、能推理(o1/o3系列)乃至如今GPT-5.1的全能助手。正如本文所述,虽然如今AI圈早已群雄逐鹿,但ChatGPT依然是那个推倒第一块多米诺骨牌的传奇。

历史的车轮滚滚向前,我们正处在最好的时代。

延伸阅读
  • 刚刚,DeepSeek 发布 V3.2正式版
  • 盒马前CEO侯毅开启直播带货
  • 再谈注意力:阿里、Kimi 都在用的 DeltaNet 和线性注意力新改进

相关文章

  • SpaceX星舰第六次试飞 未尝试“筷子夹火箭”

      来源:上游新闻  北京时间2024年11月20日6时,SpaceX星舰进行第六次综合测试飞行试验,发射地点位于美国德克萨斯州墨西哥湾畔的博卡奇卡星舰基地。本次试飞与上次飞行任务第五次飞行测试)相隔
    2025-12-05
  • 9月极氪交付21333台 创历史新高

    版权声明:本文版权为网易汽车所有,转载请注明出处。网易汽车10月1日报道极氪汽车今日公布其2024年9月交付量达到了21333台,同比增长77%,环比增长18%,创历史新高。极氪汽车今年1 - 9月共
    2025-12-05
  • 纯干货!新政后如何买房?一文教你梳理置业逻辑!

    9月30日晚,继上海、广州、深圳等一线城市接连发布楼市新政后,北京执行13年的楼市限购政策终于迎来第二次大松绑!新政涉及房贷利率、首付比例及公积金贷款额度的调整、普宅和非普宅标准的取消等一系列优化。其
    2025-12-05
  • 松绑低于预期,北上还挤牙膏

    昨晚估计很多中介和房吹嗨了,晚上11点多的时候,连续弹出几个楼市大消息,先是广州全面松绑,这是现在直接裸奔的一线城市了;而深圳只保留了南山福田落户几个和小区,还有宝安和西乡两个街道的限购,社保也从三年
    2025-12-05
  • 菅原由势:知道的中国球员是武磊;这场比赛不可能再是7

    近日,日本后卫菅原由势在爱奇艺体育接受了 的采访,采访中谈到了即将到了的世预赛日本客战中国的比赛。之前采访了另外两名日本球员——三笛薰和镰田大地,他们都有点内向,但我听说你一点都不内向。是的,他们很内
    2025-12-05
  • 线下房展会回归 多地开展楼市促销

      每经记者 陈荣浩 每经编辑 陈梦妤  近几日,为促进楼市回稳,不少地方已经开始行动,积极开展促销活动,线下“房展会”也开始回归。比较典型的有广东和山东。  首先来看山东的情况。据《中国建设报》报道
    2025-12-05

最新评论

vxgb2.llhgr.eap2x.wpf5p.hdup.0n7ae.wp2s2.akem.dslgw.aln.laoying.sbs