GPT-4.5：期待了个“寂寞”？

约 860 字大约 3 分钟

2025-03-02

前言

最近AI圈热闹得像个菜市场——Anthropic刚推出混合推理模型Claude 3.7 Sonnet，马斯克的Grok 3还在热搜上挂着，OpenAI突然甩出一张“王炸”：GPT-4.5。

今天就带领大家来扒一扒，OpenAI这波发布到底怎么样。

2月28日凌晨，OpenAI低调上线GPT-4.5研究预览版。官方称这是“史上最大聊天模型”，计算效率比GPT-4提升10倍，还能更懂你的“弦外之音”。

可这次发布会，CEO奥特曼连面都没露。

我们先来了解下本次发布有哪些亮点：

可仔细一看，这些“亮点”更像是给模型打补丁——情商高了，智商却没咋涨。MMLU语言理解测试得分仅比GPT-4高5%，科学类问题甚至跑不过自家的小弟o3-mini模型。

OpenAI这次把宝押在“情感交互”上，但用户反响却是一般。

技术瓶颈明显：用10倍算力训练出的模型，专业领域表现平平，反而在写诗、编冷笑话上更溜了——总感觉有点“不务正业”。
单盲测试翻车：OpenAI联合创始人Andrej Karpathy发起五轮盲测投票，让网友对比GPT-4.5和GPT-4的匿名回复。结果有点尴尬：GPT-4.5仅1次胜出，惨输4轮（胜率20%）。

更尴尬的是，同类竞品早已玩转“高情商”。