2024大模型，你应该了解的事件

约 2002 字大约 7 分钟

2024大模型重要事件年度总结

2025-01-17

前言

2024结束了，作为大模型领域的参与者，仅以我的个人视角，带大家回顾一下2024年大模型领域的重要事件。

大事记

GPT4

2023年GPT-4发布以来，这款模型迅速成为大模型领域的标杆。

然而，到了2024年末，随着众多新模型的出现，GPT-4在Chatbot Arena排行榜上的位置已降至约70位。

Meta的Llama、谷歌的Gemini、深度求索的Deepseek V3、零一万物的Yi-Lightning、通义的Qwen2.5-plus以及智谱的GLM-4-Plus等国内外模型纷纷超越了它。

此处超过的仅仅是OpenAI的GPT-4。

尽管如此，OpenAI在大模型领域依然是一骑绝尘的，毕竟2024年，OpenAI还发布了很多产品：

GPT-4o：开创了多模态的热潮，4o，for all，for omni，名字起的不错。
GPT-o1：在大家都不看好大模型逻辑推理的时候，通过慢推理，让大家看到了大模型仍有很多的可能。

GPT-5，就忘了吧，据说因为新增语料不够，还未发布。

多模态

顺着OpenAI的线，我们接着讲。

5月13日，OpenAI发布了GPT-4o，发布会上的实时语音与视频的演示，真的让人惊艳。

之后，国内多模态大模型紧紧追赶。现在，我们除了可以给大模型发送文字外，也可以拍照、语音、视频交流了。

慢推理

OpenAI另一个产品GPT-o1，则是开创了另一种大模型，慢推理大模型。

这类大模型通过使用类似“思维链”的技巧，花费多一些的推理token来思考问题，然后给出更好的最终答案。

它们不需要在训练阶段增加算力，而是通过增加推理的计算资源提升模型效果。从这一点上看，OpenAI确实厉害，毕竟，独辟蹊径不是那么好坚持的。

价格

上面吹完了OpenAI，我们来说说它不好的方面，或者说是，对我们不好的方面。

价格！

OpenAI Plus会员还好，20美元一个月，忍痛还能接受，但是Pro会员，一个月竟然要200美元。这个价格，对很多用户来说都很不友好。有趣的是，即识收费如此之高，据说OpenAI还入不敷出呢。

就在这种背景下，年中时一家名为Deepseek的新创公司崭露头角。当时，连“6小虎”都算不上的Deepseek发布了V2，直接将大模型token价格压到了每百万tokens仅1元人民币，要知道，同期的OpenAI的价格是每百万tokens大约200元人民币呢。

怪不得大家称赞它，量大管饱、便宜好用。

再接下来，大模型价格战开启，甚至影响到了很多国外的厂商。从这点上说，deepseek当之无愧的平民模型啊。

视频生成

回顾2024年大模型事件，绝对不能遗忘视频生成，毕竟，这是国内厂商少有打脸OpenAI的地方了。

2024年初的一个凌晨，OpenAI发布了首个文生视频模型Sora，可以直接输出长达60秒的视频，并且包含高度细致的背景、复杂的多角度镜头，以及富有情感的多个角色。

然后，没信了。

在大家都对文生视频没有信心之时，快手在6月6日推出了“可灵”，打造出了国内首个对标Sora的视频生成模型，可生成高分辨率、长达2分钟的视频。

虽然，当时国外也出现了Runway、Luma，但是，我依然认为当时的可灵，牛掰。

后续，MiniMax的海螺、抖音的即梦、腾讯的混元（开源的），包括前两天升级的通义万相，也都在视频生成领域有了很大的突破。

哦，对了，OpenAI在12月也终于发布了Sora，虽然晚了不少，但效果确实很顶。

编程

终于到了我的老本行。

Copilot、Bito、Codegeex、通义灵码等辅助编程工具咱就不提了，这些更多地是在实际编码阶段提升了我们写代码的速度，我们直接看各种智能编程助手。

上半年，随着首位AI程序员Devin的登场，智能编程悄然拉开了序幕。Devin不仅覆盖了从需求分析到编码、调试直至部署的整个开发流程，展示了端到端的开发能力，还拥有自主学习的能力，能够不断提升自己的技能。这样一位全能型的“程序员”，其出现无疑给大家带来了不小的震动。

紧接着，不得不提我认为年度最为重要的AI应用：Cursor。

Cursor通过基于上下文的代码补全、自然语言到代码的转换、多文件操作支持、以及生成代码的审查与比对等功能，极大地革新了代码开发的方式。它不仅仅提高了开发效率，还改变了我们编写文档、调试程序的研发模式。借助Cursor，我们能够更加专注于解决复杂问题，而将一些非创造性任务交给AI处理，这种转变无疑为软件开发领域带来了深远的影响。

还因此造就了很多热点事件，比如，7岁女儿独立实现了一个APP，非程序员很快上架了一个补光灯应用，事件可能有所夸大，但全民编程时代好像真的要来了。

此外，个人感觉还有两个方面也很重要，但今年有些不够火爆。