Skip to content

2024大模型,你应该了解的事件

约 2002 字大约 7 分钟

2024大模型重要事件年度总结

2025-01-17

前言

2024结束了,作为大模型领域的参与者,仅以我的个人视角,带大家回顾一下2024年大模型领域的重要事件。

大事记

GPT4

2023年GPT-4发布以来,这款模型迅速成为大模型领域的标杆。

然而,到了2024年末,随着众多新模型的出现,GPT-4在Chatbot Arena排行榜上的位置已降至约70位。

Meta的Llama、谷歌的Gemini、深度求索的Deepseek V3、零一万物的Yi-Lightning、通义的Qwen2.5-plus以及智谱的GLM-4-Plus等国内外模型纷纷超越了它。

此处超过的仅仅是OpenAI的GPT-4。

尽管如此,OpenAI在大模型领域依然是一骑绝尘的,毕竟2024年,OpenAI还发布了很多产品:

  • GPT-4o:开创了多模态的热潮,4o,for all,for omni,名字起的不错。
  • GPT-o1:在大家都不看好大模型逻辑推理的时候,通过慢推理,让大家看到了大模型仍有很多的可能。

GPT-5,就忘了吧,据说因为新增语料不够,还未发布。

多模态

顺着OpenAI的线,我们接着讲。

5月13日,OpenAI发布了GPT-4o,发布会上的实时语音与视频的演示,真的让人惊艳。

之后,国内多模态大模型紧紧追赶。现在,我们除了可以给大模型发送文字外,也可以拍照、语音、视频交流了。

慢推理

OpenAI另一个产品GPT-o1,则是开创了另一种大模型,慢推理大模型。

这类大模型通过使用类似“思维链”的技巧,花费多一些的推理token来思考问题,然后给出更好的最终答案。

它们不需要在训练阶段增加算力,而是通过增加推理的计算资源提升模型效果。从这一点上看,OpenAI确实厉害,毕竟,独辟蹊径不是那么好坚持的。

价格

上面吹完了OpenAI,我们来说说它不好的方面,或者说是,对我们不好的方面。

价格!

OpenAI Plus会员还好,20美元一个月,忍痛还能接受,但是Pro会员,一个月竟然要200美元。这个价格,对很多用户来说都很不友好。有趣的是,即识收费如此之高,据说OpenAI还入不敷出呢。

就在这种背景下,年中时一家名为Deepseek的新创公司崭露头角。当时,连“6小虎”都算不上的Deepseek发布了V2,直接将大模型token价格压到了每百万tokens仅1元人民币,要知道,同期的OpenAI的价格是每百万tokens大约200元人民币呢。

怪不得大家称赞它,量大管饱、便宜好用。

再接下来,大模型价格战开启,甚至影响到了很多国外的厂商。从这点上说,deepseek当之无愧的平民模型啊。

视频生成

回顾2024年大模型事件,绝对不能遗忘视频生成,毕竟,这是国内厂商少有打脸OpenAI的地方了。

2024年初的一个凌晨,OpenAI发布了首个文生视频模型Sora,可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。

然后,没信了。

在大家都对文生视频没有信心之时,快手在6月6日推出了“可灵”,打造出了国内首个对标Sora的视频生成模型,可生成高分辨率、长达2分钟的视频。

虽然,当时国外也出现了Runway、Luma,但是,我依然认为当时的可灵,牛掰。

后续,MiniMax的海螺、抖音的即梦、腾讯的混元(开源的),包括前两天升级的通义万相,也都在视频生成领域有了很大的突破。

哦,对了,OpenAI在12月也终于发布了Sora,虽然晚了不少,但效果确实很顶。

编程

终于到了我的老本行。

Copilot、Bito、Codegeex、通义灵码等辅助编程工具咱就不提了,这些更多地是在实际编码阶段提升了我们写代码的速度,我们直接看各种智能编程助手。

上半年,随着首位AI程序员Devin的登场,智能编程悄然拉开了序幕。Devin不仅覆盖了从需求分析到编码、调试直至部署的整个开发流程,展示了端到端的开发能力,还拥有自主学习的能力,能够不断提升自己的技能。这样一位全能型的“程序员”,其出现无疑给大家带来了不小的震动。

紧接着,不得不提我认为年度最为重要的AI应用:Cursor。

Cursor通过基于上下文的代码补全、自然语言到代码的转换、多文件操作支持、以及生成代码的审查与比对等功能,极大地革新了代码开发的方式。它不仅仅提高了开发效率,还改变了我们编写文档、调试程序的研发模式。借助Cursor,我们能够更加专注于解决复杂问题,而将一些非创造性任务交给AI处理,这种转变无疑为软件开发领域带来了深远的影响。

还因此造就了很多热点事件,比如,7岁女儿独立实现了一个APP,非程序员很快上架了一个补光灯应用,事件可能有所夸大,但全民编程时代好像真的要来了。

此外,个人感觉还有两个方面也很重要,但今年有些不够火爆。

搜索

年初时,GPT-4的一个局限性在于其知识库是静态的,无法实时获取最新信息。

而AI搜索则规避了这个问题。它也许没有那么泛化,但是对于知识获取、资讯搜集场景,已经足够替代原有的信息查询方式,以至于各大搜索引擎都迅速升级了自己的搜索。

AI搜索大大减少了我们从巨量信息中获取有效信息的难度,个人认为后续估计会成为一种常态。

硬件

另一个值得关注的就是硬件。

也许今年大家都集中在了算力提升和模型开发上,导致硬件虽有所发展,但其热度远没有达到大模型本身那么高。

年初的AI Ping、Rabbit R1虽然创意非常好,但使用体验上更像是一个玩具,个人感觉甚至不如给小爱同学接入大模型来的有趣。

在这其中,个人比较关注的就是具身智能,毕竟,拥有一个钢铁侠的贾维斯,确实很有吸引力。

最后

不得不提一下,年底发布的DeepSeek V3,根据测评,模型性能超越GPT-4o,在Chatbot Arena大模型排行榜上排名第7,是前十名唯一的开源模型,而且训练费用仅用了600万美元,要知道,GPT4的训练成本可是达到了7840万美元。

总结

2024,我们都主动或被动地参与到了AI的浪潮里。

2025,希望我们每个人都能更好地利用AI,让它成为改善生活和工作的得力助手,而不是被快速发展的科技所淘汰。

诸位共勉~