

OpenAI 的下一代大谈话模子「Orion」可能碰到了前所未有的瓶颈。
据 The Information 报说念,OpenAI 的里面职工称 Orion 模子的性能普及莫得达到预期,与从 GPT-3 到 GPT-4 的升级比较,质料普及要「小得多」。
此外,他们还涌现 Orion 在处理某些任务时并不比其前身 GPT-4 更可靠。尽管 Orion 在谈话手段上更强,但在编程方面可能无法杰出 GPT-4。

▲图源:WeeTech
报说念指出,检修高质料文本和其他数据的供应正在减少,这使得找到好的检修数据变得愈加费事,从而减缓了大谈话模子(LLMs)在某些方面的发展。
不仅如斯,曩昔的检修将愈加损失策动资源、财力甚而电力。这意味着开发和运行 Orion 以及后续大谈话模子的本钱和代价将变得愈加端淑。
OpenAI 的酌量员诺姆 · 布朗(Noam Brown)最近在 TED AI 大会上就涌现,更先进的模子可能「在经济上不成行」:
咱们果真要耗尽数千亿好意思元或数万亿好意思元检修模子吗? 在某个时候,彭胀定律会崩溃。
对此,OpenAI 仍是开发了一个由肃肃预检修的尼克 · 雷德(Nick Ryder)携带的基础团队,来酌量怎么叮嘱检修数据的匮乏,以及大模子的彭胀定律(scaling laws)将合手续到什么时候。

▲ Noam Brown
彭胀定律(scaling laws)是东说念主工智能界限的一个中枢假定:只消有更多数据可供学习,并有更多的策动才能来促进检修历程,大谈话模子就能络续以计议的速率普及性能。
苟简来说,scaling laws 形色了参加(数据量、策动才能、模子大小)和产出之间的关联,即咱们对大谈话模子参加更多资源时,其性能普及的进度。
例如来讲,检修大谈话模子就像在车间分娩汽车。领先车间限制很小,惟有几台机器和几个工东说念主。这时,每加多一台机器或一个工东说念主,齐能权贵提高产量,因为这些新增资源凯旋调换为分娩才能的普及。
跟着工场限制的扩大,每加多一台机器或工东说念主带来的产量普及伊始减少。可能是因为贬责变得愈加复杂,梗概工东说念主之间的合营变得愈加费事。
当工场达到一定例模后,再加多机器和工东说念主可能对产量的普及终点有限。这时,工场可能仍是接近地盘、电力供应和物流等的极限,加多的参加不再能带来成比例的产出加多。

而 Orion 的逆境就在于此。跟着模子限制的加多(不异加多机器和工东说念主),在初期和中期,模子的性能普及可能终点明显。但到了后期,即使络续加多模子大小或检修数据量,性能的普及也可能越来越小,这便是所谓的「撞墙」。
一篇近期发表在 arXiv 上的论文也涌现,跟着对各人东说念主类文本数据需求的增长和现存数据量的有限性,瞻望到 2026 年至 2032 年之间,大谈话模子的发展将耗尽现存的各人东说念主类文本数据资源。

▲图源:arXiv
即使诺姆 · 布朗指出了曩昔模子检修的「经济问题」,但他如故对以上不雅点涌现反对。他合计「东说念主工智能的发展不会很快放缓」。
OpenAI 的酌量东说念主员也大齐容或这种看法。他们合计,尽管模子的彭胀定律可能放缓,但依靠优化推理时候和检修后校正,AI 的举座发展不会受到影响。
此外,Meta 的马克 · 扎克伯格、OpenAI 的山姆 · 奥特曼和其他 AI 开发商的首席本质官也公开涌现,他们尚未达到传统彭胀定律的极限,况且仍在开发端淑的数据中心以普及预检修模子的性能。

▲ Sam Altman(图源:Vanity Fair)
OpenAI 的产物副总裁彼得 · 韦林德(Peter Welinder)也在社媒上涌现「东说念主们低估了测试时策动的宏大功能」。
测试时策动(TTC)是机器学习中的一个观念,它指的是在模子部署后,对新的输入数据进行推理或预测时所进行的策动。这与模子检修阶段的策动是分开的,检修阶段是指模子学习数据容貌和作念出预测的阶段。
在传统的机器学习模子中,一朝模子被检修好并部署,它时时不需要罕见的策动来对新的数据实例作念出预测。关联词在某些更复杂的模子中,如某些类型的深度学习模子,可能需要在测试时(即推理时)进行罕见的策动。
例如,OpenAI 所开发的「o1」模子就使用了这种推理容貌。内容上,总共 AI 产业界正将重点转向在驱动检修后再对模子进行普及的容貌。

▲ Peter Welinder(图源:Dagens industri)
对此,OpenAI 的聚积创举东说念主之一伊利亚 · 苏茨克弗(Ilya Sutskever)最近在秉承路透社采访时承认,通过使用广宽未秀美数据来检修东说念主工智能模子,以使其相接谈话容貌和结构的预检修阶段,其收尾普及已趋于巩固。
伊利亚涌现「2010 年代是彭胀的时期,现时咱们再次回到了探索和发现的时期」,况且指出「扩大正确的限制比以往任何时候齐愈加进犯」。
Orion 瞻望将在 2025 年推出。OpenAI 将其定名为「Orion」而非「GPT-5」体育游戏app平台,这也许涌现着一场新的转换。天然暂时受表面为止而「难产」,咱们仍然期待着这个领有新名字的「重生儿」能给 AI 大模子带来新的改造。
