OpenAI 或最早秋季推出“草莓”推理AI模型，能解决从未见过的数学问题

人工智能AI2024-08-28

据国外媒体报道，在OpenAI积极寻求筹集更多资金之际，其研究团队正全力打造一款代号为“草莓”（原Q*）的新型人工智能产品，旨在超越现有技术，更有效地解决复杂难题。据知情人士透露，这款人工智能模型预计最早将于今年秋季作为聊天机器人的一部分推出，可能集成于ChatGPT平台中。“草莓”的一大亮点在于其能够解决前所未见的数学问题，这是当前聊天机器人所无法企及的。...

草莓_副本.jpg

据国外媒体报道，在OpenAI积极寻求筹集更多资金之际，其研究团队正全力打造一款代号为“草莓”（原Q*）的新型人工智能产品，旨在超越现有技术，更有效地解决复杂难题。

据知情人士透露，这款人工智能模型预计最早将于今年秋季作为聊天机器人的一部分推出，可能集成于ChatGPT平台中。“草莓”的一大亮点在于其能够解决前所未见的数学问题，这是当前聊天机器人所无法企及的。此外，通过特定训练，“草莓”还能应对编程相关的挑战。

然而，“草莓”并不局限于回答与技术相关的问题，如果有更多的时间去“思考”，它同样擅长处理更为主观的话题，如产品营销策略咨询。为了展示“草莓”在处理语言相关任务方面的能力，OpenAI的研究人员已展示了其解决复杂字谜游戏的实例。

推出“草莓”是OpenAI持续创新的一部分，旨在与财力雄厚的对手竞逐生成式人工智能及大语言模型领域的领导地位。这项技术不仅引领未来趋势，还为解决多步骤任务的智能体（Agent）产品奠定基础，这些智能体被寄予厚望，可能成为新的收入增长点。

OpenAI的业务正以令人难以置信的速度增长：月度收入已较去年翻两番，达到2.83亿美元，主要得益于大语言模型与ChatGPT订阅服务的热销。尽管该公司的月亏损额可能更高，但其估值却在不断飙升，现已突破860亿美元大关。

然而，OpenAI的未来前景与“猎户座”（Orion）新型旗舰大语言模型的最终发布紧密相关。作为现有旗舰大语言模型GPT-4的升级版，“猎户座”旨在进一步巩固OpenAI在业界的领先地位。到目前为止，其他竞争对手已经推出了性能与GPT-4大致相当的大语言模型。

目前，尚无法确定OpenAI能否在今年内推出提升GPT-4及ChatGPT性能的聊天机器人版“草莓”，该版本为原始“草莓”模型的小型简化版，即“蒸馏”版（distillation）。它寻求保持与更大模型相同的性能水平，同时提升操作便捷性与成本效益。

一位知情人士表示，OpenAI正利用更大版本的“草莓”生成用于训练“猎户座”的“合成数据”。这一创新举措旨在突破传统训练模型对高质量现实世界数据依赖的局限，如从互联网上提取文本或图像，而是通过人工智能生成的数据加速模型优化进程。

此外，据知情人士透露，“草莓”还将为即将问世的OpenAI智能体提供有力支持。

01 减少“幻觉”

智能体初创公司Minion AI的首席执行官、GitHub Copilot的前首席架构师亚历克斯·格拉维利（Alex Graveley）表示，通过“草莓”生成的高质量训练数据，OpenAI能够显著降低模型错误率，即“幻觉”现象。

他描绘了一个理想场景：“一个没有幻觉的模型，面对逻辑难题首次作答就能给出准确答案。”格拉维利说解释称，该模型之所以能够做到这一点，是因为“训练数据中的模糊性减少，从而减少了模型的自我猜测。”

本月早些时候，OpenAI首席执行官山姆·奥特曼（Sam Altman）在社交媒体上分享了一张“草莓”的图片，虽未详细说明，却激发了公众对即将发布的新品的无限遐想。据知情人透露，OpenAI还于今夏向美国国家安全官员展示了“草莓”项目。

奥特曼在5月活动中透露：“我们已积累足够数据，以支持‘猎户座’等下一代大模型的研发，期间还尝试了包括生成合成数据在内的多种实验。”他同时表达了为OpenAI争取更多资金、并探索减少亏损的方法。

一位知情人士表示，自2019年以来，OpenAI已从微软处筹集约130亿美元资金，作为双方至2030年商业合作的一部分。据知情人士透露，双方合作条款或有所调整，特别是关于OpenAI如何支付云服务器租用费用以支持其人工智能研发，这一费用目前是OpenAI的主要支出成本。

02 有利可图的用例

鉴于当前人工智能在航空航天、结构工程等数学密集型领域的局限性，开发擅长解决复杂数学问题的人工智能应用具有显著的市场潜力。然而，这一目标对人工智能研究人员构成了挑战，因为现有生成式人工智能（如ChatGPT等）常会给出错误的答案，这在数学领域尤为致命。

数学推理能力的增强不仅有助于人工智能模型在数学领域的应用，还能提升其处理会话查询（如客户服务请求）的精确度与效率。

与此同时，谷歌与多家初创公司正积极投入推理技术的研发。近期，谷歌DeepMind宣布其人工智能模型在国际数学奥林匹克竞赛中展现出超越多数人类选手的实力。OpenAI的另一个竞争对手Anthropic亦宣称，其最新大语言模型因推理能力的飞跃，能够编写更复杂软件代码并解答图表相关问题。

为提升模型推理能力，部分初创公司采取了将问题拆解为更小步骤的经济型策略，尽管此方法进展缓慢且成本不菲。

无论“草莓”是否会作为产品独立发布，市场对“猎户座”均寄予厚望，期待OpenAI能借此巩固领先地位并持续实现可观收入增长。近期，谷歌先于OpenAI推出了一款灵活应对用户中断与话题转换的人工智能语音助手，尽管OpenAI在5月已率先发布其版本。

与此同时，谷歌、xAI、Anthropic及Meta等开发商的大语言模型在Lmsys Chatbot Arena等榜单上迅速追赶OpenAI，尽管后者仍是商业买家与人工智能应用开发者的首选。

03 伊利亚看到了什么？

“草莓”项目起源于OpenAI的早期研究，由首席科学家伊利亚·苏茨凯弗（Ilya Sutskever）数年前发起。然而，苏茨凯弗近期离职，并创立了与OpenAI竞争的人工智能实验室。他离职前，OpenAI的研究员雅库布·帕乔基（Jakub Pachocki）与西蒙·西多尔（Szymon Sidor）基于苏茨凯弗的工作，开发了新型数学解决模型Q*，这一进展令部分关注人工智能安全性的研究者感到意外。

值得注意的是，在OpenAI取得上述突破并遭遇内部安全争议前夕，由苏茨凯弗领导的董事会曾短暂解雇奥特曼，但随后又迅速恢复了其职位。

去年，Q*模型问世之前，OpenAI团队已探索了“测试时计算”（test-time computation）的概念，旨在提升大语言模型的问题解决能力。这一方法允许模型有更多时间深入思考指令或问题的各个部分。当时，苏茨凯弗还撰写了相关博客文章，对该研究进行了阐述。

标签OpenAI

上一篇：苹果将于9月10日凌晨举行发布会

下一篇：苹果正秘密研发桌面机器人，目标售价约1000美元