GPT-5开源?那只是奥特曼的“烟幕弹”

资讯9个月前发布 hiailand
632 0 0

在2024年即将到来的时刻,OpenAI CEO山姆·奥特曼Sam Altman)在X社交平台发表推文,汇总了用户对于OpenAI呼声最高的需求点。

GPT-5开源?那只是奥特曼的“烟幕弹”

图源:X平台

包括:

AGI(请耐心等待)

GPT-5

更好的语音模式

更高的费率限制

更好的GPT

更好的推理

对工作/行为程度的控制

视频

个性化

更好的浏览

“使用OpenAi登录”

开放源代码

作为被《时代》杂志评为“2023年度CEO”,山姆·奥特曼的一条推文瞬间成为了轰动整个AI行业的信号。尤其是万众期待的“GPT-5”与“开源”同时出现在这张表单时,更是被一些人错误解读成为了“OpenAI在2024年的发展目标,是将GPT-5开源”。

然而大模型之家发现,山姆·奥特曼这则推文中的内容仅仅是汇总了“行业的呼声”,这虽然可能会是OpenAI现阶段关注的方向,但如果将其解读为“企业发展目标”,还是多少有失偏颇。

更何况,在大模型之家看来,即使OpenAI真的推出GPT-5,可能性其实并不大。

为商业,GPT开源可能性渺茫

虽然大模型开源可以促进GPT模型的创新和发展、开源可以增加大模型的透明度和可信度、让更多的人参与到人工智能的研究和实践中,扩大大模型的影响和普及。然而,在开源世界中,如何实现商业化始终是困扰行业的难题,而目前行业通常采取的做法是通过部分开源的方式,将核心竞争力的代码进行闭源,再通过闭源部分实现商业化。

大模型之家曾指出,行业内,常常把大模型的开源与闭源的争论,类比为移动互联网时代的Android与iOS之争。例如OpenAI的GPT-4和百度的文心一言至今则坚持闭源,Meta则选择了开源的道路,相继面向“学术研究用途”开源了LLaMA和LLaMA-2模型,而百川智能在学术领域选择了开源7B、13B两种尺寸的大模型,商业探索上将53B闭源,以保护商业利益和技术的竞争优势。

GPT的闭源,为OpenAI带来了可观的收入。据The Information报道,OpenAI CEO山姆·奥特曼对员工表示,公司正以每年13亿美元(约合人民币94.93亿元)的速度产生收入,平均每月收入超过1亿美元,比去年全年2800万美元增长超过450倍,达4542%,也比三个月前预期的年收入高30%。这也让2023年成为OpenAI公司成立8年来,收入增长最快的一年。

然而,在OpenAI快速增长的背后,其巨额的成本却往往被行业所忽略。公开信息显示,2022 年,OpenAI开发GPT-4,仅训练成本支出约5.4亿美元。2023年4月,SemiAnalysis 的一项研究表示OpenAI每天为ChatGPT支付的运营成本约694.4万美元(主要是电费),年化运营成本约为2.5亿美元,综合年化成本可能超过13亿美元,这意味着OpenAI或仍处于亏损状态。

GPT-5开源?那只是奥特曼的“烟幕弹”

图源:网络

对于商业模式上,OpenAI官网文章中明确指出:我们(OpenAI)打算继续免费提供ChatGPT,并从选择付费的高级服务的用户和企业中获得收入。考虑到开发和提供大模型的高成本,我们(OpenAI)的组织目前并不盈利,也不指望在近期内盈利——我们(OpenAI)的目标仍然是广泛而安全地让人工智能的好处惠及全世界。

虽然OpenAI嘴上说着“不指望在近期内盈利”,但生存问题仍然是其不得不面对的挑战。2022年OpenAI非营利实体2022年收入仅4.5万美元,倘若没有商业化维持,OpenAI恐怕很快会迎来破产。

2023年11月,OpenAI公司董事会突然宣布罢免首席执行官山姆·奥特曼引发的动荡引起广泛关注。虽然在一系列风波后,山姆·奥特曼重返CEO职位,但行业对于风波背后的诱因的猜测中,不乏对于董事会认为山姆·奥特曼追求激进的商业化运营策略,违背了OpenAI的核心价值观的指摘。

而通过GPT-4闭源获得大量收入的OpenAI,显然没有充足的理由将GPT-5完全开源,这无异于自毁壁垒,在大模型赛道的竞逐中丧失领先优势。

为生态,部分开源仍存可能

在大模型之家看来,对于开源而言,虽然GPT-5开源的可能性极为渺茫,但是为了GPT相关生态建设,关于GPT相关的工具集开源的可能性却很高。结合“OpenAI计划下周推出GPT商店,用户可销售和共享聊天机器人”的消息,OpenAI会通过部分开源的方式,为开发者的开发、调试、分享提供便利,并通过社区的方式,接受社区的反馈和建议,不断完善和更新其GPT模型和平台。

GPT-5开源?那只是奥特曼的“烟幕弹”

图源:网络

时至今日,坚持完全开源的企业凤毛麟角,多是采用部分开源的方式,对于OpenAI而言,部分开源是一种明智的选择,既能够让更多的人参与到GPT相关生态建设中,促进社区的发展和壮大,又能够保护公司的核心技术和商业利益。

除此之外,在山姆·奥特曼的关注点中,语音、视频等大模型的多模态输出能力,也成为行业呼声大,且OpenAI发力的重点,2023年10月,GPT4推送了vision相关的功能——GPT-4V,展示了出色的图像与视频识别能力,让行业对其在图像、视频处理与自动驾驶领域的应用充满期待。ChatGPT的也在9月首次上线语音对话功能,并于11月面向全部用户开放。

OpenAI对于大模型多模态能力的关注,恰恰与大模型之家近期发布的《2024人工智能产业趋势预测》不谋而合。大模型之家指出:模态生成式AI是指能够处理多种媒体数据(如文本、图像、音频等)的AI技术。多模态生成式AI发展提速,音、视频大模型将成为发展新风口多,在2024年,多模态生成式AI的研发和应用将加速发展,推动音视频大模型的产业化应用。通过多模态生成式AI技术,人们将能够更加自然地与AI系统进行交互,实现更加高效、便捷的人机交互体验。同时,多模态生成式AI技术也将为创意产业带来新的发展机遇。

生态与商业化,这两者一直以来都是人工智能行业发展的核心要素,无法回避。在这个行业中,技术和应用的发展需要有一个健康的生态环境,以便为其商业化进程提供必要的支持和保障。同时,商业化的成功也离不开生态环境的建设,因为只有在一个良好的生态环境下,技术才能得到更好的应用和推广,进而推动整个行业的持续发展。

在人工智能行业中,生态与商业化是相互促进、相互依存的关系。只有在一个良好的生态环境下,商业化才能得到更好的发展;同时,商业化的成功也可以为生态的发展提供必要的支持和保障。因此,对于OpenAI而言,想要行稳致远,同样注重生态与商业化的平衡发展。

本文来自微信公众号“大模型之家”(ID:damoaihome),作者:乔志斌

© 版权声明

相关文章

暂无评论

暂无评论...