九江浔阳网站建设,做网站除了有服务器还需要什么问题,wordpress云端采集插件,建立网站时间作者#xff1a;小岩
编辑#xff1a;彩云
Sam Altman在整个AI领域#xff0c;乃至整个科技领域都被看作是极具影响力的存在#xff0c;而2023年OpenAI无限反转的宫斗事件更是让Sam Altman刷足了存在感#xff0c;他甚至被《时代》杂志评为“2023年度CEO”。
也正因此小岩
编辑彩云
Sam Altman在整个AI领域乃至整个科技领域都被看作是极具影响力的存在而2023年OpenAI无限反转的宫斗事件更是让Sam Altman刷足了存在感他甚至被《时代》杂志评为“2023年度CEO”。
也正因此 Sam Altman的一条推文瞬间就可以成为轰动整个AI行业的信号特别是当这条推文还与万众期待的“GPT-5”有关的时候。 2023年平安夜Sam Altman在社交平台大胆公布了2024年的雄心壮志。他所发表的关键词不仅涵盖了2024年OpenAI的整体规划更契合了用户的迫切需求。这其中包括
AGI请耐心等待
GPT-5
更好的语音模式
更高的费率限制
更好的GPT
更好的推理
对工作/行为程度的控制
视频
个性化
更好的浏览
“使用OpenAi登录”
开放源代码
Sam Altman透露OpenAI计划在接下来的一年内实现多个令人瞩目的里程碑。其中所涉及到的内容不仅仅一次简单的技术更新更是一场至关重要的AI变革。当然最受关注的还是GPT-5。 AI领域的开源与闭源之争类似于Android与IOS之争。
对于AI界来说大家除了关心 GPT-5能否在技术壁垒上有所突破更关心一个重点GPT-5能否实现开源
大模型的开源和闭源之争一直是行业内争论的焦点这种争论与移动互联网时代的Android与IOS之争有异曲同工之妙。有意思的是各个AI大厂对于开源还是闭源的选择也不尽相同。
目前拔得头筹的OpenAI的GPT-4和百度的文心一言都坚持闭源Meta选择了开源的道路相继面向“学术研究用途”开源了LLaMA和LLaMA-2模型。百川智能则兼具开源和闭源在学术领域选择了开源使用7B和13B两种尺寸的大模型商业探索上将53B闭源以保护商业利益和技术的竞争优势。 GPT的闭源为OpenAI带来了可观的收入。据The Information报道OpenAI CEO Sam Altman对员工表示公司正以每年13亿美元约合人民币94.93亿元的速度产生收入平均每月收入超过1亿美元相较于去年全年2800万美元增长超过450倍达4542%。这个数据也比3个月前预期的年收入高30 %。这也让2023年成为OpenAI公司成立8年来收入增长最快的一年。而这些恰恰是GPT-4闭源所带来的。
关键词GPT-5能实现开源吗
那么GPT-5能实现开源吗未必。
对于商业模式OpenAI曾在官网中明确指出“打算继续免费提供ChatGPT”但也会选择从付费的高级服务的用户和企业中获得收入。而且虽然OpenAI嘴上说着“不指望在近期内盈利”但考虑到开发和提供大模型的高成本生存问题仍然是其不得不面对的挑战。
此外尽管OpenAI实现了快速增长但背后的行业成本却不容忽略。根据公开信息显示2022 年OpenAI开发GPT-4仅训练成本支出约5.4亿美元。2023年4月OpenAI每天为ChatGPT支付的运营成本约694.4万美元其中主要是电费 年化运营成本约为2.5亿美元综合年化成本可能超过13亿美元。毫无疑问OpenAI依旧处于亏损阶段。
所以倘若没有商业化的维持OpenAI恐怕很快会迎来破产。更重要的是已经通过GPT-4闭源尝到甜头获得大量收入的OpenAI显然没有充足的理由将GPT-5完全开源这无异于自毁壁垒在大模型赛道的竞逐中丧失领先优势。从这个层面来说。GPT-5实现开源的概率不大。
即便Sam Altman在推文中将“开源”标注成了关键词但更多的也只是在迎合行业的呼声我们还不能将其解读为“企业2024年的发展目标”。
不过“部分开源”的可能性并非没有。GPT-5完全开源的可能性虽然比较小但是为了GPT相关生态建设对与GPT相关的工具集提供开源的可能性却很高。或许OpenAI会通过为较少部分提供开源的方式为开发者的开发调试分享提供便利。
未来的GPT-5究竟会具备哪些新能力
近日艾伦人工智能研究所发布了Unified-IO 2它的发布极具意义因为它可以帮助我们更好的预判GPT-5的能力。
为什么这么说呢Unified与ChatGPT之间存在着怎样的关系
事实上早在2022年6月艾伦人工智能研究所就推出了第一代Unified-IO它是首批能够处理图像和语言的多模态模型之一。大约在同一时间OpenAI正在内部测试GPT-4并在2023年3月正式发布。所以Unified-IO可以看作是对于未来大规模AI模型的前瞻。换句话说因为Unified-IO 2的出现我们可以大致预判一点OpenAI可能正在内部测试GPT-5并很有可能在几个月后发布。 艾伦人工智能研究所推出的Unified-IO 2是第一个可以处理和生成文本图像音频视频和动作序列的模型。这个新的高级人工智能模型使用几十亿个数据点进行训练虽然模型大小只有7B却展现出迄今为止最广泛的多模态能力。它的训练数据包括10亿个图像-文本对1 万亿个文本标记1.8亿个视频剪辑1.3亿张带文本的图像300万个3D资产和100万个机器人代理运动序列。研究团队将总共120多个数据集组合成一个600 TB的包涵盖220个视觉语言听觉和动作任务。Unified-IO 2采用编码器-解码器架构并进行了一些更改以稳定训练并有效利用多模态信号。
模型可以回答问题根据指令撰写文本、以及分析文本内容可以识别图像内容提供图像描述执行图像处理任务并根据文本描述创建新图像可以根据描述或说明生成音乐或声音以及分析视频并回答有关视频的问题。此外通过使用机器人数据进行训练Unified-IO 2还可以为机器人系统生成动作例如将指令转换为机器人的动作序列。由于多模态训练它还可以处理不同的模态例如在图像上标记某个音轨使用的乐器等。
总体而言Unified-IO 2在超过35个基准测试中表现良好包括图像生成和理解自然语言理解视频和音频理解以及机器人操作。在大多数任务中它能够比肩专用模型甚至更胜一筹。在图像任务的GRIT基准测试中Unified-IO 2获得了目前的最高分。通过这些我们也可以更好的窥见未来GPT-5的模样。
对于AI发展而言科技生态与商业化是缺一不可的核心要素。技术和应用的发展需要商业化提供必要的支持和保障而商业化的成功也离不开生态环境的建设。两者之间必须相辅相成有机结合。希望在未来发布的GPT-5中OpenAI可以起到先导作用率先实现生态与商业化之间的平衡。