您的位置：首页 > 综合 >

环球今日讯！最快六月露面！GPT-5七大震撼能力首次揭秘

来源：阿尔法工场 • 2023-04-12 13:47:38

完全颠覆影视行业、为机器人提供智慧大脑、人工智能模型自主开发、构建虚拟世界预测未来结果、接入手机等电子设备创建个人智能生态…….

虽然GPT-5在官网写的Q4左右会对外正式发布，但根据微软项目有关朋友的信息预测，最早今年6-7月就会有GPT-5的功能陆续放出来。

GPT-4发布后，全球对于OpenAI的关注度持续提升。OpenAI在GPT-4之前花费8个月时间进行安全研究、风险评估和迭代。也就是说，OpenAI在去年年底推出ChatGPT的时候，已经有了GPT-4。

(资料图)

一个国外博主 AI Explained 认为GPT-5的训练时间不会很久，甚至他认为GPT-5已经可能训练完成。

笔者认为，未来的 GPT-5 将会成为人工智能技术中的重要突破，它可能会带来一些具有变革性的能力，经过一些内部调研，以下是七项GPT-5最具变革性的能力。

01 音频和视频处理——更强大的多模态处理能力

GPT-5比GPT-4更加强大的数据理解能力，可以在多模态理解方面表现更出色。

它将延续GPT-4的文本和图像处理功能，同时加入音频和视频的处理服务，从而能够准确地分析各种材料，生成连贯的上下文，翻译多种文本以及总结摘要。这将改变我们与内容的交互和消费方式，并且能够横跨各种媒体格式。

多模态模型在图像方面和类似Stable Diffusion等的图像模型间最大的区别就是其可以理解图像的内容而不是将图像变成一个个简单的标签。

从OpenAI的论文来看，GPT-4已经能够理解图像中的逻辑和其中的幽默感（比如VGA接口插入手机为什么好笑）。当前GPT-4的多模态能力仅限于图片处理能力，而GPT-5的视频处理能力则会将多模态的能力提升到可能接近人类的程度。

可以试想一下，如果未来只需要对着GPT-5输入一个有趣的meme，一张不甚明确的概念图，再加上可能存在的联网能力，GPT-5就会根据时下最流行的内容为你创建你所需要的形式的内容，他可能包括但不限于3D模型，视频，文字，音频等等内容。

02 颠覆影视制作：引领娱乐和媒体消费的革命

从OpenAI Startup Fund投资的Descript的行为可以看出，GPT-5也可以将AI技术引入影视创作领域，这将彻底颠覆影视制作的方式，并开启全新的交互式媒体时代。

GPT-5作为AI技术的重要代表，可以理解用户拍摄的影像，感知用户需要表达的情绪，构图并提供拍摄建议，甚至自行创造特效，从而使视频内容更加真实，人机交互更为自然。

通过GPT-5的技术，观众不再是单纯的内容接收者，而是故事的共同创造者。ChatGPT将记录观众的实时反应，以此为基础不断演绎新的故事情节。

这种独特的交互模式，充满了无限的创造力和探索的可能性，能够颠覆现有的媒体消费方式，为消费者带来一场前所未有的交互式体验。

例如，一部由GPT-5生成的交互式电影可以根据观众的反应不断调整故事情节，实现真正的个性化体验。

另外，GPT-5生成的音乐和艺术作品也可以与观众进行交互，使得艺术创作更加生动有趣。这些应用将极大地拓展娱乐和媒体消费的领域，带来空前的创意和乐趣。

除了对个人消费者的影响，GPT-5还将深刻影响社交媒体的运营和发展。

当用户分享他们的交互体验时，其他用户可以在此基础上定制属于自己的二次体验，并与其他人分享，形成病毒式传播的效应。这将为社交媒体的发展和运营带来新的变革和机遇。

因此，GPT-5的出现将不仅仅是一种技术进步，而是一场真正的娱乐和媒体消费方面的革命。在未来，我们将迎来更加丰富多彩、个性化和交互式的娱乐和媒体消费方式。

关键词：