目前AIGC很典型的应用是:利用自然语言描述作为输入,生成各种模态的数据。包括:文本、代码、图像、语音、视频、3D模型、场景、音乐等。
文本生成方面,AIGC目前可以较好地完成新闻播报等结构化写作、推荐相关内容、帮助润色等非结构化内容,同时在虚拟男/女友、心理咨询等闲聊机器人中应用较为广泛。剧情续写、营销文本、文本交互游戏等应用还没实现规模化应用,期待未来某一天,AIGC的终稿能媲美甚至超越人类。
图像生成方面,随着算法模型的不断迭代,AI 作画水平不断提高。在图像编辑工具上,去除水印、提高分辨率、特点滤镜等已较广泛应用。根据要求生成画作、海报、模特图等功能性图像生成发展也接近成熟。但与专职艺术家、设计师和摄影师的产品设计作品存在一定差距。
音频生成的发展较为成熟,消费与企业级的应用正在铺开。当前,AIGC在语音克隆、生成虚拟人的特定歌声/播报等的文本生成特定语言、包含作曲与编曲的乐曲/歌曲生成上得到广泛应用,代表企业和应用的有倒映有声、Deepmusic、网易-有灵智能创作平台等。AI 降噪去除压缩和采样中的噪音仍需改善,AI作曲不再机械化与人类创作音乐水平相仿,在未来值得期待。
视频生成方面,AIGC对于删除特定主体、生成特效、跟踪剪辑等的视频属性编辑已较广泛应用,视频换脸等的视频部分剪辑预计不久将规模化应用。当前,全自动生成长视频作品还不能实现,距离依个人梦想定制电影和剧集还较为遥远。
其他应用领域还有游戏、代码、3D等。代码补全生成已较为成熟,大量应用早已落地;游戏中游戏操作策略生成和NPC逻辑及剧情生成尚需进一步完善;3D生成尚处于早期阶段,还没实现规模化应用。相关领域的更加智能将成为未来增长方向。
由这些基本模式的生成任务,可以衍生出各种各样的应用场景。随着AIGC技术的发展和人们想象力边界的扩展,这些场景还将继续增加。
AIGC使得C端以较低的门槛使用,但B端仍然是AIGC目前主要商业模式。C端的付费逻辑在于高效获取信息,替代表达以及扩大用户创造力;B端主要原因是它能为企业节省大量成本,使企业可以节省大量人力成本。
近期微软、谷歌等全球软件互联网大厂大力投入AIGC,并开始探索应用层面的突破,AIGC已经来到2年前自动驾驶的应用突破拐点,2023年有望成为AIGC大年。
传统商业时代,驱动力是产品本身,互联网商业时代,驱动力是用户流量,数字商业时代,消费升级(场景要素、体验要素、服务要素)和数字技术同步驱动,以互联网、物联网、大数据和人工智能等数字技术为核心,加速商品、营销、服务、供应链数字化改造,以更高的效率、更好的体验为用户提供商品和服务。