对于很多人来说,生成式AI在全球的大面积爆发不过短短2年时间,但它正以意想不到的速度改变着世界。为何它发展如此之快?未来又将带着怎样的轨迹前行?下面,司普科技1号解说员小司带大家一探究竟~
在有些人看来,生成式AI的爆发式增长像是一次偶然性的技术突破,但从整个大环境看,它的爆发不是横空出世,而是多种条件交叉发展的结果。
技术方面,2016年AlphaGo打败世界围棋冠军,让AI重回大众焦点。而在此之前,卷积神经网络(CNN)、循环神经网络(RNN)、生成对抗网络(GAN)等深度学习模型或AI核心算法都已经问世,只是苦于找不到合适的应用场景或存在缺陷被雪藏和边缘化。2017年,谷歌研究团队首次提出了Transformer,这种基于自注意力机制的神经网络模型拥有强大的并行计算、长序列处理和语义理解能力,尤其擅长文本生成。发现Transformer在内容生成这块的潜质,2018年,谷歌团队在其基础上提出了预训练模型Bert。Bert首次尝试通过自监督学习和微调来训练大模型的自然语言处理能力,被视为里程碑式的发现。这种模型训练方法为OpenAI等AI公司打开了思路。2018-2022年,OpenAI蓄势推出了3代GPT大语言模型。随着千亿级参数的GPT-3.5大模型涌现能力,OpenAI很快在2022年11月推出现象级产品ChatGPT,并一炮走红。2023年是AI显性化发展的元年。这一年,OpenAI趁热打铁推出了GPT-4,与此同时,Midjourney、Runway、DALLE、Stable Diffusion等多模态AIGC产品强势出圈,点燃了全民的使用热情。另一边,Meta AI发布了开源大模型LLaMA,为国内外大量垂类、端侧大模型提供了技术底座,吸引到更多AI新势力涌入赛道。国内方面,2023年前后成长起来了一大批AIGC公司,随着基础大模型赛道诞生出数百家企业,“百模大战”由此兴起。人们享受着新技术红利,也加速着市场转型。不过从整个市场的发展曲线来看,AI高速发展的背后,除了技术(尤其是大模型)方面的成熟,还有硬件上的配合。比如在2016年、2020年、2022年这三个AI发展的关键节点,英伟达分别推出了DGX-1、A100、H100三款划时代意义的硬件产品,为AI大模型训练提供了强大的算力支持。国内方面,2016年前后,国产芯片陆续布局。在2019年AI热潮爆发前夕,华为率先推出了昇腾系列AI芯片。在市场需求和政策的双重引导下,眼下越来越多的“国产芯”在市场上崭露头角,也为国产大模型的发展提供了重要的端侧算力支撑。除此之外,包括AIGC在内的人工智能技术在各行业被广泛应用,其实也有业务创新、提效降本、业绩增收、升级体验、猎奇尝新以及人口老龄化等多方面的考虑。
当这些时代因子交织在一起,合力推动了AIGC的崛起及爆发式增长。
生成式AI作为走向通用人工智能的一大步,包含文本、图像、音视频、代码等多模态的内容生成,现已覆盖聊天对话、问答搜索、图像生成、视频生成、音乐创作、配音、翻译、编程、营销策划、情感关怀、数字人等多个B端和C端应用领域。
整体的商业规模也许不够明确,但细分赛道的市场体量及用户量级却让人浮想联翩。比如AI图像生成赛道,头部玩家Midjourney的用户量早就达到千万级,年营收能做到约2-3亿美元规模。AI视频生成赛道,2022年全球市场规模约4.7亿美元,2023年超过5.6亿美元(数据来源:dataintelo)。市场规模因为生成质量/时长、安全、版权等方面的顾虑算不上抢眼,但Runway、Pika、Sore(OpenAI)、Lumiere(谷歌)等视频生成模型和产品的市场热度和应用前景一直相当高。近两年很火的AI数字人也是应用较为广泛的赛道之一,目前在金融、教育、企服、电商、娱乐等行业均有或深或浅的商用。据IDC、艾媒等行业研究机构推测:未来5年中国AI数字人市场或将突破百亿规模,而对关联产业规模的带动则在千亿级。至于AIGC头号选手OpenAI,早期其产品月访问量便接近9亿,2023年总营收达16亿美元。整体的用户规模、市场营收及增速则更为可观。从整体来看,目前国内外AIGC市场均迎来了爆发期,经济贡献度持续攀升。
其中,据麦肯锡2023年底发布的《生成式AI在中国》显示:生成式AI有望为全球经济贡献约7万亿美元的价值,其中中国市场约占到全球总量的1/3,将贡献约2万亿美元的价值。2024年中国AIGC应用市场规模能达到约200亿元,2030年或将突破万亿元规模。
以上进一步刺激了各方对AIGC赛道的加码,推动整个行业向上发展。
目前,生成式AI呈现出很多的发展态势和趋势走向。总结起来,以下3点值得关注:
从横向看,AIGC应用正越来越多,品类也越来越细。以对话式生成为例,除了基础性的问答、搜索、写作等,目前还延伸到了社交、婚恋、教学、陪伴、陪练、审核等多个细分领域。从纵向看,随着AIGC与行业的结合度越高,落地的业务场景也在持续增多。仍以对话式生成为例,在司普科技AIGC产品的应用中,就有通过对话形式,服务于智能教学、科研写作、生产偏差写作、产品交易、智能运维等多个行业场景。以上打破了AIGC的能力边界,也极大地拓展了其客群和商用价值。其实生成式AI能同时服务于通用和专用业务场景,很大程度上源于它的跨模态生成能力。这方面的能力,除了文生文、文生图、文生视频、文生音频等形态,同时还包括能输入和解析相应的图像、音频等多模态信息,并最终生成人们想要的文本内容、可视化图表、样图样稿等。事实上,细分赛道的很多AIGC厂商已经在尝试强化跨模态生成能力,以丰富自身的业务线。
比如GPT-4强化了多模态识别能力,Midjourney、Stability AI等从图像生成扩展到了视频生成、图片/视频修复等领域,“年度新贵”Suno主打AI音乐创作,也涵盖歌词(文本生成)、旋律(音频合成)的多模态生成等。为了打造核心优势,减少对第三方的依赖,未来这方面的能力或有增无减。和底层大模型多按实际的token使用量收费不同,主流的AIGC应用大多采用订阅收费模式,通过扩大用户量和相应的客单价,来提升盈利能力。目前,在较大的成本面前,如何有效获客并实现持续的收益,是大多数AIGC厂商普遍关心的点。在这方面,打造商业闭环、选对获客渠道、开拓潜力市场正成为很多AIGC厂商的自主选择,也左右着未来的发展路径。AI文生图公司Midjourney算是其中的先行者。这家公司于2021年晚于DALLE-1几个月问世,但它一开始就坚定了发展路线——前期通过免费额度获客,并通过和知名社交平台Discord(平台月活约1.5亿)合作,获取精准客源。在与Discord的合作中,Midjourney很快吸引到上千万用户,仅靠订阅费,就做到上亿美元营收。2023年,同行奋起直追时,Midjourney已经在开拓海外市场,并于当年5月推出了中文版Midjourney,率先在国内社交流量平台试水。为扩大市场份额,它还在AI图像生成服务基础上,开拓了关联业务线。这波操作加上扎实的产品基本功,使其成了同行争相模仿的对象。目前,Midjourney算是业内少数不靠投资就自我造血的AIGC企业。而对于大多数AIGC厂商来说,因为基础投入居高不下,且客户资源与资金更容易向头部聚拢,尽早打造自己的商业闭环,提升持续盈利能力,几乎成了行业突围的关键。除此之外,生成式AI的安全建设、监管治理等方面近两年也越发受重视。它让人们以更加审慎的态度拥抱AI,同时也推动着整个市场实现良性、可持续发展。