AI市场
如果云服务是根基,那么AI在未来就是与之紧密配合的武器。
基于预训练大模型的生成式AI技术
AIGC提升数字化内容生产质效,变革人机交互体验
2022年,大模型技术研发上的突出进展来自于BEiT-3多模态(视觉-语言任务)基础模型,包括其在视觉问答、图片描述生成和跨模态检索任务上的出色表现。多模态大模型的快速发展为生成式AI (Generative AI,AIGC)技术能力的升级提供了强力支撑和应用产品的全新可能性。2022年,一幅由Midjourney生成的AI画作《太空歌剧院》横空出世,后AI生成图片在社交平台疯狂传播;2022年底,AI绘画热潮犹在,ChatGPT(Chat Generative Pre-trained Transformer)又使AIGC这一概念彻底出圈。AIGC是一种全新的内容生产方式,是利用现有文本、音频文件或图像创建新内容的技术。其使用机器学习算法,从数据中学习要素,一般基于跨模态大模型打造,包括基于素材的部分生成和基于指令的完全自主生成和生成优化。得益于真实数据积累和计算成本下降,可帮助生成数字化内容初稿,产品包括AI绘画、平面设计、对话系统、搜索引擎、代码生成等,提高了数字化内容的丰富度、生产效率与创造性;类人的交互体验和全民参与度也提升了C端消费侧对于AI的感知,进一步拓宽了市场对AI商业价值的想象空间。
ChatGPT——生成式AI里程碑
生成式AI的重大突破,通用基础大模型的胜利
相比之前的生成式对话产品,ChatGPT(Chat Generative Pre-trained Transformer )在大范围连续对话能力、生成内容质量、语言理解能力和逻辑推理能力上都得到大幅提升,超出了大众对于一款聊天机器人的预期,是生成式AI(AIGC)极为关键的发展节点。作为一款生成式预训练大语言模型,“Chat”指向它的功能,“Generative”代表它属于生成式算法。生成式算法在过去数年中受制于RNN的内生缺陷始终发展缓慢,直到2017年 “Transformer”架构出现并解决了传统RNN模型的问题,生成式AI才开始在预训练的Transformer架构之上焕发生机,NLP、CV甚至多模态领域通用基础大模型飞速演进。在模型参数量几何级数增长以及多种训练方式的探索之中,ChatGPT横空出世,也标志着通用基础大模型将突破NLP领域以小模型为主导的传统发展范式。
围绕新兴科技生产力的国家博弈
GPT模型成为科技封锁和保护主义对象的趋势初现端倪
国家层面对于目前世界上最优秀(从用户生态到商业落地层面评估)的AIGC公司——OpenAI和其核心产品ChatGPT的态度也比较慎重。比如,意大利宣布封禁ChatGPT并限制OpenAI处理意大利用户信息;我国A股多家企业也发布公告披露“公司未与OpenAI开展合作,ChatGPT的产品和服务未给公司带来业务收入”。同时,ChatGPT平台也封禁大量OpenAI账户,其中包括部分使用中文进行对话的用户。作为新兴科技生产力, ChatGPT成为科技封锁和保护主义对象的趋势初现端倪。从我国所处的追赶者角色看,类ChatGPT产品及其下游应用产业对于国家数字经济发展的战略意义不容忽视。半导体产业“卡脖子”的前车之鉴发人深省,OpenAI的成功再次暴露了中美两国不仅在AI算力层面差距巨大,在AI算法和底层框架等层面也存在代际差距。我国AIGC产业发展需立足长远战略,布局大模型技术研发、商业落地、生态建设与产业治理。
AIGC助力数实融合世界建设
需前瞻性对技术、数据与生成内容规划相关行业标准
需求侧,随着数字经济与实体经济的加速融合,人类社会经济生活对数字世界内容的需求不断提高,牵引各类AIGC应用试水落地;供给侧,智能算力支撑、深度神经网络结构升级、商用基石模型出现、多模态大模型等技术进步驱动了AIGC产品可用性的不断加强。未来,随着低延迟网络技术发展,VR/AR等智能终端设备规模商用,AIGC算法能力如视频和3D内容生成、分布式交互算法等进一步提升,AIGC将加速助力数实融合世界建设。新技术与数字内容的海量迸发也增加了监管难度,为促进产业有序发展,有关部门及行业协会应在互联网信息监管及AI治理的大背景下前瞻规划。
中国AIGC产业市场规模
市场规模呈指数级增长,突破规模化临界点攫取万亿产业价值
根据第50次《中国互联网络发展状况统计报告》,截至2022年6月,中国互联网普及率已高达74.4%。在网民规模持续提升、网络接入环境日益多元、企业数字化进程不断加速的宏观环境下,AIGC技术作为新型内容生产方式,有望渗透人类生产生活,为千行百业带来颠覆变革,开辟人类生产交互新纪元。艾瑞咨询预测,2023年中国AIGC产业规模约为143亿元,随后进入大模型生态培育期,持续打造与完善底层算力基建、大模型商店平台等新型基础设施,以此孕育成熟技术与产品形态的对外输出。2028年,中国AIGC产业规模预计将达到7202亿元,中国AIGC产业生态日益稳固,完成重点领域、关键场景的技术价值兑现,逐步建立完善模型即服务产业生态,2030年中国AIGC产业规模有望突破万亿元,达到11441亿元。
中国AIGC产业图谱全景图
中国AIGC产业机会前瞻
技术变革:模型层>工具层>算力层>应用层;
资源要素:算力层>模型层>应用层>工具层;
市场机会:应用层>工具层>模型层>算力层;
预训练大模型的路径探讨
了解人工智能时代的“ios”与“安卓”,闭源与开源市场将并存互补
在以OpenAI为代表的闭源模型厂商开放对外技术服务后,开源模型厂商也在加紧发力,以Meta的Llama模型为代表陆续开源迭代,意图进一步实现生态层面的跑马圈地,2023年上半年LLM与数据集迎来开源季。大模型的开源可根据开源程度分为“可研究”与“可商用”级别。2023年2月,Meta发布了开源大模型LLM的第一个版本Llama,授予“可研究”用途。2023年7月进一步发布“可商用”的Llama2版本,虽然有日活超过7亿产品需额外申请、不能服务于其他模型调优等的商用限制,但海外很多中小企业已可用Llama2的模型来做私有化部署,基于Llama2开源模型训练出定制化的可控模型。由于Llama2基本不支持中文,对中国的大模型商用生态暂时不会产生实质性变化,中国仍需开发培育适配于中文数据土壤的开源生态。闭源LLM可为B端用户和C端消费者持续提供优质的模型开发及应用服务;开源LLM可从研究角度促进广大开发者和研究者的探索创新,从商用角度加速大模型的商业化进程与落地效果。未来,开源和闭源的LLM会并存和互补,为大模型发展共同创造出多元协作的繁荣生态。
着力打造中国AIGC开源社区生态
轻量级模型陆续开源,助力开源生态建设,千亿级模型暂以闭源路径开展
2023中关村论坛上,科技部副部长吴朝晖表示,中国将坚持开源协作,加强大模型技术持续创新,协同解决透明性、稳定性等共性问题,进一步推动算力资源和数字资源开放共享,加快形成大模型的产业生态。而AIGC开源社区的建设可以吸纳更多的开发者及拥有定义用户的主导权,以AI开源创新平台为杠杆,带动支撑底层AI芯片、智算中心及云服务等基础设施发展。从供给侧逻辑来看,大模型开源早期由高校和机构推动,如清华大学的ChatGLM-6B、复旦大学的MOSS,陆续有头部云厂商加入,如百度的文心系列与阿里的通义系列,共同为中国AIGC开源社区的建设“增砖添瓦”,以阿里云魔塔社区、百度云飞桨社区为代表的开源社区建设成果初现,而千亿级模型暂以闭源路径开展,凭借稳定、优质效、完整工具链等产品特点定位应用市场;从商业化路径来看,参考海外明星开源社区Hugging Face的商业模式,中国AI开源社区同样会先免费提供基础算力,为客户提供免费的社区体验、demo部署及测试,并进一步通过付费服务推送轻量级迁移的微调推理服务或深度开发的训练调优平台,提升模型产品性能,通过开源社区吸引开发者、企业客户完成更多部署应用资源的引流变现。
大模型落地将带来新一轮AI产业化扩散
大模型的落地将提速AI工业化生产,并充分释放AI产业潜在市场空间
大模型类似于一个能力全面且突出的“完全体”,不仅通用性强,且能力相比小模型有较大提升。因此,用大模型做应用开发,可以采用“预训练+微调”开发范式,只需要针对具体任务,对大模型进行二次开发、微调甚至只是单纯以领域知识库做辅助,就可以快速赋能应用。相比独立分散的小模型开发,标准化、流程化程度更高,在开发效率和运维成本上都有较大改善,有效促进了AI的工业化生产。同时,模型能力的提升使得更多AI服务可以落地,有效扩展了AI的应用范围,这些共同促进AI供需两侧潜力释放。
MaaS是大模型能力落地输出的新业态
打造大模型商店,为下游提供低门槛、低成本的模型使用与开发支持
MaaS(Model-as-a-Service),模型即服务,是指以云计算为基础,将大模型作为一项服务提供给用户使用的新业态。如今,MaaS模式已成为各家云巨头厂商发展第一战略优先级,把模型作为重要的生产元素,依托于既有IaaS设施与PaaS平台架构,为下游客户提供以大模型为核心的数据处理、特征工程、模型训练、模型调优、推理部署等服务。未来,顺应大模型开源趋势,MaaS服务商将着力打造大模型商店平台,发力大模型生态建设,纳入更多允许商用的开源模型,提升平台的基模类型及能力,并丰富工具链产品服务,通过业务积累、数据回流、模型迭代逐步形成壁垒,在拉高云服务营收天花板的同时进一步塑造厂商的核心竞争力。
AIGC产业化价值与影响
内容生产和人机交互两条主线并驾齐驱,拉开变革大幕
本章节所探讨的AIGC应用,是以大模型为技术主体,同时涵盖其他AIGC技术(如语音合成、策略生成)的应用范围。总体来看,大模型基于其在内容生成、总结、逻辑推理等方面的能力,已在多种AI服务的技术开发环节中展开融合替代。其中,内容生成与理解是大模型的核心能力,AIGC的产业价值主要体现在以此为核心的“变革内容生产方式”与“变革人机交互方式”两方面。大模型对内容理解和内容生成的双向能力使其既能以极低门槛实现多模态内容生成,也可脱离内容生产核心场景泛化为一种人机对话的媒介。未来,全行业将借助大模型能力衍生出的大量AI生产工具,实现内容生产效率的飞跃,并进一步降低数字生态的人机交互门槛。
AIGC应用从To B、To C两端展开
根据AIGC应用的落地场景、技术路径与产品特征,可将AIGC应用划分为内容消费与企业服务两大赛道
AIGC技术的渗透路径将遵循数字产业的基本发展逻辑,按照客户类型、产品形态和商业模式,划分为To C和To B两个领域。
1)To C产品以内容和工具形式触达消费者,各类C端应用可通过直接调用通用大模型API形成各种AI创作工具,并利用其生成内容进行变现,典型场景覆盖文娱、影视传媒行业以及电商零售等。
2)AIGC技术通过大模型能力去部分补充或替代原有场景的算法小模型或是传统软件功能,将其渗透各行各业以提高企业生产办公效率。更高的场景复杂度对参与厂商的技术能力和行业know-how也提出更高要求,艾瑞将其归纳为企业服务的To B赛道。
全球将大力发展算力基础设施建设
算力支撑与模型需求存在gap,AIGC的大算力需求让供需结构进一步承压
自2017年谷歌提出Transformer架构后,人工智能发展逐步迈入预训练大模型时代。2018年6月,OpenAI的GPT模型参数量已经达到1.17亿,模型参数量开始实现亿级基底的飞越发展,平均每3-4个月即呈现翻倍态势,由此带来训练算力需求也“水涨船高”。算力正在成为影响国家综合实力和经济发展的关键性要素。浪潮信息发布的相关报告表明,计算力指数平均每提高1个点,数字经济和GDP将分别增长千分之3.3和千分之1.8。面对算力层的供需结构矛盾,各国积极发展算力层基础设施建设。在计算力指数国家排名中,美国坐拥全球最多超大规模数据中心,以75分位列国家计算力指数排名第一,中国获得66分位列第二,随后为日本、德国、英国等国,算力建设已然成为国家高质量发展的战略级方针。2022年末,在OpenAI的GPT模型涌现能力后,AI产业迅速进入以大模型为技术支撑的AIGC时代,巨量训推算力需求让本就供需不平的算力产业结构进一步承压。目前中国各地正加快新一批数据中心与智算建设,持续优化算力资源,满足未来高速发展的大算力需求。
算力产业模式将在AIGC时代有所演变
智能算力资源或将更多承载于云服务产品,以MaaS模式服务千行百业
过去数据中心以租赁与自建为主,算力需求方基于自身业务量级、财务预算情况、数据隐私要求等情况进行选择租赁或自建。在AIGC时代背景下,数据中心将配置更多AI服务器满足日益剧增的智能算力需求,云厂商更是提出MaaS(Model as a Service)模型即服务的商业模式,将云计算、智能算力、模型能力等资源做高度融合,客户可以直接在云端调用、开发与部署模型,更好适配于客户的个性化需求。未来,更多长尾企业的需求体量将拥抱MaaS商业模式。相较于云端算力发展,端侧大模型虽然发展较缓,仍是各家终端厂商发展的技术焦点,如从苹果招聘信息中可观测到其对“在端侧实现推理和加速大语言模型功能“的人才需求及产品规划。未来,随着大模型轻量级开源版本的发布,大模型有望进行进一步剪裁优化,将推理能力部署在端侧,并带动手机、机器人等端侧芯片发展。
数据中心需对高速巨量运转需求做出应对
大模型时代下,数据中心将进一步优化网络带宽、能源消耗与散热运维等
预训练大模型的训练推理需要巨量数据资源与高性能计算机的全天候高速运转,对数据中心的网络带宽、能源消耗与散热运维等能力提出更高要求。首先,网络是数据中心最为重要的组成部分,随着数据量与计算量的飞涨,数据中心需优化网络带宽,实现数据在节点内与节点间的高吞吐低延迟的传输与连接,并进一步优化计算集群的架构与设计,保证数据中心的高效利用率;其次,能源消耗与碳排放问题是数据中心亟需关注的重点问题。普通服务器的标准功耗一般在750~1200W,而AI模型运行时会产生更多的能耗,以CPU+AI芯片(搭载4卡/8卡)异构服务器为例,系统功耗一般会达到1600W~6500W。根据斯坦福大学发布的《2023年AI指数报告》数据显示,GPT-3模型训练耗费的电力可供一个美国家庭使用数百年,CO₂排放量也相当于一个家庭排放近百年。由此,OpenAI创始人Sam Altma下注核聚变公司Helion Energy,向其投资了3.75亿美元,Helion Energy也已与微软签署购电协议,承诺将2028年之前把世界上第一台商业核聚变发电机接入电网,交付给微软;另一方面,基于大模型算力需求的高能耗运行,其热量释放呈现倍增态势。为了确保服务器能够长期处于适合的工作温度,数据中心将更注重系统设计和散热技术的发展应用。大模型散热需求加速由风冷到液冷的技术升级,进一步提升经济性、节能效果和散热效率等。散热也将更贴近发热源,由机柜级散热、服务器级到芯片级发展。目前,中国大力推进“东数西算” 工程,并发布《新型数据中心发展三年行动计划(2021-2023年)》等政策性文件,引导新型数据中心实现集约化、高密化、智能化建设,在AIGC时代下完成中国算力产业在规模、网络带宽、算力利用率、绿色能源使用率等方面的全方位提升。
AIGC的“达摩克里斯之剑”疑问
技术自身限制+用户使用不当虽会产生风险隐患,但不可因噎废食
2022年底至2023年3月,全球科技界都在为此轮生成式AI热潮狂欢,提振AI产业发展信心的消息层出不穷:美国科技企业或布局追赶或投身下游应用开发与生态集合;中国企业也积极布局类ChatGPT、类Midjourney产品开发,国内巨头纷纷公开大模型研发进展与计划。但在一片欣欣向荣中,渐渐也有反对的声音出现:“ChatGPT取代人类”、“AI Risk下ChatGPT的叛逃”、“LLMs助推欺诈和恐怖主义”、“打开AGI潘多拉魔盒”等讨论甚嚣尘上。3月29日,作为OpenAI曾经最重磅的支持者及联合创始人,世界首富马斯克与多位科研界大牛发表联名声明,基于伦理与设计安全标准考虑,呼吁“所有AI实验室立即暂停训练比GPT-4更强大的AI系统至少6个月”将反对声推向高潮。大模型开发与应用企业也已认识到治理的重要性,例如通过RLAIF(减少人类反馈信息)、去除危险内容生成、监管框架等手段解决模型偏见、滥用等风险问题。OpenAI也于4月6日发布《Our approach to AI safety》,应对安全和伦理质疑。作为突围性产品,ChatGPT的革新价值已被充分印证。虽然其诱发的风险不容忽视,但少数人的“叫停”并不能减缓商业巨头和产业生态的推进步伐。而AIGC技术也并非是“悬顶之剑”,围绕其风险与伦理问题的讨论与解决方案探索,将助推AIGC产业的可持续发展。
AIGC的技术发展:科研与产业两端突围
中短期基于Transformer算法和结构优化仍是主流,长期可能被替代
学术界将通过扩大模型参数量、调整模型结构、局部算法优化等方式,进一步探索大模型的能力天花板,触碰AGI可能性;以各大企业为代表的产业侧,一方面从商业化落地角度追求更小模型参数下的高模型能力维持,以及解决大模型出现的知识幻觉问题,一方面也在积极研发探索新模型架构可能性,呈现“对外模型名称为厂商能力代号,但内含技术架构随时可能改变”的发展特征。产业与科研两侧的需求都已经暴露标准Transformer架构的巨大瓶颈,即“不可能三角”。各大机构与开发团队对Transformer架构的成功改进在快速推进,未来极有可能会出现具备推广价值的新Transformer架构。
AIGC的应用前景:软硬一体化
大模型低参版本的端侧应用,推动手机、机器人等物联网应用的升级进化
大模型在端侧的应用,软硬一体的结合带来广阔的应用场景。端侧的应用首先需要将大模型进行剪枝、稀疏化等处理,降低参数到十亿级规模,同时根据场景进行专属知识的训练和微调以适配专门的终端设备和软件。这对终端设备的功耗、内存、延迟、成本等都提出了新的要求。具体来看,目前在手机拍照、多终端语音助手、机器人具身智能(指从第一人称视角出发,具备理解、推理、并与物理世界互动的智能系统)等方面表现出应用前景,推动物联网应用的升级与进化。2023年8月,华为推出鸿蒙4引入盘古AI大模型,在消费电子领域赋能;小米官宣13亿参数手机大模型;OPPO预计将与阿里云联合打造OPPO大模型基础设施。手机厂商纷纷入局轻量化手机大模型市场,以期为用户带来全方位智能化体验提升,也许不久将来大模型应用将成为用户体验变革换代的“新触点”。
AIGC的社会影响:新一波自动化浪潮
AI成为基础设施,部分基础工作被替代,社会人力结构和分配方式重塑
技术的跃迁、生产效率的提升并不会自然带来社会整体福利水平的提升,相反往往以牺牲部分人的利益为前提,进而引发社会结构、分配方式的重塑。AIGC交互界面的用户友好性、大模型开源及API价格的降低、插件服务带来的应用生态繁荣等,都使得AI技术或将成为像水、电、网络一样的基础设施,渗透并改变千行万业。然而,大模型具有认知、分析、推理能力,不同于自动化浪潮下对蓝领的冲击,AIGC时代受AI影响最大的可能是初级专业人士和技术人员,即部分白领。据Challenger报告显示,2023年5月,美国因AI替代造成的失业人数达3900人,且都发生在科技行业。以及据麦肯锡数据预测,到2045年左右,有50%的工作将被AI替代,比此前的估计加速了10年。与此同时,具有创造力、深度思考等高阶智力的人才,将享受到AIGC带来的效率优势,成为AI的驾驭者,相应的工作需求也会增加。智力要素重要性的提升、附加值的提高,都将推动社会资源和财富向顶尖人才和组织聚集,但社会是一个整体,生产效率的提升并不代表着购买力的提升,被替代的普通职工才是购买力的最大来源,为了维持供需平衡,分配制度需要重塑。如美国总统竞选人杨安泽提出向大企业征收增值税,并向公民发放补贴,以及OpenAI创始人Sam Altman提出的世界币均等分配等,都通过反思并调整现有的分配方式,以驱动社会向更美好的方向演进。
AIGC的监管展望:宽松鼓励与整顿规范
鼓励AIGC研究,放宽内容容错率,强调AI生成标识,推动公开数据建设
自AIGC逐渐应用以来,引发了知识幻觉、数据安全、个人隐私、道德伦理等诸多问题和讨论,新生的行业亟需监管措施的跟进和健康发展引导。2023年7月,网信办等七个部门正式发布了《生成式人工智能服务管理暂行办法》(以下简称《办法》),距离征求意见稿发布仅隔三个月,且监管要求更为宽松,反复强调了鼓励发展的态度。具体来看,《办法》主要规范公共服务环节,不包含有关专业机构的研发和应用环节,鼓励企业在自研自用范围加强技术攻关;其次,《办法》不强求生成内容的真实、准确性,放宽了容错率,对前期探索的企业带来一定利好,但同时也提高了用户辨别的时间和成本。同时,《办法》要求提供者对AI生成内容进行显著标识,有望从根本上杜绝AI生成内容难以辨别的问题,但也可能影响用户对内容的价值判断,对企业带来负面影响。最后,国家以立法的形式打造数据和算力协同共享的平台,最大化促进资源利用,有利于为中小型企业减负,降低研发成本。《办法》发布后,即引发了苹果应用商店对ChatGPT、讯飞星火等AIGC相关App的下架整改行动,行业整顿步伐进一步加速。