标题摘要内容
当前的位置:
详情
浅谈AIGC在通信设计领域的应用
来源: | 作者:深圳市人工智能产业协会 | 发布时间: 2023-08-16 | 690 次浏览 | 分享到:
自2022年11月ChatGPT发布以来,国内外人工智能生成内容(Artificial Intelligence Generated Content,AIGC)模型如雨后春笋般层出不穷,在数据、算力和模型的共同推动下,全球AIGC产业正在迅速发展,相关场景应用也在不断丰富,人工智能尤其是自然语言处理(Natural Language Processing,NLP)领域迎来了一次重大的技术革命。

作为一种AIGC模型,ChatGPT可通过持续训练海量数据不断提升上下文语义理解与交互能力,在众多应用场景中展现出无限潜力。由此引发的研究和应用热潮也推动了整个人工智能行业向前发展。当前,各行各业都在关注所在行业是否存在被ChatGPT或AIGC取代的可能性,或者能否将ChatGPT或AIGC等相关技术引入到自身行业中,实现生产方式或方法等方面的革新。本文在介绍AIGC相关技术及应用的基础上,探讨AIGC在通信设计行业的应用场景。




1



AIGC技术介绍

1.1什么是AIGC

AIGC是一种新的内容创建方法,它补充了以门户网站和专业搜索为代表的专业生成内容(Professional Generated Content,PGC)和以微博、微信和抖音等用户生成内容(User Generated Content,UGC)等传统内容创建方法。
AIGC的发展大致可以分为3个阶段:第1阶段始于上世纪50年代,当时研究者们开始探索使用计算机来模拟人类创造性思维的可能性。上世纪80年代到本世纪初是AIGC技术的沉淀积累阶段,这段时间内计算机硬件和软件水平不断提升,基于特定规则的生成方式逐渐成为主流,但在此期间算法成为了制约AIGC发展的主要瓶颈。自2010年以来,随着深度学习(Deep Learning,DL)技术的兴起,尤其是生成对抗网络(Generative Adversarial Network,GAN)的提出,AIGC进入快速发展阶段。2022年,OpenAI发布了一款全新的AI对话模型ChatGPT,它通过交互的方式和人类对话,理解人类语言并生成文本和图像等,在2个月内月活跃用户突破1亿,在2023年1月,每天大约有1 300万独立访客使用ChatGPT。随着众多类ChatGPT产品的发布和不断完善,AIGC已经显示出巨大的应用潜力和商业价值,并引起了包括企业家、投资者、学者和公众在内的各个领域的广泛关注。至此AIGC进入了一个全新的、高速发展的阶段,据统计,截止到2023年5月,国内外有数十个类ChatGPT模型已经推出或马上问世。


1.2 AIGC相关实现技术

AIGC的发展是建立在现代AI技术的发展之上的,AIGC中使用的基础模型和技术大多是AI领域的经典模型和先进技术,如应用于图像生成和语音合成的深度变自分编码(Variational AutoEncoder,VAE)和生成对抗神经网络(Generative Adversarial Network,GAN),应用于图像生成的扩散模型(Diffusion Model,DM),经典语言模型Transformer和视觉模型(Vision Transformer,ViT)以及强化学习(Reinforcement Learning,RL)等。ChatGPT全称为Chat Generative Pre-trained Transformer,其中就包括AIGC中常用的预训练语言模型(Pre-Trained Language Models,PLMs)和Transformer经典模型。本节重点介绍AIGC领域中常用的Transformer模型、PLMs和RL技术。
1.2.1  Transformer
2017年,Transformer作为一种基于自注意力机制的编码器(Encoder)-解码器(Decoder)模型被提出,与传统的序列到序列模型不同的是,Transformer使用自注意力机制来实现对所有位置上下文信息的建模,从而避免了信息丢失的问题。Transformer 还是一种端到端可训练的编码器-解码器模型,编码器将输入序列进行嵌入并产生一系列与上下文相关的向量,而解码器则利用这些向量来生成目标输出,这种结构在序列生成任务中具有很好的表现。
基于Transformer诞生的两个最著名的模型是OpenAI发布的GPT系列(ChatGPT即属于此系列)和Google发布的BERT。GPT系列模型使用Transformer的Decoder机制,侧重于基于输入内容推导下文的方式工作,而BERT使用Transformer的Encoder机制,侧重于通过记忆上下文的方式进行推导。
除了GPT系列和BERT,Transformer以其高效、灵活且可扩展的特点被广泛运用于众多AIGC模型中,Google发布的LaMDA和Meta发布的LLaMA等都是建立在Transformer基础上的。
1.2.2  Pre-Trained Language Models
PLMs是指利用无监督学习在大量文本数据上进行训练得到的语言模型。AIGC模型的训练往往需要大规模的文本数据,相比于构建成本极为昂贵的有标注数据集,大规模的无标注数据集则相对易于构建,而在大规模无标注数据集上训练得到的PLMs可以使许多自然语言处理任务获得显著的性能提升。
随着算力的快速发展,以Transformer为代表的深度模型的不断涌现以及训练技巧的逐步提升,PLMs也由最初的词向量技术发展到聚焦于学习上下文相关的词嵌入技术,从而可直接在下游任务中使用,表示文本的上下文特征。常见的使用PLMs的AIGC模型除了ChatGPT外还有Stanford发布的Alpaca、Databricks发布的Dolly 2.0等。
1.2.3  Reinforcement Learning
RL技术是机器学习的一个分支,它主要研究如何基于环境而改变策略,以取得最大化的预期累积奖励。在强化学习中,模型从环境中感知状态,并根据当前状态选择一个策略来获得奖励或惩罚。与监督和无监督学习不同,强化学习需要考虑到长远利益及延迟回报。因此,在进行决策时需要同时考虑即时收益和未来可能获得的收益。这使得 RL 在许多复杂任务中表现出色。
尽管经过大规模数据的训练,但AIGC并不总是能够产生与人类预期相一致的输出。为了更好地使AIGC输出的结果与人类的偏好保持一致,基于人类反馈的强化学习(Reinforcement Learning From Human Feedback,RLHF)已被应用于各种AIGC模型中。RLHF 通过将人类反馈作为奖励信号,并使用其指导模型的策略选择,使得模型在人类的一次次反馈中不断缩小与人类偏好的差距,进而实现提升模型精度的目的。

1.3 AIGC基本应用场景

当前AIGC的基本应用主要集中在文本、图片、音频、视频以及多模态的生成,在摄影、游戏和传媒等领域的应用往往是建立在这些基本的应用之上,再进行定制化的开发或训练而成的。
1.3.1  文本生成
a) 语言模型。通过分析大量文本数据来预测下一个可能出现的词汇,GPT系列模型就是典型的应用。
b)文本摘要。利用AI技术对海量文本进行分析,提取出关键词、句和段落,形成简洁的摘要信息,这种技术可用于新闻报道和论文阅读等场景。
c)对话系统。根据用户输入实时回答相关问题,并不断优化回答质量,常见的有对话机器人等。
d)内容创作助手。帮助用户快速创建高质量文章或长篇报告,或者针对用户输入的稿件,给出修改建议和指导意见。
1.3.2 图片生成
a)图像风格迁移。将一张图片的视觉风格应用到另一张图片中,从而创造出具有不同艺术感的全新作品,可广泛应用于图像修复、电影后期制作以及游戏开发等领域。
b)图像超分辨率重建。提升低分辨率图像质量,将模糊或失真的图片变得更加清晰,可用于老旧照片、视频修复以及视频会议等场景。
c)人脸合成。可根据用户的需求快速生成伪造人脸,常被应用在虚拟角色设计、医学美容和安防监控等场景。
1.3.3音频生成
音频生成的应用在日常生活中已经比较常见,当前音频生成主要应用于语音合成和音乐创作等领域。
a)语音合成。主要包括根据文本生成特定语音和语音克隆两个领域,其中文本生成特定语音的技术已经比较成熟,但在情感表现上仍有一定的欠缺;语音克隆可应用于动漫、电影以及虚拟人行业。
b)音乐创作。以语言模型为中介,对音乐数据进行双向转化,目前已经支持基于旋律、图片、文字描述、音乐类型等生成特定乐曲。
1.3.4视频生成
a)视频属性编辑。主要涉及视频画质修复、删除画面中特定主体、自动跟踪主题剪辑、生成视频特效、自动添加特定内容、视频自动美颜等。
b)视频自动剪辑。基于视频中多模态信息的特征融合进行学习,按照氛围、情绪等高级语义限定,对满足条件的片段进行检测并合成。
c)视频部分生成。通过逐帧复刻,实现人脸替换、人脸再现、人脸合成甚至全身合成、虚拟环境合成等功能。


2



 AIGC在通信设计领域的应用

ChatGPT的横空出世使得很多公司和个人投入到AIGC的研究当中,但有分析指出,未来AIGC的赛道很有可能由通用AIGC转向领域AIGC,当下各行业需要关注的应该是如何在通用模型的基础上,基于自身的业务和数据打造出适合自身行业的领域AIGC模型,从而获得差异化竞争力。
通信领域拥有相对独立、庞大且复杂的知识体系,有大量沉默的行业数据,这些数据大多是没有被公开的,因此由互联网公开数据训练得到的通用AIGC模型无法体现或利用这些数据的价值,只有通过领域大模型才能激活并发挥出这些数据的真实价值,进而满足通信这一垂直领域的需求。
由于当前AIGC技术还未完全成熟,AIGC模型的精度也相对有限,因此本章只介绍对AIGC生成内容准确性相对不敏感的业务应用场景,以此达到革新工作方式和提升工作效率的目的。
基于通信设计这一专业领域,首先介绍构建通信专业领域ChatGPT的思路,再通过通信设计和网络支撑两大业务场景介绍AIGC在该领域的应用前景。

2.1 通信行业的ChatGPT

利用通信行业数据训练得到适合通信行业的ChatGPT,从而实现通信领域知识和问题等相关内容的智能交互问答。模型的训练大致可分为2个阶段,一是数据的收集和整理,二是模型的选择、训练、测试与优化等。
模型训练的数据一般可来自于内部、合作软硬件厂商以及公共数据集,主要包括通信行业的技术文档、报告、白皮书、用户手册、产品说明等行业属性数据,行业标准和法规文件数据,设备运行维护、基站巡检等运维日志数据,监控数据以及研发代码数据等。
模型的构建一般可采取“开源大模型+自研小模型”的策略,一方面因为开源大模型会越来越多,另一方面是因为完全从零开始的AIGC模型训练往往需要耗费大量软硬件资源,且开发周期可能会很长。
主要模型训练思路如下:
a)基础模型选择。可选择当前业界已经公开或开源的生成大模型。
b)预训练。使用通信行业数据对基础模型进行预训练,使得模型能够较充分地学习到通信行业的相关知识。
c)模型的调优。在模型预训练之后,可以采用引入RL的机制来实现模型的调优。
训练好的通信行业ChatGPT在智能客服、问题答疑、专业释义以及图片和语音多模态专业生成方面具有很好的应用场景。

2.2 智能通信设计

通信设计中的规划、可研、勘察、设计和绘图等众多工作往往需要设计师结合设计规范、项目经验以及具体项目需求等因素去完成,考虑到同类设计项目内在的相似性和AIGC模型在内容生成方面的高效性,结合部分通信设计规划工作说明AIGC在通信设计领域的应用。

2.2.1 5G基站智能设计规划

当前5G正处于高速发展阶段,5G基站的规划与建设工作就显得尤为重要。3G和4G网络的共存、网络天线需求量大、基站处理增益加大、基站能耗急剧增加、网络频率提升、多种无线传输技术并存、信号覆盖强度、站址所处地理环境和运营商共建共享等都是影响5G基站设计规划的因素,如何基于全网视角,综合考虑多种因素、合理利用资源就成了非常复杂而又急需解决的问题。
以AIGC技术赋能5G基站的设计规划,AIGC模型从全网基站建设数据、各种约束数据、硬件设备数据和现有实时监控数据等海量数据中学习基站设计规划问题的目标、约束条件等,生成基站规划设计方案,供设计师在规划设计时参考,可大大节约制定规划设计方案的时间。

2.2.2 意图驱动网络设计

近年来,在通信领域中兴起了网络自治的理念,其核心是:网络是高度自治和智能的,可以自规划、自部署、自优化、自演进。在自治网络中,用户只需要把自己的意图告诉网络,网络会自主制定最优方案并自动执行任务,最后用户对网络执行结果进行验收。拥有这样能力的网络就叫做基于意图的网络(Intent Based Networking,IBN)。
IBN的理念与AIGC是深度契合的,IBN根据用户意图自动生成执行方案并自动执行任务,而AIGC可以从自治网络数据中学习到网络的全部信息,以此针对用户的意图产生最优的决策。IBN一般由意图翻译和验证、自动化实施、网络状态感知以及保障和自动化修复等4部分组成。其中意图的翻译和验证与实施方案或者修复方案的生成均可以由AIGC来完成,加上网络实时数据的交互,确保生成方案的合理性。

2.3 智能网络支撑

2.3.1 智能网络维护

网络维护包括对网络状态、业务使用和资源调度等进行管理、监控和分析,实现针对故障告警和性能劣化等现象的自动化资源调度与调整,以实现网路和业务的恢复。当前网络维护中对于故障诊断的策略一般是对网络设备和网络状况进行实时监控,设置告警规则,当发生告警时进行排查和修复,但是实际中依然存在告警规则无法全覆盖、故障排查不及时和故障修复时间过长等问题。
基于AIGC技术的智能实时告警分析就是借助大数据关联规则和AIGC技术根据系统中网络拓扑结构和业务上下游关系,综合考虑各项数据指标,如流量、光功率等KPI指标,告警数据,操作日志以及故障处理经验文字记录等,对实际网络结构及实时数据实时建模分析。
使用AIGC模型实现对网络故障异常数据的检测,其主要的优势在于将对网络故障和风险的分析与处理从人工转变为模型自动化、从被动的接收告警和故障信息转变为提前主动预测可能的故障或风险的产生,以此达到网络运维提质增效的目的。

2.3.2 智能决策支持

通信设计涉及到许多复杂的决策,需要考虑多个因素和约束条件,不同的约束条件间又有可能存在一定的互斥性,再加上影响因素的取舍与量化的不同等都有可能影响最终决策的确定,借助于专家系统、数学建模和优化分析等传统的决策确定方法往往在时效性、动态性和最优化等方面存在一定的不足,而AIGC模型可以通过对海量数据的学习和分析,自动抽取隐含的关联特征和规则,建立专业的算法模型,提供准确的决策支持。它可以在网络拓扑优化、最佳传输方案选择和提升网络资源利用率等方面为工程师提供最优化策略支持,从而实现降低成本、提高系统性能和可靠性的目的。下面以5G基站网络能耗控制方案生成和全光网资源优化配置方案生成为例说明AIGC在网络支撑决策方案生成方面的应用。
a)5G基站网络能耗控制方案生成。相关研究表明,当前网络能耗成本与收入已呈剪刀差趋势,且该趋势将在未来有加速的迹象。一方面当前叠加建网的策略使得基站耗能持续提升,另一方面站点能耗基本不随业务的变化而变化,闲时低流量时间段的站点能耗依然居高不下。
基于AIGC模型,综合考虑同区域或全网参数数据、KPI与用户感知数据等因素,并基于业务历史数据对未来一段时间的负荷数据进行预测,根据现网实时数据和预测数据生成网络层级的多网协同和动态调优的方案,实现不同场景下的不同方案配置,提升处理效率,合理控制网络能耗。
b)全光网资源优化配置方案生成。全光网中,源宿节点间可以通过建立光通道实现光域内的数据传输,一条光通道可以跨越多条链路以及多个节点,如果节点不具备波长变换能力,则光通道必须满足波长一致性的约束。如果节点具备波长变换能力,则一条光通道在不同链路上可以使用不同的波长。合理地放置波长变换器,可以提升光网络的资源利用率,并在一定程度上降低阻塞损失。但是波长变换器的成本一直居高不下,配置波长变换器过多必定导致成本的急剧上升,因此波长变换器的配置一直是全光网资源规划配置的一个重要问题。
当前采取的策略一般是在保证业务传输的前提下,以波长变换器配置数量最少为目标,辅以满足抗断纤条件等约束,使用数学规划或智能算法等求解可再生中继的配置方案。考虑到计算的时效性、规划方案的动态性以及人为定义规则的偏好性等因素,可使用大量的波长变换器配置方案训练AIGC模型,使其学习到波长变换器配置的内在关联性,进而可以根据不同的网络拓扑、资源占用和业务等输入,生成符合预期的波长变换器资源配置方案。

2.3.3 模拟仿真

基于AIGC的模拟仿真是指利用AI技术,根据给定的输入(指令语言、图片和模拟参数等),自动生成符合实际仿真需求的模型。在通信领域,机房、基站等3D可视化仿真以及传输电路、网元、端口和板卡等网络资源的模拟仿真可以实现现网资源的数字化呈现,为网络分析和故障排查等支撑工作提质增效,促进了数字化仿真、数字化运营和智能化优化等工作的进一步发展。下面以ROADM光网络仿真为例来说明利用AIGC进行模拟仿真的业务场景。
光网络的仿真一方面需要根据业务、场景和层次的不同,实现一干、二干和本地传输中的传输电路、网元、端口和板卡等资源的可视化,并结合GIS信息,实现高精度的全网资源位置可视化,另一方面需要根据业务路由选择、波道占用等资源利用情况实现全网资源和性能数据等指标的全面分析。
AIGC模型可以根据输入的网络拓扑结构以及各站点和链路资源的实际使用情况对ROADM光网络进行模拟仿真,实现网络、系统、链路和网元等层级的数字化建模。该AIGC仿真模型可以根据链路跳数最少、距离最短、OSNR和波道一致性等自定义输入要求,自动实现业务路由规划和波道编排等任务;并能够根据全网资源占用情况,实时计算生成网络资源最优化配置方案。




3



机遇与挑战

ChatGPT的发布是AIGC发展过程中具有里程碑式的事件之一,也开启了AI领域的新篇章,同时也为众多行业发展和变革提供了巨大的技术平台。随着AIGC以及相关技术的不断进步,通信设计行业可以以此为契机,一方面借助相关技术不断完善和优化在网络规建维优营等方面的核心能力,另一方面基于AIGC技术以新思路和新视角拓宽通信设计行业的发展道路。

虽然AIGC的发展已经受到各行业人员的关注与重视,但是当下AIGC在各行业的真正实现和落地还有一定的距离,一方面是各行业的数据、算力和模型等方面仍有不小的欠缺,另一方面有关数据安全、生成式模型在法律方面的约束以及相关版权问题仍存在相当的不确定性。因此AIGC在各专业领域的发展应是一条理论与实际相联系、创新与安全并重的螺旋上升式道路。