标题摘要内容
当前的位置:
详情
从小模型到大模型,专用智能走向通用智能有哪些技术路线?
来源: | 作者:深圳市人工智能产业协会 | 发布时间: 2023-11-23 | 862 次浏览 | 分享到:

通用人工智能生态可以分为算力层、数据层、算法层、应用层。算力方面,芯片是算力中的核心,过去几年,大模型参数呈指数级增长,模型的复杂程度越来越高,对算力的需求也越来越大,大模型的训练,不光需要大量算力,也同时需要海量的大数据。所以,整个通用人工智能的生态,以算法层的模型为核心,拉动上游算力和数据,驱动下游应用和场景变革。通用人工智能的时代,将产生比传统PC时代、互联网时代、移动互联网时代更加伟大的公司。


从技术的维度来看,大模型正在从单一模态走向多模态,GPT-4已经实现了多模态。和单一模态不同,多模态大模型可以接受多种类型数据例如图像、文本、音频等输入,来进行训练和预测。多模态未来发展前景广阔,例如,可以和机器人结合,为机器人注入灵魂,成为机器人的大脑,进一步推动通用人工智能的下一个浪潮——具身智能的技术突破。


从大模型分类上看,可以分为通用大模型和垂直行业大模型。通用大模型在商业模式上,目前已初步探索出对外应用程序编程接口(API)、大模型订阅服务MaaS(Model-as-a-Service)、以及生态伙伴产品集成等多商业模式。从时间进程上看,自从ChatGPT面世以来,短短数月时间,大模型已经从“通用”走向了“垂直”阶段,越来越多企业看到在教育、金融、医疗等垂直行业创新的机会,垂直细分领域的大模型正在大量涌现。可以说,通用大模型就像百科全书,上通天文下知地理;垂直行业大模型就像专家,具备行家里手专业深度。通过与各类场景的结合,通用人工智能技术将走向各个行业的田间地头,通用人工智能技术飞入寻常百姓家,通用人工智能技术走向平民化、普惠化。


从全球产业周期发展的角度来看,当前通用人工智能技术正迎来产业应用落地的加速期。技术拐点突破、大模型训练成本下降、用户需求开始爆发等要素,不断推动通用人工智能技术加速渗透。全球产业资本和金融资本纷纷涌入,科技巨头如微软、谷歌、百度等不断加码布局。

02
两条路线

在小模型向大模型迈进中,第一条路线是延续现有的大模型发展策略。大模型,如GPT和BERT,已经证明了自己在处理语言理解任务方面的强大能力。通过进一步扩大这些模型的规模和算力,我们可以拓宽它们的能力边界,使其更加接近通用智能。这不仅涉及到算力的增强,还包括芯片、网络连接、框架、数据处理、模型评估和部署等多个层面的创新。

然而,仅仅扩大规模并不是万能的。大模型在处理某些任务时仍面临效率低下、可信度不足和安全性问题。为了解决这些问题,我们需要探索第二条路线:研究新型技术路径,包括强化学习、知识计算、符号推理和类脑计算等。这些技术能够提高AI系统的可解释性和安全性,为AI的发展提供新的动力。
03
通用人工智能对中国的战略意义巨大应抓住其发展机遇

从变革的维度看,通用人工智能技术的推广和应用,将带来产业升级、消费升级、社会效益提升,开启产业和经济变革新浪潮。和历史上每一次科技革命一样,通用人工智能技术将渗透各行各业,像互联网一样成为整个社会的基础设施。抓好这一个机遇,将有利于我国在AI 2.0时代实现跨越发展,为整个社会带来更多福祉,智能经济的发展,有利于增强国家的综合实力,从而帮助我国在未来的国际竞争中脱颖而出。

从国家安全的角度来看,人工智能是国际竞争的焦点之一,超大规模的预训练模型作为一种战略资源,具有重要的卡位作用。这一轮新科技变革才刚刚开始,中国从顶层重视到产学研的协同、人才培养和机制建设多管齐下,加之中国有着庞大的市场和各个垂直领域海量的数据资源,假以时日大模型的底层技术有望赶上,而在应用层面有望实现赶超。


人工智能是多学科交叉融合的产物,今天基于Transformer发展出来的GPT路线,并不能代表通用人工智能技术的终点。随着类脑科技的发展,在未来可能有更多更先进的算法和技术路线的出现,将进一步推动通用人工智能向更高阶段迈进。量子科学和量子计算机的发展,未来有可能助力通用人工智能技术实现进一步的突破。同时,通用人工智能的发展,也将助力Web 3.0生态和元宇宙建设。对于这些未来可能产生的新突破、新事物,我们满怀期待。