标题摘要内容
当前的位置:
详情
国内对话类大模型高度依赖实时网络搜索,底层数据成发展“命门”
来源: | 作者:AI 生 | 发布时间: 2025-02-07 | 185 次浏览 | 分享到:
据深圳市人工智能产业研究部认为,底层数据集匮乏的现状,正深刻影响着国内对话类大语言模型的发展。当前,国内主流对话类通用预训练大语言模型,在信息获取上高度依赖实时网络搜索。由于同一信息源会在不同网络节点重复出现,模型难以甄别出最优质、最准确的内容,这就导致模型输出结果与实际情况存在较大偏差,实际应用效果大打折扣,更多只能起到简单的辅助作用。


国内通用大模型企业若想实现突破式发展,急需政府提供底层数据支持,并整合各行业的底层数据资源,以此为基础来训练大模型。丰富且高质量的底层数据,是提升模型性能的关键所在,能够帮助模型学习到更全面、更准确的知识,从而在对话交互中给出更具价值、更贴近实际需求的回答,提升国内大模型在全球人工智能领域的竞争力。