DeepSeek 掀起的 AI 风云：营销迷雾、美国搅局与中国破局之路

标题摘要内容

当前的位置：

首页 >> DeepSeek 掀起的 AI 风云：营销迷雾、美国搅局与中国破局之路

详情

来源: | 作者:AI 生 | 发布时间: 2025-02-05 | 1300 次浏览 | 分享到:

DeepSeek在全球范围内引发轰动，短短一个月便吸引了中国总理、美国前总统特朗普、欧洲多国政府首脑以及美国知名企业的关注，成为近年来国内极具影响力的营销事件。深圳市人工智能产业研究部指出，DeepSeek之所以产生如此广泛的影响，原因是多方面的，而搭建强大的数据层，为AI大模型提供数据生产力支撑，是中国未来发展的核心要点。

DeepSeek的火爆很大程度上基于营销

DeepSeek成为热点主要基于两个因素。其一，2024年12月，DeepSeek-V3首个版本上线并同步开源，宣称训练成本仅557.6万美元，整个训练只需280万个GPU小时。这一信息经营销传播，被解读为模型整体花费仅5-600万美元。但专业人士分析，DeepSeek仅在GPU及硬件上的投资就远超5亿美元，其拥有的GPU数量超过国内大模型“六小龙”中任何一家，预计AI服务器整体投资在15亿美元以上。甚至有消息称DeepSeek仅用华为的GPU进行训练，绕开了英伟达。OpenAI CEO山姆・奥特曼曾表示，GPT-4o的训练成本约1亿美元，未来训练大模型的成本将超10亿美元。DeepSeek的技术创新体现在独特的技术架构与高效的算法优化上。通过采用专家混合模型（MoE）实现精准分工与动态响应，引入多头潜在注意力机制（MLA）增强对复杂关系的洞察力，应用多Token预测技术提升自然语言处理的连贯性和效率，DeepSeek在图像识别、自然语言处理及智能推荐系统等领域实现了显著的性能提升。该大模型的最大优势在于，在模型能力较好的前提下开源并让客户低成本使用，这在很大程度上触动了美国科技企业的利益。

其二，大量新闻报道称DeepSeek的性能达到甚至超过OpenAI的o1模型，这种说法较为片面。DeepSeek发布的主要是推理模型，而ChatGPT是多模态大模型，涵盖推理、语言、图片、视频等多方面，且涉及的产业范畴、语言类别、应用领域等广度远大于DeepSeek。图片尤其是视频模型的难度不亚于文本类，有理由认为OpenAI的ChatGPT模型在综合图片和视频的推理能力上远超过DeepSeek模型。从模型的广度和深度来看，DeepSeek或许还未达到OpenAI的十分之一，甚至更低。不能仅因达到或超过OpenAI的o1模型，就认为超越了OpenAI。据深圳市人工智能产业协会统计，截至2024年，OpenAI总融资规模超240亿美元，新一阶段拟融资规模约400亿美元。在DeepSeek投资较少、高端GPU受限、训练数据不足OpenAI百分之一甚至千分之一的情况下，很难期望其大模型能力超越OpenAI。由于对DeepSeek模型成本的误解和能力的误判，国内AI产业、政府、高校和民间，除了非大模型企业，在很大程度上陷入了集体超越美国的狂欢。

其次，铺天盖地的赞美DeepSeek的文章明显存在营销迹象。这些文章大多极力贬低美国大模型产业界，标题多采用诸如“吊打美国”“美国哭了”“性能碾压OpenAI”“打爆美国科技圈”“单挑美国AI霸权”“DeepSeek登顶第一”“中国AI暴杀美国”“硅谷巨头集体失眠”“它摧毁了美国所有战略目标”“中国deepseek‘暴打’ChatGPT”等夸张言论。多数文章简单分析对比DeepSeek大模型能力后，便通过使用成本、开源、技术突破点、国际测试成绩、美国各龙头企业反应、特朗普言论、美国龙头企业股价波动、个别使用案例等，宣扬中国已超越美国。这些新闻标题与科技界严谨的惯例不符。实际上，中国本土的豆包、文心一言以及大模型“六小龙”并未因DeepSeek而慌乱，难道DeepSeek只针对美国？

最后，大模型专业人士集体失声。在大量关于DeepSeek的新闻报道期间，几乎未见华为、腾讯、百度、大模型“六小龙”相关负责人的真实DeepSeek事件分析，理性文章匮乏，少量相对中性的分析还遭到网友攻击。对于AI产业而言，大模型国内测试影响力有待加强，中国政府和产业界需要科学严谨的言论作为参考，这才有利于中国AI产业的健康发展。据深圳市人工智能产业协会研究部使用实践，目前DeepSeek在聊天机器人领域和豆包、文心一言等还有不小的差距。

美国推波助澜DeepSeek事件

对DeepSeek的“捧杀”最初源于美国。美国有意推动并夸大DeepSeek事件，旨在打压和阻碍中国AI产业发展。美国产业界和政客向来有通过抬高中国AI能力，促使政府出台打压中国AI产业政策的惯例。此前，他们曾以中国AI专利、AI成就、中国留学生和学者等为由，指责中国窃取美国AI技术、侵犯知识产权，甚至将其视为间谍。

此次，美国极力夸大DeepSeek的能力，并指控其侵犯美国企业的知识产权和利益。微软和OpenAI指责DeepSeek“偷盗”ChatGPT数据，借此快速推动美国政府在AI领域进一步限制GPU出口、限制美国大模型API调用、限制双方AI人才流动、限制美国使用中国大模型、限制中国使用美国大模型，还联合盟友限制中国大模型使用。

以DeepSeek事件为借口，美国国会已立法全面禁止来自中国的先进AI模型。美国国防部、国会、海军、NASA以及德州已相继禁止在政府官方设备上使用DeepSeek。美国推动新法案《2025年美国人工智能能力与中国脱钩法案》，核心是禁止美国人在中国境内推进AI能力，实现中美在AI领域彻底脱钩。美国国会还提出新法案，将下载DeepSeek定为犯罪，最高可判处20年监禁。DeepSeek的线上服务近期遭受大规模恶意攻击，攻击IP地址均来自美国。受美国影响，意大利、荷兰、爱尔兰和英国等国家也相继宣布禁用DeepSeek。

DeepSeek对产业推动的正向影响

面对美国 AI 竞争的压力，尤其是英伟达 GPU 禁令带来的阴霾，DeepSeek 的出现如同一束强光，有效驱散了笼罩在国内 AI 产业发展道路上的部分阴影。它不仅让人们看到了国内 AI 发展的潜力与希望，更极大地增强了民族自豪感，让许多人坚信在 AI 领域，中国有能力突破外部限制，走出一条属于自己的创新发展之路。这种积极的情绪与信心，进一步激发了我国各级政府支持发展 AI 大模型及 AI 产业的意愿，为产业发展营造了更为有利的政策环境和资源支持。

DeepSeek 的影响力还体现在对 AI 大模型普及应用的推动上。它成功地将 AI 大模型的概念从专业领域带到了全国普通民众的视野中，吸引了更多人关注 AI 大模型，并鼓励他们开始尝试使用。这种普及不仅提升了大众对 AI 技术的认知和接受度，也为 AI 产业培育了更广阔的市场空间和用户基础，为 AI 技术的持续创新和应用拓展奠定了坚实的群众基础。

近期，国内外知名大模型平台，如华为、腾讯、微软、英伟达、亚马逊等公司纷纷与DeepSeek展开合作，推出基于DeepSeek的相关云平台产品服务，便于开发者接入调用，充分证明了其与国内外开源和闭源大模型具有同样甚至更好的应用价值。推理能力是垂直领域AI Agent（AI代理/AI智能体）的核心能力，赋予AI Agent更接近人类的思维能力，DeepSeek推理大模型如能够低成本普及，将有助于2025年我国垂直领域AI Agent的快速发展。

DeepSeek的开源，推动了全球大模型的应用发展，让全球更多国家和企业认知到中国在AI领域的努力和取得的成就，在一定程度上推动了全球AI大模型开发和应用的发展。

中国急需打造强大的国家级数据基础设施

随着美国大模型对中国的封锁程度不断加深，未来中国企业调用美国顶尖大模型的难度将越来越大，通过“蒸馏”技术从美国AI大模型中学习的难度也将直线上升。

深圳市人工智能产业研究部指出，当前我国大模型产业发展面临的核心问题并非算力瓶颈或模型框架能力短板，而是可用于大模型训练的各类数据严重短缺。这一数据匮乏现状，正成为阻碍中国大模型产业前行的关键因素。

DeepSeek 事件的发生，彰显出我国在大模型开发方面具备一定实力。然而，认为 DeepSeek 使我国在 AI 大模型领域拉近与美国的差距，这种观点并不现实。据深圳市人工智能产业研究部分析，国内腾讯、百度、华为以及大模型六小龙等企业的 AI 大模型实力，大多超越 DeepSeek。事实上，我国与美国在大模型领域的差距仍在持续扩大。究其根源，在于缺乏足够的数据供 AI 大模型企业进行训练，这一差距无法单纯依靠改善模型框架来弥补。

数据对于大模型的重要性不言而喻，它如同燃料之于引擎，是大模型实现优化与升级的关键要素。鉴于此，我国急需构建全国统筹的数据基础设施，对各行业、各类型的数据进行相对统一的收集、存储、交易与使用。其中，收集和存储环节是整个数据基础设施建设的基石，至关重要。

反观美国，已规划 5000 亿美元投资建设 “Stargate”（星际之门）人工智能基础设施项目。倘若我国不能及时建设自身的数据 AI 基础设施，与美国在大模型领域乃至整个 AI 产业的差距将会越拉越大。因此，建立我国国家级的“星际共同体”项目，即国家级数据基础设施建设项目刻不容缓，已成为我国大模型产业发展的当务之急，对于提升我国在全球 AI 领域的竞争力具有重要意义。

DeepSeek发布大模型回顾：

2025年1月20日，DeepSeek推出DeepSeek-R1“推理”模型，其水平与OpenAI于2024年年底发布的专注于“推理”的大语言模型GPT-o1相近。1月28日，DeepSeek又推出anus-Pro-7B模型，具备文本提示生成图像的能力，文生图性能与OpenAI的DALL-E3以及StabilityA I的Stable Diffusion相当。

上一篇：数据标准化与交易，为AI大模型亟待突破的两大关卡

下一篇： 2025，我国亟需在大模型安全防范上全力冲刺

标准信息