AI下半场“哨响”：腾讯云如何打通“任督二脉”？

出品 | 创业最前线

作者 | 文斐

编辑 | 闪电

美编 | 倩倩

审核 | 颂文

AI技术狂飙数年后，“算力崇拜”的叙事正悄然让位，更深层次的关于“记忆与上下文”的话题，成为新焦点。

当模型规模遭遇瓶颈，当智能体（Agent）开始7×24小时不间断工作，企业该如何构建支撑其长期运行、高效协作的数据基础设施？近日腾讯云举办的2026AI产业应用大会，给出了极具可行性的答案。

大会释放出一个清晰的信号：AI“下半场”已经鸣哨。这意味着拼算力、拼参数的“上半场”开始落幕，而拼数据治理、拼记忆效率、拼场景落地的“下半场”则同步到来。

存储与记忆，这个曾经被低估的角色，正在成为新的战略高地。

1、AI下半场，Agent基础设施的范式转移

6月5日，腾讯云2026AI产业应用大会如期举行。一场关于AI基础设施的讨论，正在刷新人们对人工智能竞赛的认知。

腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生，与腾讯AI首席科学家姚顺雨，罕见同台深度对话，首次系统阐释了腾讯AI的“哲学”与“务实逻辑”。

“AI下半场”的概念由姚顺雨提出并广为人知，这次他在现场给出了更为精准的界定。过去，无论是AlphaGo还是早期的翻译模型，人类面临的核心挑战是“方法论稀缺”。而今天，预训练与大模型的成功，让人类拥有了一个近乎“万能”的底座。

“最大的挑战变了，”姚顺雨强调，“现在已有了能砸很多钉子的锤子，最困难的反而是，去哪里寻找最值得解决、最有影响力的‘好问题’？”这正是他选择加入腾讯的根本原因——这里不缺乏真实的、大规模的应用场景。从微信、QQ到企业服务，腾讯丰富的产品矩阵，为AI提供了肥沃的“上下文”土壤。

汤道生深表认同，他指出腾讯做AI最核心的经验就是“扎根场景”。真实场景里既有用户需求，也有模型迭代最需要的数据。模型的进化，不再仅依赖于实验室里的算法突破，更依赖于在文档协作、代码生成等具体业务流中，产生的海量、真实、带噪的数据反馈。

大会上，覆盖20多个垂直场景的“效率智能体工具集”重磅首发，从个人开箱即用的QClaw、元宝，到企业级的WorkBuddy企业版、智能体开发平台ADP4.0，再到行业首创的“人机双写”腾讯文档……一套多层次、全栈式的AI生产力基础设施，正浮出水面。

这不仅是产品的集中亮相，更是腾讯对“AI如何真正创造价值”这一根本问题的回答。其核心答案，指向三个关键词：真实场景、深度信任、协同设计（Co-Design）。

决定智能体能否真正成为人类得力助手的关键基础设施，即存储。腾讯云的全栈Agent Infra（智能体基础设施）布局，正回答一个问题：如何让AI不仅聪明，而且可靠、高效、长久地为人类服务。答案，或许就藏在每一比特数据的妥善安放与高效调用之中。

“伴随整个算力问题的解决，现在最重要的应该是Context（上下文），所谓的存储跟记忆。”腾讯云存储总经理陈峥接受采访时称。

在陈峥看来，过去人类痴迷于算力，解决的是“Agent能跑多快”的问题；而如今，决定智能体高度的，是它能否“记得住、找得对”。

2、AI马拉松长跑下，腾讯云存储的“三级跳”

从“存得起”到“找得对”，腾讯云存储经历了“范式三级跳”，这一演变映整个行业对数据与AI关系认知的深化。

陈峥在采访中讲述了腾讯云存储的进化史，他称，腾讯云经历了“通用存储时代、AIGC时代、Agent Bucket时代”三个清晰的阶段。其中第三阶段即“Agent Bucket时代”，在陈峥眼中，是最具革命性的阶段。

通用存储时代，核心任务是解决非结构化数据的“存得起”和可靠性问题。彼时客户最关心的是，它的数据放这里会不会丢？能不能管起来？这一阶段，存储是沉默的后勤部门，只要不犯错，没人会提起它。

AIGC时代，焦点迅速转向“读得快”。大模型训练需要海量数据持续“投喂”给GPU，任何I/O（输入/输出）延迟，都意味着算力的空转和资金的浪费。腾讯云通过分布式缓存、并行文件系统等技术，让数据高效流向计算单元，确保昂贵的GPU集群不再“等数据”。这一阶段，存储开始被看见，因为它的性能直接决定了训练效率。

Agent Bucket时代，正是陈峥眼中最具革命性的阶段。Agent不是传统的应用，它是一种新型的计算主体。智能体的工作方式与传统应用截然不同。它们需要理解自然语言，需要在不同任务间切换上下文，需要保留跨会话、跨天甚至跨月的长期记忆，需要为亿级用户提供彼此隔离的“个人空间”。

为此，腾讯云推出了两个关键产品，即向量存储桶和MetaInsight多模态检索方案。

向量存储桶的本质，是将非结构化数据（图片、视频、文本、传感器数据）转化为高维向量，使Agent能够通过语义相似度，而非传统的关键词索引来检索信息。而MetaInsight更进一步，用户只需用自然语言提问，系统就能自动将问题拆解为向量进行匹配，从海量数据中精准召回相关信息。

这意味着什么？举例来说，一个智能客服Agent，昨天和某个用户沟通了半小时，今天用户再次上线，Agent能够立刻回忆起完整的对话历史、用户情绪变化，甚至隐含的未满足需求。这不是简单的日志回放，而是基于语义理解的上下文重建。

面对Agent可能带来的亿级并发和指数级负载增长，传统的存储桶设计已不堪重负。陈峥透露，腾讯云的解决方案是全栈式的Agent Runtime，它整合了五大能力，包括Agent沙箱、AgentBucket、Agent Memory、Agent安全网关、Agent可观测。

其中，Agent沙箱提供毫秒级冷启动能力；AgentBucket则为亿级用户提供相互隔离的个人空间，满足C端Agent的独立存储需求；Agent Memory结合向量数据库与对象存储，形成冷热分层的长效记忆体系；Agent安全网关以零信任零凭证机制管控智能体的访问权限，确保操作边界安全；Agent可观测对智能体调用工具、访问数据、执行任务全过程进行记录和追踪，实现全链路审计与优化。

这五层能力叠加，构成了一个为智能体时代量身打造的操作系统级基础设施。其不是在优化存储，而是在重新定义Agent的运行环境。

3、长期主义的价值，开放包容、生态共创

腾讯云坚守“长期主义”的价值，其走的是一条开放包容、生态共创的务实道路。

面对外界曾有的“腾讯AI慢”的质疑，汤道生与姚顺雨在对话中，给出了坦诚而有力的回应。

在姚顺雨看来，若把AI比作一场技术革命，今天还处于20世纪70年代的PC革命前夕，远未到终局。未来AI的世界，不会变得更单一，所有人都用同一个万亿参数的超级模型，而是会变得更多元。“这个世界还有很多空间没有被填满，多模态、具身智能等等，很多新的事情都在发生。”姚顺雨说。

腾讯的宝贵资产正是其丰富的场景积累。腾讯正将其优势的“三重能力”全面开放。

其中，第一重能力为场景连接力，将腾讯系内外的海量用户场景（社交、内容、支付、小程序等）开放给共创伙伴，让Agent技术有机会在真实流量中打磨和验证。

第二重为工程驾驭力，将腾讯云经过微信、QQ、游戏等国民级应用锤炼的分布式架构、高并发处理、海量存储能力，以Agent Runtime的形式输出给伙伴。

第三重则是模型驱动力，其将混元大模型及配套的工具链、评测体系、安全机制共享给伙伴，降低从0到1的研发门槛。

腾讯云不追求实验室里的单项冠军，而是将AI的能力，溶解于每一个具体的业务流程；将Agent的智能，变成每一位员工、每一位用户、每一台设备身边的可靠伙伴。

灵生科技在训练世界模型时，遭遇了三个相互关联的核心痛点，包括数据存储空间指数级增长、数据碎片化极其严重、难以高效检索，对此，灵生科技采取了“数据－模型”双向驱动的解决方案，这个过程当中，腾讯云的Agent Bucket和高效存储方案扮演了关键角色。

灵生科技合伙人蒋玉骅在采访中举例称，理想的预训练流程是，数据在采集的同时，就调用Agent加载VAE或T5的编码器进行实时预处理，即压缩、文本编码、特征提取。如果存储系统无法支持这种流式处理，延迟就会像滚雪球一样累积。

借助腾讯云的能力，灵生科技能够将这一过程中的不必要延迟降到最低，并通过流式视频加载方式，真正将昂贵的GPU资源跑满。以前灵生科技的GPU经常处于“等待数据”的半空闲状态，现在利用率大幅提升，预训练效率也显著提升。

腾讯开放与自信的姿态，还体现在了“腾讯AI共创营二期”暨“Buddy AI生态共创计划”的发布上。艾力斯特、安克创新、DeepSeek等23家企业，作为计划的首批共创伙伴集体亮相。这些伙伴覆盖了医疗健康、智能硬件、金融科技、生活服务、通信、基础模型、消费电子等20多个行业。

当技术红利真正转化为每一个企业触手可及的生产力，当每一个普通用户都能在日常交互中，感受到AI的无感而可靠的辅助，腾讯所追求的“长期主义”价值，便会自然地、不可逆地浮现出来。

腾讯云这条道路的骨架，是开放共赢的生态共创。其不试图独自定义未来，而是与行业伙伴共同探索Agent在千行百业的落地形态。

正如汤道生所说，AI不是一场百米冲刺，而是一场马拉松。马拉松最精彩的部分，不在前一百米谁冲在最前面，而在后半程谁能持续、稳定、不受伤地跑到终点。

4、结语

在这场AI的马拉松中，记忆正在成为非常关键的燃料，存储正在成为核心的底盘，而开放与共创，则是车队能够一路同行的默契。终点还很远，但方向已经清晰。

*注：文中题图来自摄图网，基于VRF协议。

AI下半场“哨响”：腾讯云如何打通“任督二脉”？

请登录