出品 | 创业最前线
作者 | 文斐
编辑 | 闪电
美编 | 倩倩
审核 | 颂文
AI技术狂飙数年后,“算力崇拜”的叙事正悄然让位,更深层次的关于“记忆与上下文”的话题,成为新焦点。
当模型规模遭遇瓶颈,当智能体(Agent)开始7×24小时不间断工作,企业该如何构建支撑其长期运行、高效协作的数据基础设施?近日腾讯云举办的2026AI产业应用大会,给出了极具可行性的答案。
大会释放出一个清晰的信号:AI“下半场”已经鸣哨。这意味着拼算力、拼参数的“上半场”开始落幕,而拼数据治理、拼记忆效率、拼场景落地的“下半场”则同步到来。
存储与记忆,这个曾经被低估的角色,正在成为新的战略高地。
1、AI下半场,Agent基础设施的范式转移
6月5日,腾讯云2026AI产业应用大会如期举行。一场关于AI基础设施的讨论,正在刷新人们对人工智能竞赛的认知。
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生,与腾讯AI首席科学家姚顺雨,罕见同台深度对话,首次系统阐释了腾讯AI的“哲学”与“务实逻辑”。
“AI下半场”的概念由姚顺雨提出并广为人知,这次他在现场给出了更为精准的界定。过去,无论是AlphaGo还是早期的翻译模型,人类面临的核心挑战是“方法论稀缺”。而今天,预训练与大模型的成功,让人类拥有了一个近乎“万能”的底座。
“最大的挑战变了,”姚顺雨强调,“现在已有了能砸很多钉子的锤子,最困难的反而是,去哪里寻找最值得解决、最有影响力的‘好问题’?”这正是他选择加入腾讯的根本原因——这里不缺乏真实的、大规模的应用场景。从微信、QQ到企业服务,腾讯丰富的产品矩阵,为AI提供了肥沃的“上下文”土壤。
汤道生深表认同,他指出腾讯做AI最核心的经验就是“扎根场景”。真实场景里既有用户需求,也有模型迭代最需要的数据。模型的进化,不再仅依赖于实验室里的算法突破,更依赖于在文档协作、代码生成等具体业务流中,产生的海量、真实、带噪的数据反馈。
大会上,覆盖20多个垂直场景的“效率智能体工具集”重磅首发,从个人开箱即用的QClaw、元宝,到企业级的WorkBuddy企业版、智能体开发平台ADP4.0,再到行业首创的“人机双写”腾讯文档……一套多层次、全栈式的AI生产力基础设施,正浮出水面。
这不仅是产品的集中亮相,更是腾讯对“AI如何真正创造价值”这一根本问题的回答。其核心答案,指向三个关键词:真实场景、深度信任、协同设计(Co-Design)。
决定智能体能否真正成为人类得力助手的关键基础设施,即存储。腾讯云的全栈Agent Infra(智能体基础设施)布局,正回答一个问题:如何让AI不仅聪明,而且可靠、高效、长久地为人类服务。答案,或许就藏在每一比特数据的妥善安放与高效调用之中。
“伴随整个算力问题的解决,现在最重要的应该是Context(上下文),所谓的存储跟记忆。”腾讯云存储总经理陈峥接受采访时称。
在陈峥看来,过去人类痴迷于算力,解决的是“Agent能跑多快”的问题;而如今,决定智能体高度的,是它能否“记得住、找得对”。
2、AI马拉松长跑下,腾讯云存储的“三级跳”
从“存得起”到“找得对”,腾讯云存储经历了“范式三级跳”,这一演变映整个行业对数据与AI关系认知的深化。
陈峥在采访中讲述了腾讯云存储的进化史,他称,腾讯云经历了“通用存储时代、AIGC时代、Agent Bucket时代”三个清晰的阶段。其中第三阶段即“Agent Bucket时代”,在陈峥眼中,是最具革命性的阶段。
通用存储时代,核心任务是解决非结构化数据的“存得起”和可靠性问题。彼时客户最关心的是,它的数据放这里会不会丢?能不能管起来?这一阶段,存储是沉默的后勤部门,只要不犯错,没人会提起它。
AIGC时代,焦点迅速转向“读得快”。大模型训练需要海量数据持续“投喂”给GPU,任何I/O(输入/输出)延迟,都意味着算力的空转和资金的浪费。腾讯云通过分布式缓存、并行文件系统等技术,让数据高效流向计算单元,确保昂贵的GPU集群不再“等数据”。这一阶段,存储开始被看见,因为它的性能直接决定了训练效率。
Agent Bucket时代,正是陈峥眼中最具革命性的阶段。Agent不是传统的应用,它是一种新型的计算主体。智能体的工作方式与传统应用截然不同。它们需要理解自然语言,需要在不同任务间切换上下文,需要保留跨会话、跨天甚至跨月的长期记忆,需要为亿级用户提供彼此隔离的“个人空间”。
为此,腾讯云推出了两个关键产品,即向量存储桶和MetaInsight多模态检索方案。
向量存储桶的本质,是将非结构化数据(图片、视频、文本、传感器数据)转化为高维向量,使Agent能够通过语义相似度,而非传统的关键词索引来检索信息。而MetaInsight更进一步,用户只需用自然语言提问,系统就能自动将问题拆解为向量进行匹配,从海量数据中精准召回相关信息。
这意味着什么?举例来说,一个智能客服Agent,昨天和某个用户沟通了半小时,今天用户再次上线,Agent能够立刻回忆起完整的对话历史、用户情绪变化,甚至隐含的未满足需求。这不是简单的日志回放,而是基于语义理解的上下文重建。
面对Agent可能带来的亿级并发和指数级负载增长,传统的存储桶设计已不堪重负。陈峥透露,腾讯云的解决方案是全栈式的Agent Runtime,它整合了五大能力,包括Agent沙箱、AgentBucket、Agent Memory、Agent安全网关、Agent可观测。
其中,Agent沙箱提供毫秒级冷启动能力;AgentBucket则为亿级用户提供相互隔离的个人空间,满足C端Agent的独立存储需求;Agent Memory结合向量数据库与对象存储,形成冷热分层的长效记忆体系;Agent安全网关以零信任零凭证机制管控智能体的访问权限,确保操作边界安全;Agent可观测对智能体调用工具、访问数据、执行任务全过程进行记录和追踪,实现全链路审计与优化。
这五层能力叠加,构成了一个为智能体时代量身打造的操作系统级基础设施。其不是在优化存储,而是在重新定义Agent的运行环境。
3、长期主义的价值,开放包容、生态共创
腾讯云坚守“长期主义”的价值,其走的是一条开放包容、生态共创的务实道路。
面对外界曾有的“腾讯AI慢”的质疑,汤道生与姚顺雨在对话中,给出了坦诚而有力的回应。
在姚顺雨看来,若把AI比作一场技术革命,今天还处于20世纪70年代的PC革命前夕,远未到终局。未来AI的世界,不会变得更单一,所有人都用同一个万亿参数的超级模型,而是会变得更多元。“这个世界还有很多空间没有被填满,多模态、具身智能等等,很多新的事情都在发生。”姚顺雨说。
腾讯的宝贵资产正是其丰富的场景积累。腾讯正将其优势的“三重能力”全面开放。
其中,第一重能力为场景连接力,将腾讯系内外的海量用户场景(社交、内容、支付、小程序等)开放给共创伙伴,让Agent技术有机会在真实流量中打磨和验证。
第二重为工程驾驭力,将腾讯云经过微信、QQ、游戏等国民级应用锤炼的分布式架构、高并发处理、海量存储能力,以Agent Runtime的形式输出给伙伴。
第三重则是模型驱动力,其将混元大模型及配套的工具链、评测体系、安全机制共享给伙伴,降低从0到1的研发门槛。
腾讯云不追求实验室里的单项冠军,而是将AI的能力,溶解于每一个具体的业务流程;将Agent的智能,变成每一位员工、每一位用户、每一台设备身边的可靠伙伴。
灵生科技在训练世界模型时,遭遇了三个相互关联的核心痛点,包括数据存储空间指数级增长、数据碎片化极其严重、难以高效检索,对此,灵生科技采取了“数据-模型”双向驱动的解决方案,这个过程当中,腾讯云的Agent Bucket和高效存储方案扮演了关键角色。
灵生科技合伙人蒋玉骅在采访中举例称,理想的预训练流程是,数据在采集的同时,就调用Agent加载VAE或T5的编码器进行实时预处理,即压缩、文本编码、特征提取。如果存储系统无法支持这种流式处理,延迟就会像滚雪球一样累积。
借助腾讯云的能力,灵生科技能够将这一过程中的不必要延迟降到最低,并通过流式视频加载方式,真正将昂贵的GPU资源跑满。以前灵生科技的GPU经常处于“等待数据”的半空闲状态,现在利用率大幅提升,预训练效率也显著提升。
腾讯开放与自信的姿态,还体现在了“腾讯AI共创营二期”暨“Buddy AI生态共创计划”的发布上。艾力斯特、安克创新、DeepSeek等23家企业,作为计划的首批共创伙伴集体亮相。这些伙伴覆盖了医疗健康、智能硬件、金融科技、生活服务、通信、基础模型、消费电子等20多个行业。
当技术红利真正转化为每一个企业触手可及的生产力,当每一个普通用户都能在日常交互中,感受到AI的无感而可靠的辅助,腾讯所追求的“长期主义”价值,便会自然地、不可逆地浮现出来。
腾讯云这条道路的骨架,是开放共赢的生态共创。其不试图独自定义未来,而是与行业伙伴共同探索Agent在千行百业的落地形态。
正如汤道生所说,AI不是一场百米冲刺,而是一场马拉松。马拉松最精彩的部分,不在前一百米谁冲在最前面,而在后半程谁能持续、稳定、不受伤地跑到终点。
4、结语
在这场AI的马拉松中,记忆正在成为非常关键的燃料,存储正在成为核心的底盘,而开放与共创,则是车队能够一路同行的默契。终点还很远,但方向已经清晰。
*注:文中题图来自摄图网,基于VRF协议。