程序性记忆如何降低AI代理的成本和复杂性-阿里西西

浙江大学与阿里巴巴集团联合研发的新技术为大型语言模型（LLM）智能体赋予了动态记忆能力，使其在执行复杂任务时更高效精准。这项名为Memp的技术为智能体构建了"程序性记忆"，可随经验积累持续更新——正如人类通过实践学习的过程。

Memp建立了终身学习框架，使智能体无需每次面对新任务都从零开始。当在现实环境中遭遇新场景时，它们会持续进化为更高效的状态，这恰恰是企业级自动化最核心的可靠性要求。

AI智能体为何需要程序性记忆

虽然LLM智能体在自动化多步骤商业流程中展现出潜力，但实际执行长周期任务时仍显脆弱。研究者指出，网络故障、界面改版或数据结构变更等意外事件都可能导致全流程崩溃。现有智能体往往需要重启整个流程，造成高昂的时间与经济成本。

研究团队发现，许多复杂任务在深层结构上存在共性。智能体应当能从历史成败中提取可复用的经验模式，而非反复重新学习。这需要特定的"程序性记忆"——类似于人类通过练习获得的打字、骑车等自动化技能所依赖的长期记忆系统。

当前智能体系统普遍缺乏这种能力。其程序性知识通常由开发者手动编码，存储在僵化的提示模板或模型参数中，更新成本极高。现有记忆增强框架也仅提供粗粒度抽象，未能系统解决技能构建、索引、修正及生命周期修剪等核心问题。

正如论文所述："目前缺乏量化智能体程序性技能进化效率的理论方法，也无法确保新经验真正提升而非损害性能。"

这个任务无关框架将程序性记忆作为核心优化组件，通过构建-检索-更新三阶段形成闭环：

记忆素材来自智能体的历史"轨迹"。研究探索了两种存储格式：原始操作步骤或提炼为脚本式高层抽象。执行新任务时，智能体通过向量搜索或关键词匹配等机制检索最相关记忆。

最关键的是更新机制。Memp提供多重策略：单纯累积新经验、筛选成功记录，或通过失败反思修正原始记忆。这种动态进化特性使其成为提升AI智能体长期任务可靠性的前沿解决方案。

共同作者方润楠向VentureBeat强调："Mem0和A-MEM专注于单次轨迹内的关键内容记忆，而Memp实现的是跨轨迹程序性记忆。"前者记录"发生了什么"，后者提炼"如何操作"的通用知识，避免智能体每次重复探索。

"通过将成功工作流蒸馏为可复用程序先验，Memp显著提升成功率并缩短步骤。"方润楠补充道，"更关键的是，我们建立了持续优化的更新机制——熟能生巧对AI智能体同样适用。"

面对初始记忆构建的困境，研究团队提出实用方案：开发者可先定义鲁棒评估指标（基于规则或LLM），放任先进模型在工作流中探索，保留高分轨迹作为种子记忆。这种方法大幅降低了手动编程需求。

基于GPT-4o、Claude 3.5 Sonnet和Qwen2.5的测试显示：在ALFWorld家务基准和TravelPlanner信息查询任务中，配备Memp的智能体不仅成功率提升，更通过消除无效探索使操作步骤和token消耗显著降低。

最具商业价值的发现是记忆可迁移性：当将GPT-4o生成的程序性记忆移植到Qwen2.5-14B小模型时，后者任务成功率提升34.5%，步骤减少28.1%。这证实了用先进模型获取知识后，可部署至性价比更高的小型模型。

Memp框架使智能体能在真实环境中持续进化。但完全自主还需突破另一瓶颈：多数现实任务（如撰写研究报告）缺乏明确成功信号。方润楠指出未来方向是让LLM担任评估者："当前我们结合人工规则与强模型计算完成度评分，但手工规则脆弱且难泛化。"

LLM作为裁判可提供细致反馈，使智能体能在复杂主观任务中自我修正。这将使整个学习循环更具扩展性和鲁棒性，为构建企业级自适应自主AI系统迈出关键一步。