这份综述的价值不止在“怎么做一个记忆模块”,而是尝试用一个可复用的框架,把人类认知中的记忆模型与 AI 系统工程中的实现方式对齐:从“记忆为什么需要分层”,到“记忆该存什么、怎么存、何时更新、如何评估”,给出系统化答案。
psychology
统一理论框架:连接认知心理学与计算科学
综述从认知心理学与神经科学汲取灵感,将人类记忆模型映射为 AI 架构原则,帮助解释“为何这样设计”而不仅是“怎么堆模块”。
- Atkinson–Shiffrin 分层记忆:启发从瞬时缓存到长期存储的分层设计。
- 工作记忆模型:支持构建多组件、可动态读写的“工作空间”。
- 互补学习系统(CLS):强调“快速获取新知识”与“缓慢巩固知识”的协同,缓解记忆更新中的稳定性–可塑性矛盾。
schema
独创的 4W 记忆分类法:把“碎片研究”放进同一坐标系
用四个维度统一定义内存机制,便于对比不同方案,也便于你在工程落地时做取舍。
- When(生命周期):Transient → Session → Persistent。
- What(内存类型):程序性 / 陈述性 / 元认知 / 个性化。
- How(存储形式):参数化隐式(权重/隐藏态) vs 显式(文本/向量/知识图谱)。
- Which(模态维度):文本单模态 → 视听等多模态融合。
groups
单智能体 vs. 多智能体:从个体记忆到群体智能
记忆机制随系统规模演进:单体侧重突破上下文窗口与自我进化,多体侧重共享与协作。
- 单智能体:分层(Hierarchical)与类 OS(OS-like)设计,强化长期一致性与可扩展记忆。
- 多智能体(MAS):关注通信(显式符号 vs 隐式隐空间)与共享(任务级/步骤级)机制,减少信息孤岛、提升集体智慧。
assessment
评估体系与应用图谱:从指标到落地场景
综述给出可操作的评价维度,并梳理了记忆在不同应用中的价值与形态。
- 多维指标:检索准确性、动态更新能力、高级认知能力(泛化/时间感知)、工程效率(延迟/Token 开销)。
- 应用场景:对话助手(如 ChatGPT Memory)、具身机器人(Voyager)、医疗诊断、内容创作、科学发现等。