Slate 架构设计分析
Related topics: [[agent-architecture]], [[memory-system]], [[rlm-architecture]]
概述
Slate 是 Random Labs 提出的一种新型 Agent 架构,旨在超越 ReAct 和 RLM(递归语言模型)。该架构通过基于线程的片段记忆系统(Thread-based Episodic Memory)同时解决了现代 LLM Agent面临的三大核心问题:长时序任务执行、策略与战术平衡、以及工作记忆管理。
项目地址: https://github.com/randomlabs-ai/slate 官方文档: https://docs.randomlabs.ai
1. 核心挑战
1.1 长时序任务
长时序任务是路径依赖的(path-dependent),即完成任务所需的步骤数量超过了最小 harness 能处理的范围。Agent 需要具备:
- 充足的工作记忆 - 模型能在正确的时间关注正确的上下文
- 策略与战术的平衡 - 既能制定良好的计划,又能正确执行
- 整合新信息的能力 - 在执行过程中整合发现的新信息,而不丢失整体目标
1.2 工作记忆与 "Dumb Zone"
模型无法在整个上下文窗口中均匀地分配注意力。随着上下文长度增长,模型关注信息的能力会退化。可用的部分(即退化区域之前的部分)就是工作记忆。
Dex Horthy 创造了 "Dumb Zone" 这一术语来描述上下文窗口中检索质量下降的部分。
┌─────────────────────────────────────────────────────────┐
│ Context Window │
├─────────────────────┬───────────────────────────────────┤
│ Working Memory │ Dumb Zone │
│ (有效注意力区域) │ (注意力退化区域) │
└─────────────────────┴───────────────────────────────────┘
研究表明,即使在简单任务上,四个前沿模型(Claude Sonnet 4、GPT-4.1、Qwen3-32B、Gemini 2.5)的性能都随着输入长度增长而非均匀地退化。