myWiki/concepts/agent-symbolic-learning.md

---
title: "Agent Symbolic Learning (Agent 符号学习)"
created: 2026-05-29
updated: 2026-05-29
type: concept
tags: ["agent", "symbolic-learning", "optimization", "self-evolving"]
sources: ["https://arxiv.org/abs/2406.18532"]
---

# Agent Symbolic Learning

**Agent Symbolic Learning** 是 Zhou et al. (AIWaves, 2024) 提出的框架：将 Agent pipeline 建模为 [[symbolic-network|符号网络]]，用模仿连接主义学习（反向传播 + 梯度下降）的方式**联合优化** Agent 的所有符号组件。

## 核心类比

| 连接主义学习 | Agent Symbolic Learning |
|:---|:---|
| 计算图 | Agent Pipeline |
| 层 + 权重 | 节点 + Prompts/Tools |
| 数值 Loss | [[language-loss\|Language Loss]] |
| 数值梯度 | [[language-gradient\|Language Gradients]] |
| BP 链式法则 | [[symbolic-backpropagation\|Symbolic Back-Propagation]] |
| 优化器 | Symbolic Optimizer (LLM) |

## 三阶段

1. **Forward Pass**: Agent 沿 pipeline 执行 → 轨迹
2. **Backward Pass**: Language Loss 从末节点向前传播 → 每个节点的 Language Gradients
3. **Weight Update**: Optimizer 根据 gradients 更新 prompts/tools/pipeline

## 历史意义

这是首次明确提出"模仿连接主义学习的反向传播和梯度下降来进行 Agent 符号优化"的工作。后续 [[yang-skillopt-2026|SkillOpt]]（2026，Microsoft）在工程稳定性上深化，[[heuristic-learning|Heuristic Learning]]（OpenAI）在范式层级上推广。

## 相关

- [[zhou-agent-symbolic-learning-2024]] — 原始论文
- [[symbolic-network]] — 核心抽象
- [[language-gradient]] — 核心机制