Files
myWiki/concepts/observability.md
2026-06-01 10:46:01 +08:00

1.4 KiB
Raw Blame History

title, created, updated, type, tags, sources, confidence
title created updated type tags sources confidence
Observability & Operations可观测性与运维 2026-05-23 2026-05-23 concept
agent
observability
monitoring
ops
tracing
raw/papers/agent-harness-engineering-survey-2026.md
high

Observability & OperationsO 层)

ETCLOVG 的 O 层:捕获追踪、成本、故障和可靠性信号。在 ETCLOVG 中被提升为独立架构层。

为什么独立成层?

生产系统中可观测性已有专属工具生态和独立工程实践:

  • 追踪和监控平台Langfuse, Arize Phoenix, AgentOps
  • Agent 专用运维平台AgentTrace, OpenLLMetry
  • 成本追踪和优化TensorZero, Axon
  • 可靠性工程:异常检测、故障恢复

数据揭示的 Gap

LangChain 2026 调查89% 的团队使用可观测性,但只有 52.4% 运行离线评估。这意味着团队能看到 Agent 做了什么,但不能系统性地判断行为是否正确。

闭合回路

未来可观测性需要与 verification-evaluation 层紧密耦合:

  • 将异常生产踪迹转化为回归案例
  • 直接从 spans 计算轨迹质量指标
  • 将诊断信号反馈到 prompt、tool、context 和编排变更

相关概念