Files
myWiki/concepts/procedural-task-execution.md

1.2 KiB
Raw Permalink Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
程序性任务执行 (Procedural Task Execution) 2026-05-01 2026-05-01 concept
benchmark
llm
papers/dou-cl-bench.md

程序性任务执行 (Procedural Task Execution)

CL-bench 的第三类上下文:模型需学习复杂操作流程并正确执行。如产品手册排障、操作指导、工作流编排。

三个子类

子类 典型场景
Instructional Procedures 产品手册、故障排除
Operational Procedures 操作指南(如无人机物流系统 API
Workflow Orchestration 复杂工作流编排

典型示例

上下文中提供 SkyNet Logistics 无人机物流系统的完整 API 文档(导航控制、负载控制、安全控制三个模块),模型需将用户自然语言指令转换为伪代码并附带推理说明。

核心挑战

  • 信息分布在多段文档中,需要跨段信息整合
  • 需要精确遵循流程规范,不能跳过或错误执行步骤
  • 输出格式要求高(伪代码 + 推理说明)

相关概念