Files
myWiki/concepts/rlhf.md

615 B
Raw Blame History

title, created, updated, type, tags, status
title created updated type tags status
RLHF (Reinforcement Learning from Human Feedback) 2026-06-03 2026-06-03 concept
RLHF
alignment
LLM
training
placeholder

RLHF (Reinforcement Learning from Human Feedback)

⚠️ 占位符页面 — 待完善

RLHF 是一种基于人类反馈的强化学习对齐方法,是 SFT 的主要替代/补充后训练范式。典型流程SFT → 奖励模型训练 → PPO 优化。

与 SFT 的对比是 zhang-reconciling-sft-interaction-2026 讨论的重要背景。

相关概念