myWiki/concepts/qlora.md

---
title: "QLoRA (量化低秩适配)"
created: 2025-06-02
updated: 2025-06-02
type: concept
tags: [qlora, fine-tuning, quantization, placeholder]
sources: []
---

# QLoRA

> Quantized Low-Rank Adaptation（Dettmers et al., NeurIPS 2023），将 [[lora|LoRA]] 与 4-bit 量化结合，大幅降低 LLM 微调的内存需求。

## 核心机制

- **4-bit NormalFloat (NF4)** 量化：专为正态分布权重设计
- **双重量化**：进一步压缩量化常数
- **分页优化器**：处理内存峰值

## 在 One-Pass to Reason 中的应用

[[goru-one-pass-to-reason-2025]] 在 Qwen-3 系列（4B/8B/32B）上使用 QLoRA 进行实验，rank=32，α=64，4-bit NF4 量化。

## 相关

- [[lora]]
- [[goru-one-pass-to-reason-2025|One-Pass to Reason]]
- [[llama-factory]]