大模型(LLMs)強化學習——RLHF及其變種面
大模型(LLMs)強化學習—— PPO 面
大模型(LLMs)強化學習面
大模型(LLMs)評測面
基于lora的llama2二次預訓練
大模型(LLMs)增量預訓練篇
如何使用 PEFT庫 中 LoRA?
大模型(LLMs)推理面 PDF 下載
LoRA 系列篇
大模型(LLMs)參數高效微調(PEFT) 面