大模型(LLMs)強化學習——RLHF及其變種面
大模型(LLMs)強化學習—— PPO 面
大模型(LLMs)強化學習面
大模型(LLMs)評測面
基于lora的llama2二次預訓練
大模型(LLMs)增量預訓練篇
大模型(LLMs)推理面 PDF 下載
提示學習(Prompting)篇
適配器微調(Adapter-tuning)篇
大模型(LLMs)參數高效微調(PEFT) 面