大模型(LLMs)強化學習—— PPO 面
大模型(LLMs)強化學習面
大模型(LLMs)評測面
基于lora的llama2二次預訓練
增量預訓練(Pretrain)樣本拼接篇
大模型(LLMs)增量預訓練篇
如何使用 PEFT庫 中 LoRA?
大模型(LLMs)推理面 PDF 下載
谷歌AI提示詞白皮書
提示學習(Prompting)篇