生成式AI浪潮在2023年底席卷全球后,乐天集团(Rakuten Group)随即于2024年初发布AI战略“Triple ...
LLM-Dojo使用简洁且易阅读的代码构建LLM、VLM模型训练、RLHF框架等各种功能,使项目易于学习且方便魔改与实验,与大多开源框架相同均是基于huggingface。 主要内容如下: SFT训练框架: 简洁清晰的开源大模型训练框架,支持Deepspeed多卡、Lora、QLora、全参等训练 ...