分类 模型训练工具 训练医疗大模型,实现了包括增量预训练、有监督微调、RLHF(奖励建模、强化学习训练)和DPO(直接偏好优化)。https://github.com/shibing624/MedicalGPT#medicalgpt-training-medical-gpt-model