MedicalGPT:训练医疗大模型

训练医疗大模型,实现了包括增量预训练、有监督微调、RLHF(奖励建模、强化学习训练)和DPO(直接偏好优化)。

https://github.com/shibing624/MedicalGPT#medicalgpt-training-medical-gpt-model