zfz1
/

deepseek-8b-orpo-full

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

deepseek-8b-orpo-full / runs /Jul15_19-44-09_phe108-jieyuzhao-01 /events.out.tfevents.1721098092.phe108-jieyuzhao-01.232196.0

Commit History

Training in progress, step 500

91e2f06
verified

zfz1 commited on Jul 16