zfz1
/

deepseek-8b-orpo-full

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

deepseek-8b-orpo-full

Commit History

Training in progress, step 1250

b04eac5
verified

zfz1 commited on Jul 16

Training in progress, step 1000

39a6095
verified

zfz1 commited on Jul 16

Training in progress, step 500

91e2f06
verified

zfz1 commited on Jul 16

initial commit

83ff8b5
verified

zfz1 commited on Jul 16