zfz1
/

deepseek-8b-orpo-full

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

deepseek-8b-orpo-full / trainer_state.json

Commit History

Model save

9adce4c
verified

zfz1 commited on Jul 16