RLHFlow
/

LLaMA3-iterative-DPO-final

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

LLaMA3-iterative-DPO-final

Commit History

Update README.md

8c929ad
verified

Haoxiang-Wang commited on 16 days ago

Update generation_config.json

40b73bd
verified

weqweasdas commited on Jun 12

Update README.md

360547e
verified

weqweasdas commited on Jun 3

Update README.md

c20c9f0
verified

Haoxiang-Wang commited on May 24

Update README.md

f3f938b
verified

weqweasdas commited on May 17

Update README.md

875c75b
verified

weqweasdas commited on May 17

Upload tokenizer

3678e58
verified

weqweasdas commited on May 17

Upload LlamaForCausalLM

ae5cd93
verified

weqweasdas commited on May 17

initial commit

17a4cdf
verified

weqweasdas commited on May 17