Update README.md
Browse files
README.md
CHANGED
@@ -10,7 +10,7 @@ language:
|
|
10 |
|
11 |
- Base Model: [42dot/42dot_LLM-SFT-1.3B](https://huggingface.co/42dot/42dot_LLM-SFT-1.3B)
|
12 |
- [v0.1](https://huggingface.co/heegyu/ko-reward-model-1.3b-v0.1) ๋ชจ๋ธ์ helpful + safety๋ฅผ ๊ฐ์ด ํ์ตํ๊ณ safeํ ๋ต๋ณ์ ์ง๋์น๊ฒ ๋์ ์ ์๋ฅผ ์ฃผ๋ ๊ฒฝํฅ์ด ์์ด์ ๋ถ๋ฆฌ ํ ๋ฐ๋ก ํ์ตํ์ต๋๋ค.
|
13 |
-
- ์ด ๋ชจ๋ธ์ ์ค๋ฆฌ์ ์ธ ๋ต๋ณ์ ๋์ ์ ์๋ฅผ ์ฃผ๋ safety ๋ชจ๋ธ์
๋๋ค.
|
14 |
|
15 |
## Hyperparameters:
|
16 |
- Batch: 128
|
@@ -36,7 +36,7 @@ language:
|
|
36 |
```
|
37 |
from transformers import pipeline
|
38 |
|
39 |
-
pipe = pipeline("text-classification", model="heegyu/
|
40 |
|
41 |
|
42 |
pipe("""<human>:
|
|
|
10 |
|
11 |
- Base Model: [42dot/42dot_LLM-SFT-1.3B](https://huggingface.co/42dot/42dot_LLM-SFT-1.3B)
|
12 |
- [v0.1](https://huggingface.co/heegyu/ko-reward-model-1.3b-v0.1) ๋ชจ๋ธ์ helpful + safety๋ฅผ ๊ฐ์ด ํ์ตํ๊ณ safeํ ๋ต๋ณ์ ์ง๋์น๊ฒ ๋์ ์ ์๋ฅผ ์ฃผ๋ ๊ฒฝํฅ์ด ์์ด์ ๋ถ๋ฆฌ ํ ๋ฐ๋ก ํ์ตํ์ต๋๋ค.
|
13 |
+
- ์ด ๋ชจ๋ธ์ ์ค๋ฆฌ์ ์ธ ๋ต๋ณ์ ๋์ ์ ์๋ฅผ ์ฃผ๋ safety ๋ชจ๋ธ์
๋๋ค. ์ ์ฉํ๊ณ ์์ธํ ๋ต๋ณ์ ๋ํด ๋์ ์ ์๋ฅผ ์ฃผ๋ helpful ๋ชจ๋ธ์ [heegyu/ko-reward-model-helpful-1.3b-v0.2](https://huggingface.co/heegyu/ko-reward-model-helpful-1.3b-v0.2) <- ์ด ๋ชจ๋ธ์ ์ฌ์ฉํ์ธ์
|
14 |
|
15 |
## Hyperparameters:
|
16 |
- Batch: 128
|
|
|
36 |
```
|
37 |
from transformers import pipeline
|
38 |
|
39 |
+
pipe = pipeline("text-classification", model="heegyu/ko-reward-model-safety-1.3b-v0.2")
|
40 |
|
41 |
|
42 |
pipe("""<human>:
|