metadata
license: apache-2.0
datasets:
- divakaivan/fake_movie_review_kr
language:
- ko
base_model:
- kfkas/t5-large-korean-P2G
tags:
- text-generation-inference
- t5
Fine-tuned using this notebook
Sample Usage
# Load the model
import torch
from peft import PeftModel, PeftConfig
from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
### Load peft config for pre-trained checkpoint etc.
peft_model_id = "results"
config = PeftConfig.from_pretrained(peft_model_id)
### Load base LLM model and tokenizer
model = AutoModelForSeq2SeqLM.from_pretrained("divakaivan/t5-large-finetuned-reviewer-kr", load_in_8bit=True, device_map={"":0})
tokenizer = AutoTokenizer.from_pretrained("divakaivan/t5-large-finetuned-reviewer-kr")
### Load the Lora model
model = PeftModel.from_pretrained(model, peft_model_id, device_map={"":0})
model.eval()
# Sample Input
### Review
review = """๋ฆฌ๋ทฐ 1: ๋ถํ์ ์ฑ๋์ผ๋ก ์ ๋ชฉ ๋ฐ๊ฟ๋ผ. ์ด๊ฑด ๋ญ ์๋ฆฌ๋ง ๊ฝฅ๊ฝฅ ์ง๋ฅด๊ณ ์ง๋ค๋ผ๋ฆฌ ๊ฐ๋์ด๋. ์ ํ ๊ณต๊ฐ ๋ชป ํ๊ฒ ๊ตฌ๋ง ์ฏง; ๋ฆฌ๋ทฐ 2: ๋ ์๋ ๊ธฐ๋ฆฐ(์ด๊ด์) ์ซ์ดํ๋ค ํฌํฌํฌ.... ๋ฅ๋ ฅ์๊ฐ ์ข๋ค; ๋ฆฌ๋ทฐ 3: ๊ทธ๋๋ ๊ฒฐ๊ณผ๋ฅผ ๋ณด๋ ๋๋ผ๋ง๋ฐ์...์ด์ ๋จ์ด๋ ๋ฏผ์ง์๊ฐ ์๋๊ธธ ๋ฐ๋๋ ๋ง์์์์..๊ทผ๋ฐ ์ค๋ ์์นจ๋๋ผ๋ง ์ ๋ง ์ค๋งํ์ด์. ๋๋ฌผ์ด ํ๋๋๋ผ๊ตฌ์..์ด์ฉ ํํ์ ๋นํ๊ณ ์ฐฉํ๊ฒ๋ง ์ฌ๋์ ์ฃฝ์ด์ผํ๋์.. ์ด๋๋ผ๋ง์๊ฐ ์ต์
์ ์ต์
์ด์์.. ๋๋ผ๋ง๋ค์ ๋ณด๊ณ ์ถ์ง์์์; ๋ฆฌ๋ทฐ 4: ๋๊น์ง ์์์๊ธฐ๊ฐ ๋ ํ๋ค์์.. ์ฌ๋ฏธ๋.. ๋ด์ฉ๋.. ๊ฐ๋๋.. ์ต์
์..; ๋ฆฌ๋ทฐ 5: ๊ทธ๋ฅ ์ธ๊ฐ๊ทน์ฅ์ด ๋ ๋ ๋ฏ..ํฐ๋น๋ก๋ณด๊ตฌ๋ง๋ค; ๋ฆฌ๋ทฐ 6: ์ฌ๊ณ ๋ญ์น์ด์ง๋ง ์ด๋จธ๋์ ๋ํ ๋จ๊ฑด์ด ์ฌ๋์ด ๋๋ฌผ๊ฒจ์ ๊ฐ๋์ ์ด์๋ค.; ๋ฆฌ๋ทฐ 7: ์ค์ฅ์ฐ ์น๊ตฌ์ญ์ผ๋ก ๋์จ ๋ฐฐ์ฐ๋ถ ๋๊ตฌ์ง? ์ ์ผ ์๊ฒผ์; ๋ฆฌ๋ทฐ 8: ์ํ์ ๋๋ฌด ๋ต๋ตํ์บ๋ฆญํฐ ๋ณด๊ณ ์์ ์ง์ฆ๋์์ใ
กใ
ก์ ์ฐ๊ธฐ๋ ๊ทธ๋ฅ; ๋ฆฌ๋ทฐ 9: ์ด์ํ๋ณด๊ณ ์ถ์๋ฐ ใ
ใ
์ด๋์ ๋ด์? ใ
ใ
์ฐพ์์๊ฐ์์ด์ใ
ใ
; ๋ฆฌ๋ทฐ 10: ์ด ์ํํ๋ฒ ๋๋ณผ๋ ค๊ณ ,์คํ์ด๋๋งจ,์ฒซ์ฌ๋,์กฐํญ2..๋ณด์ง๋ ์์๋ค!; ๋ฆฌ๋ทฐ 11: ์ฝ์ฝ๋ชฝ๋์์๋๋ ์ธ์์ต๋๋ค..; ๋ฆฌ๋ทฐ 12: ์์ง์๋ดค์ง๋ง ๋งํด๋๋ฌธ์๋ณธ๋คใ
ใ
ใ
ใ
; ๋ฆฌ๋ทฐ 13: ์ํ์์ ๋ด๋ด ๊ณณ๊ณณ์์ ํฐ์ ธ๋์ค๋ ์ค์. ์ฝ๋ฏธ๋๋ก ์๊ฐํ๊ณ ๋ณด๋ฉด ์์ธ๋ก ๊ด์ฐฎ์์ง๋; ๋ฆฌ๋ทฐ 14: ์ผ์ ๋ ์๊น๋ค ์ง์งOOO์ํ ใ
ใ
ใ
ใ
์๋ฐ์ผ์์งํ ์ด๊ฑด์์ฌ์์ฐ๋ฆฌ์ง์๋?; ๋ฆฌ๋ทฐ 15: ์น์ํ๊ฑด ๋์งธ์น๊ณ ์นด์ค๋ฏธ๊ฐ ์ ํ ๋ดํ์ด์์ใ
กใ
ก; ๋ฆฌ๋ทฐ 16: ๋๋ฅผ ์ํ ์ด์ผ๊ธฐ .; ๋ฆฌ๋ทฐ 17: ๋ผ๋ฏผ, ์์๋ผ, ํ๋ค๋ฆฌ ๋์ค๋ ์ค ์๊ณ DVD ๊ตฌ๋งคํ๋ค๊ฐ ๋๋ฌผํ๋ฆผ. LND ๋
ธ๋๋ ์ข์๋ฐ ์๋ค๊ฐ ๋ชป๋ถ๋ฅด๊ณ ์ฐ๊ธฐ๋ ๋ชปํจ;;; ๋ฆฌ๋ทฐ 18: ์ต๊ณ ์ ์ํ. ์ด ์ํ๋ฅผ ๋ณด๊ณ ์ ํ๋ฆฌ๋ ๋๋ฌผ์ .... ์ฐ๋ฉด์ ๋ฌ๋ค.; ๋ฆฌ๋ทฐ 19: ํต์ ๊ฐ ์ ๋๋ ์ฐ์ผ๋ก ๊ฐ๋ค.; ๋ฆฌ๋ทฐ 20: ์ฌ๋ฐ๊ฒ ๋ดค๋ ์ถ์ต์ ๋๋ผ๋ง; ๋ฆฌ๋ทฐ 21: ๋ปํ๋ฐ์ ,; ๋ฆฌ๋ทฐ 22: ๋ง์ด ํ์์๋ ์ญ๋ ์ต๊ณ ์ ๋ช
์์
๋๋ค.; ๋ฆฌ๋ทฐ 23: ๋ณ ํ๊ฐ๋ ์๊น์ด ์ฐ๋ ๊ธฐ์ํ... ์ง์ฆ๋; ๋ฆฌ๋ทฐ 24: ใ
ใ
ใ
)bbbb; ๋ฆฌ๋ทฐ 25: ์์ ์ ๋ฐ๋ก๋ณด๊ณ ์ถ์ ์ ํํ๋ ๊ฒ์ด ๋์๊ฒ๋ ์ฃผ๋ณ์ธ์๊ฒ๋ ํ๋ณต์ด ์๋๊น..์ถ์๋ค.๋ด๊ฐ ๋ด์ถ์ ๋ง์กฑํ์ง ๋ชปํ๊ณ ๋ถํํ๋ฉด ๋ด์ฃผ์๋ ๊ฒฐ์ฝ ํ๋ณตํ ์ ์๋ค.์ด๊ธฐ์ ์ผ๊น..์๋ ์๋ช
์ด๋ค.; ๋ฆฌ๋ทฐ 26: ์ ๋ชฉ๋ถํฐ ๋ฐ๊ฟ๋ผ ํ๊ณํ์ ๋ ์ด ๋ธ๋๋๋ฒ๋ฆฌ๊ฐ ๊ทธ๋ ๊ฒ ์ญ์ ์ ๋๋๋ฐ๋ ๋ป๋ปํ๋ค; ๋ฆฌ๋ทฐ 27: ์ค๋ฆด๋ฌ ํฌ์ด์ง๋ง ์ด๊ฑด ๋ญ ์๋๋ค์...; ๋ฆฌ๋ทฐ 28: ์ฑ์ฅ์ํ๋ผ๋ ํ์ ๊ฐ๋๋ฉด ์ด์ค๋ฌ์์ง๋ค. ์ง์ค์ด๋ฒ์ ํผํ ํ์ค๊ณผ ๊ฟ, ์ํ์ ์ข์๋ค.; ๋ฆฌ๋ทฐ 29: ๊ฟ์ผ ํ๋์ผ ใ
ใ
๋ณด๋๋ด๋ด ์์์ง์ผ๋ฉด์๋ณธ ์ํธใ
ใ
ใ
๊ฒ์ ์ฐ๊ธฐ์ํ๋ค; ๋ฆฌ๋ทฐ 30: ์ด๊ฑฐ ๋ณด๊ณ ์กฐ์น์ฐ๊ฐ ๋ ์ข์์ง..; ๋ฆฌ๋ทฐ 31: ๊ฒ์ ์ฌ์ฆํ๋ ๊ฒ ๊ฐ์ด ์๊ธฐ์๊ธฐํจ. ํฐ ์ฌ๋ฏธ๋ ์๋์ง๋ง ์ฒ์๋ถํฐ ๋๊น์ง ์์ํ๊ฒ ์ ์พํจ.; ๋ฆฌ๋ทฐ 32: ๋จน๋ฐฉ๋ ์๋๊ณ ์ณ๋ฌต์ณ๋ฌต ํ๋ ์ฅ๋ฉด๋ง ๋๋ฌด ํด๋ก์ฆ์
ํด์ ์ค๋๋ณด์ฌ์ฃผ๋โฆโฆ. ๋ญ ๋๋ผ๋ง๊ฐ ์ด๋ฐ์ง?; ๋ฆฌ๋ทฐ 33: 2015๋
์ ๋ณด๋ ๋๋ฌด ํ
๋ฌ๋ธํ๋ค..; ๋ฆฌ๋ทฐ 34: ์ฌ๋ฏธ์๋ค. ์ฌ์ฑ๊ฐ๋
์ผ๋ก์ ์ค์ผ์ผ ํฐ ์ํ์ ๋ง๋ค ์ ์๋ ๋ฅ๋ ฅ!; ๋ฆฌ๋ทฐ 35: ์์ฌํ ๋ณต์, ๊ทธ๋ฌ๋ ๋๋ฌด ํต์พ; ๋ฆฌ๋ทฐ 36: ํ๊ตญ์๋ ์ด๋ฐ ์ํ๊ฐ ์๊ตฌ๋ .. ๋ณด๊ณ ๋ ๋ฏฟ์ ์๊ฐ ์๋คํ ์ฅ๋ฉด ํ ์ฅ๋ฉด ๋ค ์ฃผ์ฅ๊ฐ์ ๋์ฌ๋ค๊ณผ ๋๋ถ์ด ๋ด ์ถ์ ๋๋์ ๋ณด๊ฒ ๋ง๋๋ ์ํ์ธ๊ฒ ๊ฐ๋ค; ๋ฆฌ๋ทฐ 37: ํํฌ์ ์ด๋ค...........; ๋ฆฌ๋ทฐ 38: ์๊ฐ๋ณด๋ค๋๋ฌด๊ด์ฐฎ์๋์ํ, ์ฐ๊ธฐํ ๋ฐฐ์ฐ๋ค์ ์ฐ๊ธฐ๊ฐ ํนํ ๋๋ณด์ธ๋ค; ๋ฆฌ๋ทฐ 39: ๊ฑฐ์ง๋ง์์ด๋ค์ด ๋ง๋ ์ํ; ๋ฆฌ๋ทฐ 40: ๋นจ๋ฆฌ ์ ์ฐ์ด....๋นจ๋ฆฌ; ๋ฆฌ๋ทฐ 41: ํ ๋ฒ ์๊ฐ ํด๋ด. ์์์ ์ ํ์ธ๋ค์ด ์ด๋ป๊ฒ ๋
์ผ ๊ฒฝ์ ๋ฅผ ๊ฐ์ ๋จน์๋ ์ง๋ฅผโฆ.; ๋ฆฌ๋ทฐ 42: ๊ฝ๋ณด๋ค ์๋
๋ค โฅโฅโฅโฅ; ๋ฆฌ๋ทฐ 43: ๊ธฐ๋ถ์ด ์ข์์ง๋ค์^^; ๋ฆฌ๋ทฐ 44: ์ผ๋ฐฉ์ , ํธํํ ์ฌ๊ณ ๋ค์ด ๋ง๋ค์ด๋ธ ์ผ๋ฐํ์ ๊ฐ์ธํจ๊ณผ๋ก ์ธํด ํ ์ธ๊ฐ์ ์ถ์ด ์ด๋ป๊ฒ ๋ฐ๋์ ์๋์ง ์์ ์๋ ์ํ๋ค. ์คํ๋ ค ์ด๋ฆฐ์์ด๋๊น ๋๋ ์ฌํ์ ์ฝ์์ด๊ธฐ์ ๋น์ฐํ๊ณ ๋ง์๊ฒ์ด๋ผ๋ ์๊ฐ์ ์ค์ ์ด ์ผ๋ง๋ ํฐ ์ค์๊ฐ ๋ ์ ์๋์ง ์์์ผ ํ ๊ฒ์ด๋ค.; ๋ฆฌ๋ทฐ 45: "์๋ จํ๋ค์, ""๊ฑฐ์ ํ ํ
๋ค."" ""์ด์ ํค์ด์ง์"" ""๋ค""; ๋ฆฌ๋ทฐ 46: ๊ฒฌ์๋จ ์ก์
๋ง์ผ๋ก ์ต๊ณ ์์...; ๋ฆฌ๋ทฐ 47: ์์ ๋๋ฐ ์งฑ ์ผ์์๋ค. ๊ทธ๋ฆฌ๊ณ ์.... ๋ฐ์ .... ์ง์ง ์ฅ๋์๋๋ค.; ๋ฆฌ๋ทฐ 48: ์ด๊ฑฐ 1์ ์ค๊ฒ๋ค์ ๋๋ฌ์ด OO์์์ธ๋ฏ...; ๋ฆฌ๋ทฐ 49: ์ฅ๊ตญ์์ด ์๋ ์์ฑ์ ๋ณ๋ก ์๋ค. ใ
กใ
ก; ๋ฆฌ๋ทฐ 50: ใ
ใ
.... OOO๊ฐ์ OOO ์ํ;"""
### Prompt
prompt = "Your task is to summarise. You are a helpful assistant that helps me evaluate Korean reviews. For each movie you are given 50 reviews. Analyze the reviews, and for the movie itself return a score(1 to 10) and explanation for each of the following criteria: Emotional, Characters, Plot, Visuals, Pacing. Return the review in Korean."
### Model Input
model_input = prompt + review
# Run Inference
input_ids = tokenizer(model_input, return_tensors="pt", truncation=True).input_ids.cuda()
outputs = model.generate(input_ids=input_ids, max_new_tokens=1000, do_sample=True, top_p=0.9)
output = tokenizer.batch_decode(outputs.detach().cpu().numpy(), skip_special_tokens=True)[0]
print(output)