Spaces:

bstraehle
/

sft

Running

bstraehle commited on Aug 3

Commit

10e80e0

•

1 Parent(s): 69c8058

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -32,10 +32,8 @@ def fine_tune_model(base_model_name, dataset_name):
     print("### Dataset")
     print(dataset)
-    print("### Train example")
     print(dataset["train"][:1])
-    print("### Test example")
-    print(dataset["test"][:1])
     print("###")
     # Load model
@@ -57,10 +55,8 @@ def fine_tune_model(base_model_name, dataset_name):
     print("### Pre-processed dataset")
     print(dataset)
-    print("### Train example")
     print(dataset["train"][:1])
-    print("### Test example")
-    print(dataset["test"][:1])
     print("###")
     # Split dataset into training and validation sets
@@ -138,8 +134,7 @@ def prompt_model(model_name, system_prompt, user_prompt, sql_schema):
 def load_model(model_name):
     model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto")
     tokenizer = AutoTokenizer.from_pretrained(model_name)
-    tokenizer.padding_side = "right"
-    #tokenizer.pad_token = tokenizer.eos_token
     return model, tokenizer

     print("### Dataset")
     print(dataset)
+    print("### Example")
     print(dataset["train"][:1])
     print("###")
     # Load model
     print("### Pre-processed dataset")
     print(dataset)
+    print("### Example")
     print(dataset["train"][:1])
     print("###")
     # Split dataset into training and validation sets
 def load_model(model_name):
     model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto")
     tokenizer = AutoTokenizer.from_pretrained(model_name)
+    tokenizer.pad_token = tokenizer.eos_token
     return model, tokenizer