Training in progress, epoch 0, checkpoint

Files changed (5) hide show

last-checkpoint/adapter_config.json CHANGED Viewed

@@ -20,13 +20,13 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "down_proj",
-    "k_proj",
-    "q_proj",
-    "up_proj",
     "gate_proj",
     "o_proj",
-    "v_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "gate_proj",
+    "v_proj",
     "o_proj",
+    "down_proj",
+    "q_proj",
+    "k_proj",
+    "up_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:389feb1cf7e09bf0d90a44d07d61d7f735f797e8865b11c13d494e098291ec81
 size 9048

 version https://git-lfs.github.com/spec/v1
+oid sha256:eefa655f5cd147e98ce63dfb0864cd0f92c83e67ee1e29285d374f653484e6c0
 size 9048

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:21710edc9af4f5a7713369516124e72ee866e971f6aa4121b38175cce196a7da
 size 28134

 version https://git-lfs.github.com/spec/v1
+oid sha256:ac4142c3be2e841af94ef187a11cda09345575cb0c87d999166ace020f8c145c
 size 28134

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -10,17 +10,17 @@
   "log_history": [
     {
       "epoch": 0.0002666666666666667,
-      "grad_norm": 0.02084502950310707,
       "learning_rate": 0.0,
       "loss": 11.9308,
       "step": 1
     },
     {
       "epoch": 0.0002666666666666667,
-      "eval_loss": 11.933904647827148,
-      "eval_runtime": 0.0598,
-      "eval_samples_per_second": 267.596,
-      "eval_steps_per_second": 66.899,
       "step": 1
     }
   ],

   "log_history": [
     {
       "epoch": 0.0002666666666666667,
+      "grad_norm": 0.014423760585486889,
       "learning_rate": 0.0,
       "loss": 11.9308,
       "step": 1
     },
     {
       "epoch": 0.0002666666666666667,
+      "eval_loss": 11.933897018432617,
+      "eval_runtime": 0.057,
+      "eval_samples_per_second": 280.626,
+      "eval_steps_per_second": 70.156,
       "step": 1
     }
   ],

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:578047ac6d20cb709ae6ac1ae98498a9b6b689cfaadf5290cc78e5a4548ec16d
 size 6776

 version https://git-lfs.github.com/spec/v1
+oid sha256:66de82d82c5b0fa059d38c05b8f39349f42fdee7e39cca74a06df079a9b400cf
 size 6776