Training in progress, epoch 0, checkpoint

Files changed (6) hide show

last-checkpoint/adapter_config.json CHANGED Viewed

@@ -20,13 +20,13 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "gate_proj",
-    "v_proj",
-    "k_proj",
-    "down_proj",
     "o_proj",
-    "q_proj",
-    "up_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
+    "q_proj",
     "gate_proj",
     "o_proj",
+    "up_proj",
+    "down_proj",
+    "v_proj",
+    "k_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8b754fc36b06036fd3ded38303062efee40021a29536e0778f5f517927079856
 size 9048

 version https://git-lfs.github.com/spec/v1
+oid sha256:eaf406d8cdb6b52f8a340431d451dc1fc4681e2ed0bc3663717273a1b9b3ef12
 size 9048

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:48f9da5a901cd8a83a192cb0b23831aef7064f83594da6391a6d22c5bbece41d
 size 28134

 version https://git-lfs.github.com/spec/v1
+oid sha256:3a9285a5e0e1816273de107fab9026259478a32528f645b209923a81b449ca3d
 size 28134

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:89dbad7a5f4eb47d4580585d91b020d1a7f5dc2fd4d54175561c1eb48d2175e4
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:3371d8262583e71fbd2dbc164d88e0c7a9f17a572e2f30bb0e3d8e809fca6486
 size 14244

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -10,17 +10,17 @@
   "log_history": [
     {
       "epoch": 0.0002666666666666667,
-      "grad_norm": 0.017614251002669334,
       "learning_rate": 0.0,
       "loss": 11.9308,
       "step": 1
     },
     {
       "epoch": 0.0002666666666666667,
-      "eval_loss": 11.933882713317871,
-      "eval_runtime": 0.0632,
-      "eval_samples_per_second": 253.161,
-      "eval_steps_per_second": 63.29,
       "step": 1
     }
   ],

   "log_history": [
     {
       "epoch": 0.0002666666666666667,
+      "grad_norm": 0.013214402832090855,
       "learning_rate": 0.0,
       "loss": 11.9308,
       "step": 1
     },
     {
       "epoch": 0.0002666666666666667,
+      "eval_loss": 11.933879852294922,
+      "eval_runtime": 0.0614,
+      "eval_samples_per_second": 260.741,
+      "eval_steps_per_second": 65.185,
       "step": 1
     }
   ],

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:036ac85e644f5a97a1e6a8b7720093190f99c85da2a80125627e2a2e734ddb76
 size 6776

 version https://git-lfs.github.com/spec/v1
+oid sha256:9e1debdbe4095d32d1d33ca4aa71553472896ec45d93796674ecc45e1e93db66
 size 6776