evgmaslov
/

Llama-2-7b-hf-fuction-calling-lora

evgmaslov commited on Apr 10

Commit

080ab42

•

1 Parent(s): 774259b

Training in progress, step 20, checkpoint

Files changed (5) hide show

last-checkpoint/adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fb962e6d0d11a523eca444aa3016c5810d1224d8d393cef7af58593b286b8238
 size 67201802

 version https://git-lfs.github.com/spec/v1
+oid sha256:57506f2ec5f5fbf3795e5b55aca16c079cdeae6c931a76d683369e9c04454547
 size 67201802

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b3013b7f71339e10cc71261374a702a9341b240b2c2c67413f72161a6221a055
 size 134433530

 version https://git-lfs.github.com/spec/v1
+oid sha256:6a7c04278a39bd4e46b130581fdd7f5514c8ef922b45e41c167f8c8faddf737f
 size 134433530

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6eafb8374c5fee4ddf303554521f4acb154c70c42b469d5e4e49f8e9de2e273c
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:3e76a7a85a32d26c039a5707071a00913245aa032271177ed81e56c351754849
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ae974be832f5e9032b4ea73354b98b5f681f2934c4572fad751a10189209a2cc
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:2bc30782c80f39b95ece53e16ed533d0eb1d775796dc4d2c39691e355b142ab4
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-  "best_metric": 1.415252447128296,
-  "best_model_checkpoint": "/content/results/checkpoint-10",
-  "epoch": 0.002405002405002405,
   "eval_steps": 10,
-  "global_step": 10,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -22,13 +22,28 @@
       "eval_samples_per_second": 0.762,
       "eval_steps_per_second": 0.762,
       "step": 10
     }
   ],
   "logging_steps": 10,
   "max_steps": 4158,
   "num_train_epochs": 1,
   "save_steps": 10,
-  "total_flos": 341168719331328.0,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 1.3644671440124512,
+  "best_model_checkpoint": "/content/results/checkpoint-20",
+  "epoch": 0.00481000481000481,
   "eval_steps": 10,
+  "global_step": 20,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 0.762,
       "eval_steps_per_second": 0.762,
       "step": 10
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 5.9999999999999995e-05,
+      "loss": 1.3393,
+      "step": 20
+    },
+    {
+      "epoch": 0.0,
+      "eval_jit_compilation_time": 1.867,
+      "eval_loss": 1.3644671440124512,
+      "eval_runtime": 55.1385,
+      "eval_samples_per_second": 0.762,
+      "eval_steps_per_second": 0.762,
+      "step": 20
     }
   ],
   "logging_steps": 10,
   "max_steps": 4158,
   "num_train_epochs": 1,
   "save_steps": 10,
+  "total_flos": 690644086185984.0,
   "trial_name": null,
   "trial_params": null
 }