File size: 3,225 Bytes

e30beec
 
 
a59b04b
f183e36
a59b04b
e30beec
 
 
 
 
f183e36
cfb5bf7
f183e36
 
e30beec
 
 
f183e36
 
cfb5bf7
 
 
e30beec
f183e36
 
 
cfb5bf7
f183e36
 
 
 
 
 
cfb5bf7
f183e36
 
 
 
 
 
cfb5bf7
 
 
 
f183e36
af77302
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
bbb04c1
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
a59b04b
 
 
 
 
 
 
e30beec
 
 
f183e36
e30beec
 
f183e36
e30beec
 
 
 
 
 
 
a59b04b
e30beec
 
 
 
a59b04b
f183e36
e30beec

{
  "best_metric": null,
  "best_model_checkpoint": null,
  "epoch": 0.005608524957936063,
  "eval_steps": 3,
  "global_step": 10,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.0005608524957936063,
      "grad_norm": 0.015782183036208153,
      "learning_rate": 2e-05,
      "loss": 11.9315,
      "step": 1
    },
    {
      "epoch": 0.0005608524957936063,
      "eval_loss": 11.931306838989258,
      "eval_runtime": 2.6509,
      "eval_samples_per_second": 283.304,
      "eval_steps_per_second": 141.841,
      "step": 1
    },
    {
      "epoch": 0.0011217049915872126,
      "grad_norm": 0.008674765937030315,
      "learning_rate": 4e-05,
      "loss": 11.9304,
      "step": 2
    },
    {
      "epoch": 0.0016825574873808188,
      "grad_norm": 0.011539011262357235,
      "learning_rate": 6e-05,
      "loss": 11.9319,
      "step": 3
    },
    {
      "epoch": 0.0016825574873808188,
      "eval_loss": 11.931303977966309,
      "eval_runtime": 2.7142,
      "eval_samples_per_second": 276.693,
      "eval_steps_per_second": 138.531,
      "step": 3
    },
    {
      "epoch": 0.002243409983174425,
      "grad_norm": 0.015656081959605217,
      "learning_rate": 8e-05,
      "loss": 11.9328,
      "step": 4
    },
    {
      "epoch": 0.0028042624789680315,
      "grad_norm": 0.018151914700865746,
      "learning_rate": 0.0001,
      "loss": 11.9248,
      "step": 5
    },
    {
      "epoch": 0.0033651149747616375,
      "grad_norm": 0.008143103681504726,
      "learning_rate": 0.00012,
      "loss": 11.926,
      "step": 6
    },
    {
      "epoch": 0.0033651149747616375,
      "eval_loss": 11.93128776550293,
      "eval_runtime": 2.7487,
      "eval_samples_per_second": 273.223,
      "eval_steps_per_second": 136.793,
      "step": 6
    },
    {
      "epoch": 0.003925967470555244,
      "grad_norm": 0.01095384731888771,
      "learning_rate": 0.00014,
      "loss": 11.9324,
      "step": 7
    },
    {
      "epoch": 0.00448681996634885,
      "grad_norm": 0.005873797461390495,
      "learning_rate": 0.00016,
      "loss": 11.9349,
      "step": 8
    },
    {
      "epoch": 0.005047672462142457,
      "grad_norm": 0.01113384310156107,
      "learning_rate": 0.00018,
      "loss": 11.9287,
      "step": 9
    },
    {
      "epoch": 0.005047672462142457,
      "eval_loss": 11.93126106262207,
      "eval_runtime": 2.6867,
      "eval_samples_per_second": 279.52,
      "eval_steps_per_second": 139.946,
      "step": 9
    },
    {
      "epoch": 0.005608524957936063,
      "grad_norm": 0.008124979212880135,
      "learning_rate": 0.0002,
      "loss": 11.9335,
      "step": 10
    }
  ],
  "logging_steps": 1,
  "max_steps": 10,
  "num_input_tokens_seen": 0,
  "num_train_epochs": 1,
  "save_steps": 3,
  "stateful_callbacks": {
    "TrainerControl": {
      "args": {
        "should_epoch_stop": false,
        "should_evaluate": false,
        "should_log": false,
        "should_save": true,
        "should_training_stop": true
      },
      "attributes": {}
    }
  },
  "total_flos": 1211154432.0,
  "train_batch_size": 2,
  "trial_name": null,
  "trial_params": null
}