Training in progress, step 25, checkpoint

fc24a87 verified 30 days ago

4.96 kB

	{
	"best_metric": null,
	"best_model_checkpoint": null,
	"epoch": 1.4311270125223614,
	"eval_steps": 25,
	"global_step": 25,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.057245080500894455,
	"grad_norm": NaN,
	"learning_rate": 5e-05,
	"loss": 14103756.0,
	"step": 1
	},
	{
	"epoch": 0.057245080500894455,
	"eval_loss": NaN,
	"eval_runtime": 3.9235,
	"eval_samples_per_second": 12.744,
	"eval_steps_per_second": 3.313,
	"step": 1
	},
	{
	"epoch": 0.11449016100178891,
	"grad_norm": NaN,
	"learning_rate": 0.0001,
	"loss": 0.0,
	"step": 2
	},
	{
	"epoch": 0.17173524150268335,
	"grad_norm": NaN,
	"learning_rate": 9.990365154573717e-05,
	"loss": 0.0,
	"step": 3
	},
	{
	"epoch": 0.22898032200357782,
	"grad_norm": NaN,
	"learning_rate": 9.961501876182148e-05,
	"loss": 0.0,
	"step": 4
	},
	{
	"epoch": 0.28622540250447226,
	"grad_norm": NaN,
	"learning_rate": 9.913533761814537e-05,
	"loss": 0.0,
	"step": 5
	},
	{
	"epoch": 0.3434704830053667,
	"grad_norm": NaN,
	"learning_rate": 9.846666218300807e-05,
	"loss": 0.0,
	"step": 6
	},
	{
	"epoch": 0.4007155635062612,
	"grad_norm": NaN,
	"learning_rate": 9.761185582727977e-05,
	"loss": 0.0,
	"step": 7
	},
	{
	"epoch": 0.45796064400715564,
	"grad_norm": NaN,
	"learning_rate": 9.657457896300791e-05,
	"loss": 0.0,
	"step": 8
	},
	{
	"epoch": 0.5152057245080501,
	"grad_norm": NaN,
	"learning_rate": 9.535927336897098e-05,
	"loss": 0.0,
	"step": 9
	},
	{
	"epoch": 0.5724508050089445,
	"grad_norm": NaN,
	"learning_rate": 9.397114317029975e-05,
	"loss": 0.0,
	"step": 10
	},
	{
	"epoch": 0.629695885509839,
	"grad_norm": NaN,
	"learning_rate": 9.241613255361455e-05,
	"loss": 0.0,
	"step": 11
	},
	{
	"epoch": 0.6869409660107334,
	"grad_norm": NaN,
	"learning_rate": 9.070090031310558e-05,
	"loss": 0.0,
	"step": 12
	},
	{
	"epoch": 0.7441860465116279,
	"grad_norm": NaN,
	"learning_rate": 8.883279133655399e-05,
	"loss": 0.0,
	"step": 13
	},
	{
	"epoch": 0.8014311270125224,
	"grad_norm": NaN,
	"learning_rate": 8.681980515339464e-05,
	"loss": 0.0,
	"step": 14
	},
	{
	"epoch": 0.8586762075134168,
	"grad_norm": NaN,
	"learning_rate": 8.467056167950311e-05,
	"loss": 0.0,
	"step": 15
	},
	{
	"epoch": 0.9159212880143113,
	"grad_norm": NaN,
	"learning_rate": 8.239426430539243e-05,
	"loss": 0.0,
	"step": 16
	},
	{
	"epoch": 0.9731663685152058,
	"grad_norm": NaN,
	"learning_rate": 8.000066048588211e-05,
	"loss": 0.0,
	"step": 17
	},
	{
	"epoch": 1.0304114490161003,
	"grad_norm": NaN,
	"learning_rate": 7.75e-05,
	"loss": 0.0,
	"step": 18
	},
	{
	"epoch": 1.0876565295169947,
	"grad_norm": NaN,
	"learning_rate": 7.490299105985507e-05,
	"loss": 0.0,
	"step": 19
	},
	{
	"epoch": 1.144901610017889,
	"grad_norm": NaN,
	"learning_rate": 7.222075445642904e-05,
	"loss": 0.0,
	"step": 20
	},
	{
	"epoch": 1.2021466905187834,
	"grad_norm": NaN,
	"learning_rate": 6.946477593864228e-05,
	"loss": 0.0,
	"step": 21
	},
	{
	"epoch": 1.259391771019678,
	"grad_norm": NaN,
	"learning_rate": 6.664685702961344e-05,
	"loss": 0.0,
	"step": 22
	},
	{
	"epoch": 1.3166368515205724,
	"grad_norm": NaN,
	"learning_rate": 6.377906449072578e-05,
	"loss": 0.0,
	"step": 23
	},
	{
	"epoch": 1.373881932021467,
	"grad_norm": NaN,
	"learning_rate": 6.087367864990233e-05,
	"loss": 0.0,
	"step": 24
	},
	{
	"epoch": 1.4311270125223614,
	"grad_norm": NaN,
	"learning_rate": 5.794314081535644e-05,
	"loss": 0.0,
	"step": 25
	},
	{
	"epoch": 1.4311270125223614,
	"eval_loss": NaN,
	"eval_runtime": 4.19,
	"eval_samples_per_second": 11.933,
	"eval_steps_per_second": 3.103,
	"step": 25
	}
	],
	"logging_steps": 1,
	"max_steps": 50,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 3,
	"save_steps": 25,
	"stateful_callbacks": {
	"TrainerControl": {
	"args": {
	"should_epoch_stop": false,
	"should_evaluate": false,
	"should_log": false,
	"should_save": true,
	"should_training_stop": false
	},
	"attributes": {}
	}
	},
	"total_flos": 2.993581059871867e+17,
	"train_batch_size": 1,
	"trial_name": null,
	"trial_params": null
	}