spktsagar commited on Oct 25, 2022

Commit

2177a54

•

1 Parent(s): eeefdd1

End of training

Browse files

Files changed (20) hide show

checkpoint-19200/config.json +0 -108
checkpoint-19200/optimizer.pt +0 -3
checkpoint-19200/preprocessor_config.json +0 -10
checkpoint-19200/pytorch_model.bin +0 -3
checkpoint-19200/rng_state.pth +0 -3
checkpoint-19200/scaler.pt +0 -3
checkpoint-19200/scheduler.pt +0 -3
checkpoint-19200/trainer_state.json +0 -376
checkpoint-19200/training_args.bin +0 -3
last-checkpoint/config.json +0 -108
last-checkpoint/optimizer.pt +0 -3
last-checkpoint/preprocessor_config.json +0 -10
last-checkpoint/pytorch_model.bin +0 -3
last-checkpoint/rng_state.pth +0 -3
last-checkpoint/scaler.pt +0 -3
last-checkpoint/scheduler.pt +0 -3
last-checkpoint/trainer_state.json +0 -391
last-checkpoint/training_args.bin +0 -3
pytorch_model.bin +1 -1
runs/Oct25_06-20-16_bff6b2401ae2/events.out.tfevents.1666679480.bff6b2401ae2.76.0 +2 -2

checkpoint-19200/config.json DELETED Viewed

@@ -1,108 +0,0 @@
-{
-  "_name_or_path": "facebook/wav2vec2-xls-r-300m",
-  "activation_dropout": 0.0,
-  "adapter_kernel_size": 3,
-  "adapter_stride": 2,
-  "add_adapter": false,
-  "apply_spec_augment": true,
-  "architectures": [
-    "Wav2Vec2ForCTC"
-  ],
-  "attention_dropout": 0.1,
-  "bos_token_id": 1,
-  "classifier_proj_size": 256,
-  "codevector_dim": 768,
-  "contrastive_logits_temperature": 0.1,
-  "conv_bias": true,
-  "conv_dim": [
-    512,
-    512,
-    512,
-    512,
-    512,
-    512,
-    512
-  ],
-  "conv_kernel": [
-    10,
-    3,
-    3,
-    3,
-    3,
-    2,
-    2
-  ],
-  "conv_stride": [
-    5,
-    2,
-    2,
-    2,
-    2,
-    2,
-    2
-  ],
-  "ctc_loss_reduction": "mean",
-  "ctc_zero_infinity": false,
-  "diversity_loss_weight": 0.1,
-  "do_stable_layer_norm": true,
-  "eos_token_id": 2,
-  "feat_extract_activation": "gelu",
-  "feat_extract_dropout": 0.0,
-  "feat_extract_norm": "layer",
-  "feat_proj_dropout": 0.0,
-  "feat_quantizer_dropout": 0.0,
-  "final_dropout": 0.0,
-  "gradient_checkpointing": false,
-  "hidden_act": "gelu",
-  "hidden_dropout": 0.1,
-  "hidden_size": 1024,
-  "initializer_range": 0.02,
-  "intermediate_size": 4096,
-  "layer_norm_eps": 1e-05,
-  "layerdrop": 0.1,
-  "mask_feature_length": 10,
-  "mask_feature_min_masks": 0,
-  "mask_feature_prob": 0.0,
-  "mask_time_length": 10,
-  "mask_time_min_masks": 2,
-  "mask_time_prob": 0.075,
-  "model_type": "wav2vec2",
-  "num_adapter_layers": 3,
-  "num_attention_heads": 16,
-  "num_codevector_groups": 2,
-  "num_codevectors_per_group": 320,
-  "num_conv_pos_embedding_groups": 16,
-  "num_conv_pos_embeddings": 128,
-  "num_feat_extract_layers": 7,
-  "num_hidden_layers": 24,
-  "num_negatives": 100,
-  "output_hidden_size": 1024,
-  "pad_token_id": 0,
-  "proj_codevector_dim": 768,
-  "tdnn_dilation": [
-    1,
-    2,
-    3,
-    1,
-    1
-  ],
-  "tdnn_dim": [
-    512,
-    512,
-    512,
-    512,
-    1500
-  ],
-  "tdnn_kernel": [
-    5,
-    3,
-    3,
-    1,
-    1
-  ],
-  "torch_dtype": "float32",
-  "transformers_version": "4.23.1",
-  "use_weighted_layer_sum": false,
-  "vocab_size": 81,
-  "xvector_output_dim": 512
-}

checkpoint-19200/optimizer.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:834c5ff295f7f1df53c6d9687e553c9bf7dd0991c2530713b29fecad3f54e284
-size 2490723217

checkpoint-19200/preprocessor_config.json DELETED Viewed

@@ -1,10 +0,0 @@
-{
-  "do_normalize": true,
-  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
-  "feature_size": 1,
-  "padding_side": "right",
-  "padding_value": 0.0,
-  "processor_class": "Wav2Vec2Processor",
-  "return_attention_mask": true,
-  "sampling_rate": 16000
-}

checkpoint-19200/pytorch_model.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:9c4bb4fcdb67f48f8028ad3f2a493e0faf48c3ef7b1d4c5986fac02e105f9028
-size 1262230833

checkpoint-19200/rng_state.pth DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:7c8d8c967a6e9e5e4492e1006e625f456f1918f58a9d4ef46b7e38183148583b
-size 14631

checkpoint-19200/scaler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:f3f1f110e80b2edf9f311023173d89ed6f3902778757d1932fa61c8e74edfeee
-size 559

checkpoint-19200/scheduler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:4fe0534b83f59954fab93d5e10f63485b64ac071549242e75e4e04a529302f21
-size 623

checkpoint-19200/trainer_state.json DELETED Viewed

@@ -1,376 +0,0 @@
-{
-  "best_metric": 0.23517574892083995,
-  "best_model_checkpoint": "wav2vec2-large-xls-r-300m-nepali-openslr/checkpoint-19200",
-  "epoch": 5.02091776702837,
-  "global_step": 19200,
-  "is_hyper_param_search": false,
-  "is_local_process_zero": true,
-  "is_world_process_zero": true,
-  "log_history": [
-    {
-      "epoch": 0.21,
-      "learning_rate": 0.0002976391096979332,
-      "loss": 6.4525,
-      "step": 800
-    },
-    {
-      "epoch": 0.21,
-      "eval_loss": 1.4264159202575684,
-      "eval_runtime": 579.6055,
-      "eval_samples_per_second": 37.262,
-      "eval_steps_per_second": 4.658,
-      "eval_wer": 0.9522086267891338,
-      "step": 800
-    },
-    {
-      "epoch": 0.42,
-      "learning_rate": 0.00029127980922098566,
-      "loss": 1.105,
-      "step": 1600
-    },
-    {
-      "epoch": 0.42,
-      "eval_loss": 0.5966897010803223,
-      "eval_runtime": 638.739,
-      "eval_samples_per_second": 33.812,
-      "eval_steps_per_second": 4.227,
-      "eval_wer": 0.6514394209860115,
-      "step": 1600
-    },
-    {
-      "epoch": 0.63,
-      "learning_rate": 0.00028492050874403814,
-      "loss": 0.7933,
-      "step": 2400
-    },
-    {
-      "epoch": 0.63,
-      "eval_loss": 0.44666677713394165,
-      "eval_runtime": 578.27,
-      "eval_samples_per_second": 37.348,
-      "eval_steps_per_second": 4.669,
-      "eval_wer": 0.5045276037778715,
-      "step": 2400
-    },
-    {
-      "epoch": 0.84,
-      "learning_rate": 0.00027856120826709056,
-      "loss": 0.6926,
-      "step": 3200
-    },
-    {
-      "epoch": 0.84,
-      "eval_loss": 0.3889370858669281,
-      "eval_runtime": 574.1787,
-      "eval_samples_per_second": 37.614,
-      "eval_steps_per_second": 4.702,
-      "eval_wer": 0.4508941611762033,
-      "step": 3200
-    },
-    {
-      "epoch": 1.05,
-      "learning_rate": 0.0002722019077901431,
-      "loss": 0.6258,
-      "step": 4000
-    },
-    {
-      "epoch": 1.05,
-      "eval_loss": 0.33456486463546753,
-      "eval_runtime": 575.0581,
-      "eval_samples_per_second": 37.556,
-      "eval_steps_per_second": 4.695,
-      "eval_wer": 0.39778001363149523,
-      "step": 4000
-    },
-    {
-      "epoch": 1.26,
-      "learning_rate": 0.0002658426073131955,
-      "loss": 0.5666,
-      "step": 4800
-    },
-    {
-      "epoch": 1.26,
-      "eval_loss": 0.31256240606307983,
-      "eval_runtime": 592.8115,
-      "eval_samples_per_second": 36.431,
-      "eval_steps_per_second": 4.555,
-      "eval_wer": 0.3761481289149979,
-      "step": 4800
-    },
-    {
-      "epoch": 1.46,
-      "learning_rate": 0.000259483306836248,
-      "loss": 0.5501,
-      "step": 5600
-    },
-    {
-      "epoch": 1.46,
-      "eval_loss": 0.2980588376522064,
-      "eval_runtime": 662.1285,
-      "eval_samples_per_second": 32.618,
-      "eval_steps_per_second": 4.078,
-      "eval_wer": 0.3593684073869722,
-      "step": 5600
-    },
-    {
-      "epoch": 1.67,
-      "learning_rate": 0.00025313195548489663,
-      "loss": 0.5275,
-      "step": 6400
-    },
-    {
-      "epoch": 1.67,
-      "eval_loss": 0.28137603402137756,
-      "eval_runtime": 588.9138,
-      "eval_samples_per_second": 36.673,
-      "eval_steps_per_second": 4.585,
-      "eval_wer": 0.3457206841712375,
-      "step": 6400
-    },
-    {
-      "epoch": 1.88,
-      "learning_rate": 0.0002467726550079491,
-      "loss": 0.5203,
-      "step": 7200
-    },
-    {
-      "epoch": 1.88,
-      "eval_loss": 0.2654956877231598,
-      "eval_runtime": 586.4688,
-      "eval_samples_per_second": 36.825,
-      "eval_steps_per_second": 4.604,
-      "eval_wer": 0.3303041121677323,
-      "step": 7200
-    },
-    {
-      "epoch": 2.09,
-      "learning_rate": 0.00024041335453100157,
-      "loss": 0.4842,
-      "step": 8000
-    },
-    {
-      "epoch": 2.09,
-      "eval_loss": 0.2574324607849121,
-      "eval_runtime": 641.5915,
-      "eval_samples_per_second": 33.662,
-      "eval_steps_per_second": 4.208,
-      "eval_wer": 0.31566648274966735,
-      "step": 8000
-    },
-    {
-      "epoch": 2.3,
-      "learning_rate": 0.00023405405405405404,
-      "loss": 0.4542,
-      "step": 8800
-    },
-    {
-      "epoch": 2.3,
-      "eval_loss": 0.2577317953109741,
-      "eval_runtime": 583.455,
-      "eval_samples_per_second": 37.016,
-      "eval_steps_per_second": 4.628,
-      "eval_wer": 0.31417350946090683,
-      "step": 8800
-    },
-    {
-      "epoch": 2.51,
-      "learning_rate": 0.0002276947535771065,
-      "loss": 0.4431,
-      "step": 9600
-    },
-    {
-      "epoch": 2.51,
-      "eval_loss": 0.23904646933078766,
-      "eval_runtime": 581.9022,
-      "eval_samples_per_second": 37.114,
-      "eval_steps_per_second": 4.64,
-      "eval_wer": 0.2938236344162799,
-      "step": 9600
-    },
-    {
-      "epoch": 2.72,
-      "learning_rate": 0.00022133545310015898,
-      "loss": 0.4235,
-      "step": 10400
-    },
-    {
-      "epoch": 2.72,
-      "eval_loss": 0.24016053974628448,
-      "eval_runtime": 582.7306,
-      "eval_samples_per_second": 37.062,
-      "eval_steps_per_second": 4.633,
-      "eval_wer": 0.2884684041413781,
-      "step": 10400
-    },
-    {
-      "epoch": 2.93,
-      "learning_rate": 0.0002149920508744038,
-      "loss": 0.4202,
-      "step": 11200
-    },
-    {
-      "epoch": 2.93,
-      "eval_loss": 0.22816315293312073,
-      "eval_runtime": 643.2534,
-      "eval_samples_per_second": 33.575,
-      "eval_steps_per_second": 4.197,
-      "eval_wer": 0.2846710590373568,
-      "step": 11200
-    },
-    {
-      "epoch": 3.14,
-      "learning_rate": 0.00020863275039745627,
-      "loss": 0.4018,
-      "step": 12000
-    },
-    {
-      "epoch": 3.14,
-      "eval_loss": 0.22759725153446198,
-      "eval_runtime": 584.1242,
-      "eval_samples_per_second": 36.973,
-      "eval_steps_per_second": 4.622,
-      "eval_wer": 0.27702768491772417,
-      "step": 12000
-    },
-    {
-      "epoch": 3.35,
-      "learning_rate": 0.00020227344992050872,
-      "loss": 0.3986,
-      "step": 12800
-    },
-    {
-      "epoch": 3.35,
-      "eval_loss": 0.224422425031662,
-      "eval_runtime": 582.249,
-      "eval_samples_per_second": 37.092,
-      "eval_steps_per_second": 4.637,
-      "eval_wer": 0.27022816526565185,
-      "step": 12800
-    },
-    {
-      "epoch": 3.56,
-      "learning_rate": 0.00019591414944356117,
-      "loss": 0.3792,
-      "step": 13600
-    },
-    {
-      "epoch": 3.56,
-      "eval_loss": 0.21611596643924713,
-      "eval_runtime": 589.0669,
-      "eval_samples_per_second": 36.663,
-      "eval_steps_per_second": 4.584,
-      "eval_wer": 0.2742527019570932,
-      "step": 13600
-    },
-    {
-      "epoch": 3.77,
-      "learning_rate": 0.00018955484896661365,
-      "loss": 0.3736,
-      "step": 14400
-    },
-    {
-      "epoch": 3.77,
-      "eval_loss": 0.20533400774002075,
-      "eval_runtime": 644.3789,
-      "eval_samples_per_second": 33.516,
-      "eval_steps_per_second": 4.19,
-      "eval_wer": 0.2546979974684366,
-      "step": 14400
-    },
-    {
-      "epoch": 3.97,
-      "learning_rate": 0.0001831955484896661,
-      "loss": 0.37,
-      "step": 15200
-    },
-    {
-      "epoch": 3.97,
-      "eval_loss": 0.19958257675170898,
-      "eval_runtime": 585.9573,
-      "eval_samples_per_second": 36.858,
-      "eval_steps_per_second": 4.608,
-      "eval_wer": 0.25521729252539677,
-      "step": 15200
-    },
-    {
-      "epoch": 4.18,
-      "learning_rate": 0.00017683624801271858,
-      "loss": 0.3499,
-      "step": 16000
-    },
-    {
-      "epoch": 4.18,
-      "eval_loss": 0.19865886867046356,
-      "eval_runtime": 587.8211,
-      "eval_samples_per_second": 36.741,
-      "eval_steps_per_second": 4.593,
-      "eval_wer": 0.24392262503651294,
-      "step": 16000
-    },
-    {
-      "epoch": 4.39,
-      "learning_rate": 0.00017048489666136724,
-      "loss": 0.3416,
-      "step": 16800
-    },
-    {
-      "epoch": 4.39,
-      "eval_loss": 0.1961081475019455,
-      "eval_runtime": 586.8214,
-      "eval_samples_per_second": 36.803,
-      "eval_steps_per_second": 4.601,
-      "eval_wer": 0.24739541072993412,
-      "step": 16800
-    },
-    {
-      "epoch": 4.6,
-      "learning_rate": 0.0001641255961844197,
-      "loss": 0.3329,
-      "step": 17600
-    },
-    {
-      "epoch": 4.6,
-      "eval_loss": 0.19132652878761292,
-      "eval_runtime": 586.4075,
-      "eval_samples_per_second": 36.829,
-      "eval_steps_per_second": 4.604,
-      "eval_wer": 0.2405309791957418,
-      "step": 17600
-    },
-    {
-      "epoch": 4.81,
-      "learning_rate": 0.00015776629570747217,
-      "loss": 0.3204,
-      "step": 18400
-    },
-    {
-      "epoch": 4.81,
-      "eval_loss": 0.18798914551734924,
-      "eval_runtime": 588.6226,
-      "eval_samples_per_second": 36.691,
-      "eval_steps_per_second": 4.587,
-      "eval_wer": 0.23799941579306091,
-      "step": 18400
-    },
-    {
-      "epoch": 5.02,
-      "learning_rate": 0.00015141494435612083,
-      "loss": 0.3117,
-      "step": 19200
-    },
-    {
-      "epoch": 5.02,
-      "eval_loss": 0.18481141328811646,
-      "eval_runtime": 585.979,
-      "eval_samples_per_second": 36.856,
-      "eval_steps_per_second": 4.608,
-      "eval_wer": 0.23517574892083995,
-      "step": 19200
-    }
-  ],
-  "max_steps": 38240,
-  "num_train_epochs": 10,
-  "total_flos": 6.100890396776682e+19,
-  "trial_name": null,
-  "trial_params": null
-}

checkpoint-19200/training_args.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:31e3c175fd50bde371825bf0b97d26832d8c09f88fd4ed0f1b39527ddcd362ad
-size 3439

last-checkpoint/config.json DELETED Viewed

@@ -1,108 +0,0 @@
-{
-  "_name_or_path": "facebook/wav2vec2-xls-r-300m",
-  "activation_dropout": 0.0,
-  "adapter_kernel_size": 3,
-  "adapter_stride": 2,
-  "add_adapter": false,
-  "apply_spec_augment": true,
-  "architectures": [
-    "Wav2Vec2ForCTC"
-  ],
-  "attention_dropout": 0.1,
-  "bos_token_id": 1,
-  "classifier_proj_size": 256,
-  "codevector_dim": 768,
-  "contrastive_logits_temperature": 0.1,
-  "conv_bias": true,
-  "conv_dim": [
-    512,
-    512,
-    512,
-    512,
-    512,
-    512,
-    512
-  ],
-  "conv_kernel": [
-    10,
-    3,
-    3,
-    3,
-    3,
-    2,
-    2
-  ],
-  "conv_stride": [
-    5,
-    2,
-    2,
-    2,
-    2,
-    2,
-    2
-  ],
-  "ctc_loss_reduction": "mean",
-  "ctc_zero_infinity": false,
-  "diversity_loss_weight": 0.1,
-  "do_stable_layer_norm": true,
-  "eos_token_id": 2,
-  "feat_extract_activation": "gelu",
-  "feat_extract_dropout": 0.0,
-  "feat_extract_norm": "layer",
-  "feat_proj_dropout": 0.0,
-  "feat_quantizer_dropout": 0.0,
-  "final_dropout": 0.0,
-  "gradient_checkpointing": false,
-  "hidden_act": "gelu",
-  "hidden_dropout": 0.1,
-  "hidden_size": 1024,
-  "initializer_range": 0.02,
-  "intermediate_size": 4096,
-  "layer_norm_eps": 1e-05,
-  "layerdrop": 0.1,
-  "mask_feature_length": 10,
-  "mask_feature_min_masks": 0,
-  "mask_feature_prob": 0.0,
-  "mask_time_length": 10,
-  "mask_time_min_masks": 2,
-  "mask_time_prob": 0.075,
-  "model_type": "wav2vec2",
-  "num_adapter_layers": 3,
-  "num_attention_heads": 16,
-  "num_codevector_groups": 2,
-  "num_codevectors_per_group": 320,
-  "num_conv_pos_embedding_groups": 16,
-  "num_conv_pos_embeddings": 128,
-  "num_feat_extract_layers": 7,
-  "num_hidden_layers": 24,
-  "num_negatives": 100,
-  "output_hidden_size": 1024,
-  "pad_token_id": 0,
-  "proj_codevector_dim": 768,
-  "tdnn_dilation": [
-    1,
-    2,
-    3,
-    1,
-    1
-  ],
-  "tdnn_dim": [
-    512,
-    512,
-    512,
-    512,
-    1500
-  ],
-  "tdnn_kernel": [
-    5,
-    3,
-    3,
-    1,
-    1
-  ],
-  "torch_dtype": "float32",
-  "transformers_version": "4.23.1",
-  "use_weighted_layer_sum": false,
-  "vocab_size": 81,
-  "xvector_output_dim": 512
-}

last-checkpoint/optimizer.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:fba3acb5ecbe94c1576fd9914bd973cf2fa45508e0f8c9164b1beeba73118144
-size 2490723217

last-checkpoint/preprocessor_config.json DELETED Viewed

@@ -1,10 +0,0 @@
-{
-  "do_normalize": true,
-  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
-  "feature_size": 1,
-  "padding_side": "right",
-  "padding_value": 0.0,
-  "processor_class": "Wav2Vec2Processor",
-  "return_attention_mask": true,
-  "sampling_rate": 16000
-}

last-checkpoint/pytorch_model.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:0df4edf58f65959141f56e1f6679a632f3312af3da4a8c00edfdeb920d8e459a
-size 1262230833

last-checkpoint/rng_state.pth DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:59e1caac69f016ac32929cfe8935015eebe880025110ff7ee89ccee15a68d058
-size 14567

last-checkpoint/scaler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:1b3592fa86201008f469b3f5e8c000cbbf2e08291a5c3cd3a71c62c52785470e
-size 559

last-checkpoint/scheduler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:a55d794266f98fd329b7cbc7f6d0e16155137272725556481cb011a7548f6a73
-size 623

last-checkpoint/trainer_state.json DELETED Viewed

@@ -1,391 +0,0 @@
-{
-  "best_metric": 0.23517574892083995,
-  "best_model_checkpoint": "wav2vec2-large-xls-r-300m-nepali-openslr/checkpoint-19200",
-  "epoch": 5.230095437312067,
-  "global_step": 20000,
-  "is_hyper_param_search": false,
-  "is_local_process_zero": true,
-  "is_world_process_zero": true,
-  "log_history": [
-    {
-      "epoch": 0.21,
-      "learning_rate": 0.0002976391096979332,
-      "loss": 6.4525,
-      "step": 800
-    },
-    {
-      "epoch": 0.21,
-      "eval_loss": 1.4264159202575684,
-      "eval_runtime": 579.6055,
-      "eval_samples_per_second": 37.262,
-      "eval_steps_per_second": 4.658,
-      "eval_wer": 0.9522086267891338,
-      "step": 800
-    },
-    {
-      "epoch": 0.42,
-      "learning_rate": 0.00029127980922098566,
-      "loss": 1.105,
-      "step": 1600
-    },
-    {
-      "epoch": 0.42,
-      "eval_loss": 0.5966897010803223,
-      "eval_runtime": 638.739,
-      "eval_samples_per_second": 33.812,
-      "eval_steps_per_second": 4.227,
-      "eval_wer": 0.6514394209860115,
-      "step": 1600
-    },
-    {
-      "epoch": 0.63,
-      "learning_rate": 0.00028492050874403814,
-      "loss": 0.7933,
-      "step": 2400
-    },
-    {
-      "epoch": 0.63,
-      "eval_loss": 0.44666677713394165,
-      "eval_runtime": 578.27,
-      "eval_samples_per_second": 37.348,
-      "eval_steps_per_second": 4.669,
-      "eval_wer": 0.5045276037778715,
-      "step": 2400
-    },
-    {
-      "epoch": 0.84,
-      "learning_rate": 0.00027856120826709056,
-      "loss": 0.6926,
-      "step": 3200
-    },
-    {
-      "epoch": 0.84,
-      "eval_loss": 0.3889370858669281,
-      "eval_runtime": 574.1787,
-      "eval_samples_per_second": 37.614,
-      "eval_steps_per_second": 4.702,
-      "eval_wer": 0.4508941611762033,
-      "step": 3200
-    },
-    {
-      "epoch": 1.05,
-      "learning_rate": 0.0002722019077901431,
-      "loss": 0.6258,
-      "step": 4000
-    },
-    {
-      "epoch": 1.05,
-      "eval_loss": 0.33456486463546753,
-      "eval_runtime": 575.0581,
-      "eval_samples_per_second": 37.556,
-      "eval_steps_per_second": 4.695,
-      "eval_wer": 0.39778001363149523,
-      "step": 4000
-    },
-    {
-      "epoch": 1.26,
-      "learning_rate": 0.0002658426073131955,
-      "loss": 0.5666,
-      "step": 4800
-    },
-    {
-      "epoch": 1.26,
-      "eval_loss": 0.31256240606307983,
-      "eval_runtime": 592.8115,
-      "eval_samples_per_second": 36.431,
-      "eval_steps_per_second": 4.555,
-      "eval_wer": 0.3761481289149979,
-      "step": 4800
-    },
-    {
-      "epoch": 1.46,
-      "learning_rate": 0.000259483306836248,
-      "loss": 0.5501,
-      "step": 5600
-    },
-    {
-      "epoch": 1.46,
-      "eval_loss": 0.2980588376522064,
-      "eval_runtime": 662.1285,
-      "eval_samples_per_second": 32.618,
-      "eval_steps_per_second": 4.078,
-      "eval_wer": 0.3593684073869722,
-      "step": 5600
-    },
-    {
-      "epoch": 1.67,
-      "learning_rate": 0.00025313195548489663,
-      "loss": 0.5275,
-      "step": 6400
-    },
-    {
-      "epoch": 1.67,
-      "eval_loss": 0.28137603402137756,
-      "eval_runtime": 588.9138,
-      "eval_samples_per_second": 36.673,
-      "eval_steps_per_second": 4.585,
-      "eval_wer": 0.3457206841712375,
-      "step": 6400
-    },
-    {
-      "epoch": 1.88,
-      "learning_rate": 0.0002467726550079491,
-      "loss": 0.5203,
-      "step": 7200
-    },
-    {
-      "epoch": 1.88,
-      "eval_loss": 0.2654956877231598,
-      "eval_runtime": 586.4688,
-      "eval_samples_per_second": 36.825,
-      "eval_steps_per_second": 4.604,
-      "eval_wer": 0.3303041121677323,
-      "step": 7200
-    },
-    {
-      "epoch": 2.09,
-      "learning_rate": 0.00024041335453100157,
-      "loss": 0.4842,
-      "step": 8000
-    },
-    {
-      "epoch": 2.09,
-      "eval_loss": 0.2574324607849121,
-      "eval_runtime": 641.5915,
-      "eval_samples_per_second": 33.662,
-      "eval_steps_per_second": 4.208,
-      "eval_wer": 0.31566648274966735,
-      "step": 8000
-    },
-    {
-      "epoch": 2.3,
-      "learning_rate": 0.00023405405405405404,
-      "loss": 0.4542,
-      "step": 8800
-    },
-    {
-      "epoch": 2.3,
-      "eval_loss": 0.2577317953109741,
-      "eval_runtime": 583.455,
-      "eval_samples_per_second": 37.016,
-      "eval_steps_per_second": 4.628,
-      "eval_wer": 0.31417350946090683,
-      "step": 8800
-    },
-    {
-      "epoch": 2.51,
-      "learning_rate": 0.0002276947535771065,
-      "loss": 0.4431,
-      "step": 9600
-    },
-    {
-      "epoch": 2.51,
-      "eval_loss": 0.23904646933078766,
-      "eval_runtime": 581.9022,
-      "eval_samples_per_second": 37.114,
-      "eval_steps_per_second": 4.64,
-      "eval_wer": 0.2938236344162799,
-      "step": 9600
-    },
-    {
-      "epoch": 2.72,
-      "learning_rate": 0.00022133545310015898,
-      "loss": 0.4235,
-      "step": 10400
-    },
-    {
-      "epoch": 2.72,
-      "eval_loss": 0.24016053974628448,
-      "eval_runtime": 582.7306,
-      "eval_samples_per_second": 37.062,
-      "eval_steps_per_second": 4.633,
-      "eval_wer": 0.2884684041413781,
-      "step": 10400
-    },
-    {
-      "epoch": 2.93,
-      "learning_rate": 0.0002149920508744038,
-      "loss": 0.4202,
-      "step": 11200
-    },
-    {
-      "epoch": 2.93,
-      "eval_loss": 0.22816315293312073,
-      "eval_runtime": 643.2534,
-      "eval_samples_per_second": 33.575,
-      "eval_steps_per_second": 4.197,
-      "eval_wer": 0.2846710590373568,
-      "step": 11200
-    },
-    {
-      "epoch": 3.14,
-      "learning_rate": 0.00020863275039745627,
-      "loss": 0.4018,
-      "step": 12000
-    },
-    {
-      "epoch": 3.14,
-      "eval_loss": 0.22759725153446198,
-      "eval_runtime": 584.1242,
-      "eval_samples_per_second": 36.973,
-      "eval_steps_per_second": 4.622,
-      "eval_wer": 0.27702768491772417,
-      "step": 12000
-    },
-    {
-      "epoch": 3.35,
-      "learning_rate": 0.00020227344992050872,
-      "loss": 0.3986,
-      "step": 12800
-    },
-    {
-      "epoch": 3.35,
-      "eval_loss": 0.224422425031662,
-      "eval_runtime": 582.249,
-      "eval_samples_per_second": 37.092,
-      "eval_steps_per_second": 4.637,
-      "eval_wer": 0.27022816526565185,
-      "step": 12800
-    },
-    {
-      "epoch": 3.56,
-      "learning_rate": 0.00019591414944356117,
-      "loss": 0.3792,
-      "step": 13600
-    },
-    {
-      "epoch": 3.56,
-      "eval_loss": 0.21611596643924713,
-      "eval_runtime": 589.0669,
-      "eval_samples_per_second": 36.663,
-      "eval_steps_per_second": 4.584,
-      "eval_wer": 0.2742527019570932,
-      "step": 13600
-    },
-    {
-      "epoch": 3.77,
-      "learning_rate": 0.00018955484896661365,
-      "loss": 0.3736,
-      "step": 14400
-    },
-    {
-      "epoch": 3.77,
-      "eval_loss": 0.20533400774002075,
-      "eval_runtime": 644.3789,
-      "eval_samples_per_second": 33.516,
-      "eval_steps_per_second": 4.19,
-      "eval_wer": 0.2546979974684366,
-      "step": 14400
-    },
-    {
-      "epoch": 3.97,
-      "learning_rate": 0.0001831955484896661,
-      "loss": 0.37,
-      "step": 15200
-    },
-    {
-      "epoch": 3.97,
-      "eval_loss": 0.19958257675170898,
-      "eval_runtime": 585.9573,
-      "eval_samples_per_second": 36.858,
-      "eval_steps_per_second": 4.608,
-      "eval_wer": 0.25521729252539677,
-      "step": 15200
-    },
-    {
-      "epoch": 4.18,
-      "learning_rate": 0.00017683624801271858,
-      "loss": 0.3499,
-      "step": 16000
-    },
-    {
-      "epoch": 4.18,
-      "eval_loss": 0.19865886867046356,
-      "eval_runtime": 587.8211,
-      "eval_samples_per_second": 36.741,
-      "eval_steps_per_second": 4.593,
-      "eval_wer": 0.24392262503651294,
-      "step": 16000
-    },
-    {
-      "epoch": 4.39,
-      "learning_rate": 0.00017048489666136724,
-      "loss": 0.3416,
-      "step": 16800
-    },
-    {
-      "epoch": 4.39,
-      "eval_loss": 0.1961081475019455,
-      "eval_runtime": 586.8214,
-      "eval_samples_per_second": 36.803,
-      "eval_steps_per_second": 4.601,
-      "eval_wer": 0.24739541072993412,
-      "step": 16800
-    },
-    {
-      "epoch": 4.6,
-      "learning_rate": 0.0001641255961844197,
-      "loss": 0.3329,
-      "step": 17600
-    },
-    {
-      "epoch": 4.6,
-      "eval_loss": 0.19132652878761292,
-      "eval_runtime": 586.4075,
-      "eval_samples_per_second": 36.829,
-      "eval_steps_per_second": 4.604,
-      "eval_wer": 0.2405309791957418,
-      "step": 17600
-    },
-    {
-      "epoch": 4.81,
-      "learning_rate": 0.00015776629570747217,
-      "loss": 0.3204,
-      "step": 18400
-    },
-    {
-      "epoch": 4.81,
-      "eval_loss": 0.18798914551734924,
-      "eval_runtime": 588.6226,
-      "eval_samples_per_second": 36.691,
-      "eval_steps_per_second": 4.587,
-      "eval_wer": 0.23799941579306091,
-      "step": 18400
-    },
-    {
-      "epoch": 5.02,
-      "learning_rate": 0.00015141494435612083,
-      "loss": 0.3117,
-      "step": 19200
-    },
-    {
-      "epoch": 5.02,
-      "eval_loss": 0.18481141328811646,
-      "eval_runtime": 585.979,
-      "eval_samples_per_second": 36.856,
-      "eval_steps_per_second": 4.608,
-      "eval_wer": 0.23517574892083995,
-      "step": 19200
-    },
-    {
-      "epoch": 5.23,
-      "learning_rate": 0.00014505564387917329,
-      "loss": 0.3047,
-      "step": 20000
-    },
-    {
-      "epoch": 5.23,
-      "eval_loss": 0.18402975797653198,
-      "eval_runtime": 599.835,
-      "eval_samples_per_second": 36.005,
-      "eval_steps_per_second": 4.501,
-      "eval_wer": 0.23626302294635032,
-      "step": 20000
-    }
-  ],
-  "max_steps": 38240,
-  "num_train_epochs": 10,
-  "total_flos": 6.354740715850295e+19,
-  "trial_name": null,
-  "trial_params": null
-}

last-checkpoint/training_args.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:037dd272920861623d6bc3135be9cc30f9bde00519d31349fd89a53eb0dda9a2
-size 3439

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0df4edf58f65959141f56e1f6679a632f3312af3da4a8c00edfdeb920d8e459a
 size 1262230833

 version https://git-lfs.github.com/spec/v1
+oid sha256:ef42848298c4b318e8e604147157d60754b7a8a5fef300f65d9319698aaa4c09
 size 1262230833

runs/Oct25_06-20-16_bff6b2401ae2/events.out.tfevents.1666679480.bff6b2401ae2.76.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:44628b1b36d32510ff015e83f7dd554119e9e87ed00e681dbc95011f2e2003f0
-size 5694

 version https://git-lfs.github.com/spec/v1
+oid sha256:391b61b16451a4fb7be5579607af65043c99c61ac2d76f86edd8d923ca472d39
+size 7630