Upload folder using huggingface_hub

Browse files

Files changed (16) hide show

README.md +48 -0
checkpoint-4950/config.json +46 -0
checkpoint-4950/model.safetensors +3 -0
checkpoint-4950/optimizer.pt +3 -0
checkpoint-4950/preprocessor_config.json +25 -0
checkpoint-4950/rng_state.pth +3 -0
checkpoint-4950/scheduler.pt +3 -0
checkpoint-4950/trainer_state.json +1558 -0
checkpoint-4950/training_args.bin +3 -0
config.json +46 -0
model.safetensors +3 -0
preprocessor_config.json +25 -0
runs/Nov19_07-08-55_659d872c1556/events.out.tfevents.1732000135.659d872c1556.241.0 +2 -2
runs/Nov19_07-08-55_659d872c1556/events.out.tfevents.1732008067.659d872c1556.241.1 +3 -0
training_args.bin +3 -0
training_params.json +30 -0

README.md ADDED Viewed

	@@ -0,0 +1,48 @@

+---
+tags:
+- autotrain
+- object-detection
+- vision
+base_model: hustvl/yolos-small
+widget:
+- src: https://huggingface.co/datasets/mishig/sample_images/resolve/main/tiger.jpg
+  example_title: Tiger
+- src: https://huggingface.co/datasets/mishig/sample_images/resolve/main/teapot.jpg
+  example_title: Teapot
+- src: https://huggingface.co/datasets/mishig/sample_images/resolve/main/palace.jpg
+  example_title: Palace
+datasets:
+- Francesco/brain-tumor-m2pbp
+---
+# Model Trained Using AutoTrain
+- Problem type: Object Detection
+## Validation Metrics
+loss: 1.1927123069763184
+map: 0.2537
+map_50: 0.502
+map_75: 0.2303
+map_small: 0.0016
+map_medium: 0.1325
+map_large: 0.3796
+mar_1: 0.3388
+mar_10: 0.4646
+mar_100: 0.5012
+mar_small: 0.0456
+mar_medium: 0.4027
+mar_large: 0.678

checkpoint-4950/config.json ADDED Viewed

	@@ -0,0 +1,46 @@

+{
+  "_name_or_path": "hustvl/yolos-small",
+  "architectures": [
+    "YolosForObjectDetection"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "auxiliary_loss": false,
+  "bbox_cost": 5,
+  "bbox_loss_coefficient": 5,
+  "class_cost": 1,
+  "eos_coefficient": 0.1,
+  "giou_cost": 2,
+  "giou_loss_coefficient": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 384,
+  "id2label": {
+    "0": "brain-tumor",
+    "1": "label0",
+    "2": "label1",
+    "3": "label2"
+  },
+  "image_size": [
+    512,
+    864
+  ],
+  "initializer_range": 0.02,
+  "intermediate_size": 1536,
+  "label2id": {
+    "brain-tumor": 0,
+    "label0": 1,
+    "label1": 2,
+    "label2": 3
+  },
+  "layer_norm_eps": 1e-12,
+  "model_type": "yolos",
+  "num_attention_heads": 6,
+  "num_channels": 3,
+  "num_detection_tokens": 100,
+  "num_hidden_layers": 12,
+  "patch_size": 16,
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.46.2",
+  "use_mid_position_embeddings": true
+}

checkpoint-4950/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:91f9a40cd583f7353f09a374ff308a89d686aef6c0682d2edb9a5613668f6ae4
+size 122629292

checkpoint-4950/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:03deecaeaff4b76eee0106b2f956c81cbec2d418a4791edc620fe4e234838a8e
+size 245387514

checkpoint-4950/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,25 @@

+{
+  "do_convert_annotations": true,
+  "do_normalize": true,
+  "do_pad": false,
+  "do_rescale": true,
+  "do_resize": false,
+  "format": "coco_detection",
+  "image_mean": [
+    0.485,
+    0.456,
+    0.406
+  ],
+  "image_processor_type": "YolosImageProcessor",
+  "image_std": [
+    0.229,
+    0.224,
+    0.225
+  ],
+  "pad_size": null,
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "longest_edge": 640
+  }
+}

checkpoint-4950/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d245e05e72192c132e0f2edb6fdcae0c578c890f0fe912f17ec7b0bba2d38cc3
+size 14244

checkpoint-4950/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:21f017fc19796a7674cd02712e672332ba3015a9a7f7596919ebd03e98ecf2d3
+size 1064

checkpoint-4950/trainer_state.json ADDED Viewed

	@@ -0,0 +1,1558 @@

+{
+  "best_metric": 1.1927123069763184,
+  "best_model_checkpoint": "tumor-detect-yolo-small/checkpoint-4950",
+  "epoch": 5.0,
+  "eval_steps": 500,
+  "global_step": 4950,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.025252525252525252,
+      "grad_norm": 215.87857055664062,
+      "learning_rate": 2.2222222222222225e-06,
+      "loss": 3.8856,
+      "step": 25
+    },
+    {
+      "epoch": 0.050505050505050504,
+      "grad_norm": 184.14230346679688,
+      "learning_rate": 4.747474747474747e-06,
+      "loss": 3.4913,
+      "step": 50
+    },
+    {
+      "epoch": 0.07575757575757576,
+      "grad_norm": 73.90482330322266,
+      "learning_rate": 7.272727272727272e-06,
+      "loss": 2.8902,
+      "step": 75
+    },
+    {
+      "epoch": 0.10101010101010101,
+      "grad_norm": 40.390384674072266,
+      "learning_rate": 9.7979797979798e-06,
+      "loss": 2.4434,
+      "step": 100
+    },
+    {
+      "epoch": 0.12626262626262627,
+      "grad_norm": 42.501609802246094,
+      "learning_rate": 1.2323232323232325e-05,
+      "loss": 2.1762,
+      "step": 125
+    },
+    {
+      "epoch": 0.15151515151515152,
+      "grad_norm": 56.84285354614258,
+      "learning_rate": 1.484848484848485e-05,
+      "loss": 1.9959,
+      "step": 150
+    },
+    {
+      "epoch": 0.17676767676767677,
+      "grad_norm": 24.612760543823242,
+      "learning_rate": 1.7373737373737375e-05,
+      "loss": 1.9997,
+      "step": 175
+    },
+    {
+      "epoch": 0.20202020202020202,
+      "grad_norm": 28.1953067779541,
+      "learning_rate": 1.98989898989899e-05,
+      "loss": 1.9539,
+      "step": 200
+    },
+    {
+      "epoch": 0.22727272727272727,
+      "grad_norm": 27.381372451782227,
+      "learning_rate": 2.2323232323232324e-05,
+      "loss": 1.9312,
+      "step": 225
+    },
+    {
+      "epoch": 0.25252525252525254,
+      "grad_norm": 29.632625579833984,
+      "learning_rate": 2.4848484848484847e-05,
+      "loss": 1.89,
+      "step": 250
+    },
+    {
+      "epoch": 0.2777777777777778,
+      "grad_norm": 39.85140609741211,
+      "learning_rate": 2.7373737373737374e-05,
+      "loss": 1.8177,
+      "step": 275
+    },
+    {
+      "epoch": 0.30303030303030304,
+      "grad_norm": 30.56757354736328,
+      "learning_rate": 2.98989898989899e-05,
+      "loss": 1.789,
+      "step": 300
+    },
+    {
+      "epoch": 0.3282828282828283,
+      "grad_norm": 46.40056610107422,
+      "learning_rate": 3.2424242424242423e-05,
+      "loss": 1.7855,
+      "step": 325
+    },
+    {
+      "epoch": 0.35353535353535354,
+      "grad_norm": 27.508628845214844,
+      "learning_rate": 3.494949494949495e-05,
+      "loss": 1.6843,
+      "step": 350
+    },
+    {
+      "epoch": 0.3787878787878788,
+      "grad_norm": 55.3870964050293,
+      "learning_rate": 3.747474747474748e-05,
+      "loss": 1.7921,
+      "step": 375
+    },
+    {
+      "epoch": 0.40404040404040403,
+      "grad_norm": 24.95541000366211,
+      "learning_rate": 4e-05,
+      "loss": 1.78,
+      "step": 400
+    },
+    {
+      "epoch": 0.4292929292929293,
+      "grad_norm": 28.33966636657715,
+      "learning_rate": 4.252525252525253e-05,
+      "loss": 1.6173,
+      "step": 425
+    },
+    {
+      "epoch": 0.45454545454545453,
+      "grad_norm": 27.43466567993164,
+      "learning_rate": 4.5050505050505056e-05,
+      "loss": 1.7889,
+      "step": 450
+    },
+    {
+      "epoch": 0.4797979797979798,
+      "grad_norm": 22.498807907104492,
+      "learning_rate": 4.7575757575757576e-05,
+      "loss": 1.8349,
+      "step": 475
+    },
+    {
+      "epoch": 0.5050505050505051,
+      "grad_norm": 30.1269474029541,
+      "learning_rate": 4.998877665544332e-05,
+      "loss": 1.6779,
+      "step": 500
+    },
+    {
+      "epoch": 0.5303030303030303,
+      "grad_norm": 30.818307876586914,
+      "learning_rate": 4.970819304152638e-05,
+      "loss": 1.7294,
+      "step": 525
+    },
+    {
+      "epoch": 0.5555555555555556,
+      "grad_norm": 25.11827850341797,
+      "learning_rate": 4.942760942760943e-05,
+      "loss": 1.7098,
+      "step": 550
+    },
+    {
+      "epoch": 0.5808080808080808,
+      "grad_norm": 38.30568313598633,
+      "learning_rate": 4.914702581369248e-05,
+      "loss": 1.5827,
+      "step": 575
+    },
+    {
+      "epoch": 0.6060606060606061,
+      "grad_norm": 42.69370651245117,
+      "learning_rate": 4.886644219977554e-05,
+      "loss": 1.6928,
+      "step": 600
+    },
+    {
+      "epoch": 0.6313131313131313,
+      "grad_norm": 12.195549011230469,
+      "learning_rate": 4.858585858585859e-05,
+      "loss": 1.7731,
+      "step": 625
+    },
+    {
+      "epoch": 0.6565656565656566,
+      "grad_norm": 14.210679054260254,
+      "learning_rate": 4.830527497194164e-05,
+      "loss": 1.6602,
+      "step": 650
+    },
+    {
+      "epoch": 0.6818181818181818,
+      "grad_norm": 37.4093132019043,
+      "learning_rate": 4.8024691358024696e-05,
+      "loss": 1.6286,
+      "step": 675
+    },
+    {
+      "epoch": 0.7070707070707071,
+      "grad_norm": 21.867361068725586,
+      "learning_rate": 4.7744107744107746e-05,
+      "loss": 1.6603,
+      "step": 700
+    },
+    {
+      "epoch": 0.7323232323232324,
+      "grad_norm": 25.663557052612305,
+      "learning_rate": 4.74635241301908e-05,
+      "loss": 1.6566,
+      "step": 725
+    },
+    {
+      "epoch": 0.7575757575757576,
+      "grad_norm": 27.501630783081055,
+      "learning_rate": 4.718294051627385e-05,
+      "loss": 1.6502,
+      "step": 750
+    },
+    {
+      "epoch": 0.7828282828282829,
+      "grad_norm": 35.044532775878906,
+      "learning_rate": 4.691358024691358e-05,
+      "loss": 1.5283,
+      "step": 775
+    },
+    {
+      "epoch": 0.8080808080808081,
+      "grad_norm": 38.075992584228516,
+      "learning_rate": 4.6632996632996634e-05,
+      "loss": 1.5263,
+      "step": 800
+    },
+    {
+      "epoch": 0.8333333333333334,
+      "grad_norm": 19.746585845947266,
+      "learning_rate": 4.635241301907969e-05,
+      "loss": 1.6239,
+      "step": 825
+    },
+    {
+      "epoch": 0.8585858585858586,
+      "grad_norm": 33.95107650756836,
+      "learning_rate": 4.607182940516274e-05,
+      "loss": 1.6435,
+      "step": 850
+    },
+    {
+      "epoch": 0.8838383838383839,
+      "grad_norm": 35.092159271240234,
+      "learning_rate": 4.57912457912458e-05,
+      "loss": 1.5883,
+      "step": 875
+    },
+    {
+      "epoch": 0.9090909090909091,
+      "grad_norm": 22.830068588256836,
+      "learning_rate": 4.551066217732884e-05,
+      "loss": 1.5553,
+      "step": 900
+    },
+    {
+      "epoch": 0.9343434343434344,
+      "grad_norm": 34.29344177246094,
+      "learning_rate": 4.52300785634119e-05,
+      "loss": 1.5197,
+      "step": 925
+    },
+    {
+      "epoch": 0.9595959595959596,
+      "grad_norm": 59.63193893432617,
+      "learning_rate": 4.494949494949495e-05,
+      "loss": 1.5119,
+      "step": 950
+    },
+    {
+      "epoch": 0.9848484848484849,
+      "grad_norm": 22.16474151611328,
+      "learning_rate": 4.4668911335578006e-05,
+      "loss": 1.6414,
+      "step": 975
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 1.5094339847564697,
+      "eval_map": 0.1139,
+      "eval_map_50": 0.2748,
+      "eval_map_75": 0.0747,
+      "eval_map_label0": 0.0376,
+      "eval_map_label1": 0.2643,
+      "eval_map_label2": 0.0398,
+      "eval_map_large": 0.1716,
+      "eval_map_medium": 0.0391,
+      "eval_map_small": 0.0013,
+      "eval_mar_1": 0.1849,
+      "eval_mar_10": 0.3107,
+      "eval_mar_100": 0.3439,
+      "eval_mar_100_label0": 0.366,
+      "eval_mar_100_label1": 0.4665,
+      "eval_mar_100_label2": 0.1993,
+      "eval_mar_large": 0.4817,
+      "eval_mar_medium": 0.249,
+      "eval_mar_small": 0.0139,
+      "eval_runtime": 179.4201,
+      "eval_samples_per_second": 11.036,
+      "eval_steps_per_second": 0.691,
+      "step": 990
+    },
+    {
+      "epoch": 1.0101010101010102,
+      "grad_norm": 15.366436958312988,
+      "learning_rate": 4.438832772166106e-05,
+      "loss": 1.5708,
+      "step": 1000
+    },
+    {
+      "epoch": 1.0353535353535352,
+      "grad_norm": 29.506799697875977,
+      "learning_rate": 4.410774410774411e-05,
+      "loss": 1.56,
+      "step": 1025
+    },
+    {
+      "epoch": 1.0606060606060606,
+      "grad_norm": 18.874906539916992,
+      "learning_rate": 4.3827160493827164e-05,
+      "loss": 1.5524,
+      "step": 1050
+    },
+    {
+      "epoch": 1.0858585858585859,
+      "grad_norm": 21.787818908691406,
+      "learning_rate": 4.3546576879910214e-05,
+      "loss": 1.5174,
+      "step": 1075
+    },
+    {
+      "epoch": 1.1111111111111112,
+      "grad_norm": 20.070924758911133,
+      "learning_rate": 4.3265993265993265e-05,
+      "loss": 1.536,
+      "step": 1100
+    },
+    {
+      "epoch": 1.1363636363636362,
+      "grad_norm": 39.67344284057617,
+      "learning_rate": 4.298540965207632e-05,
+      "loss": 1.6004,
+      "step": 1125
+    },
+    {
+      "epoch": 1.1616161616161615,
+      "grad_norm": 22.05341148376465,
+      "learning_rate": 4.270482603815937e-05,
+      "loss": 1.5341,
+      "step": 1150
+    },
+    {
+      "epoch": 1.1868686868686869,
+      "grad_norm": 18.423086166381836,
+      "learning_rate": 4.242424242424243e-05,
+      "loss": 1.5609,
+      "step": 1175
+    },
+    {
+      "epoch": 1.2121212121212122,
+      "grad_norm": 23.607410430908203,
+      "learning_rate": 4.214365881032548e-05,
+      "loss": 1.5443,
+      "step": 1200
+    },
+    {
+      "epoch": 1.2373737373737375,
+      "grad_norm": 26.15247917175293,
+      "learning_rate": 4.186307519640853e-05,
+      "loss": 1.4498,
+      "step": 1225
+    },
+    {
+      "epoch": 1.2626262626262625,
+      "grad_norm": 18.705833435058594,
+      "learning_rate": 4.158249158249159e-05,
+      "loss": 1.4653,
+      "step": 1250
+    },
+    {
+      "epoch": 1.2878787878787878,
+      "grad_norm": 23.05366325378418,
+      "learning_rate": 4.130190796857464e-05,
+      "loss": 1.4813,
+      "step": 1275
+    },
+    {
+      "epoch": 1.3131313131313131,
+      "grad_norm": 17.575767517089844,
+      "learning_rate": 4.1021324354657695e-05,
+      "loss": 1.4978,
+      "step": 1300
+    },
+    {
+      "epoch": 1.3383838383838385,
+      "grad_norm": 15.836087226867676,
+      "learning_rate": 4.074074074074074e-05,
+      "loss": 1.5237,
+      "step": 1325
+    },
+    {
+      "epoch": 1.3636363636363638,
+      "grad_norm": 18.104198455810547,
+      "learning_rate": 4.0460157126823795e-05,
+      "loss": 1.5597,
+      "step": 1350
+    },
+    {
+      "epoch": 1.3888888888888888,
+      "grad_norm": 27.618770599365234,
+      "learning_rate": 4.0179573512906846e-05,
+      "loss": 1.5139,
+      "step": 1375
+    },
+    {
+      "epoch": 1.4141414141414141,
+      "grad_norm": 12.446822166442871,
+      "learning_rate": 3.98989898989899e-05,
+      "loss": 1.557,
+      "step": 1400
+    },
+    {
+      "epoch": 1.4393939393939394,
+      "grad_norm": 32.567569732666016,
+      "learning_rate": 3.961840628507295e-05,
+      "loss": 1.4802,
+      "step": 1425
+    },
+    {
+      "epoch": 1.4646464646464645,
+      "grad_norm": 20.30423355102539,
+      "learning_rate": 3.9337822671156003e-05,
+      "loss": 1.4664,
+      "step": 1450
+    },
+    {
+      "epoch": 1.4898989898989898,
+      "grad_norm": 23.72423553466797,
+      "learning_rate": 3.905723905723906e-05,
+      "loss": 1.4951,
+      "step": 1475
+    },
+    {
+      "epoch": 1.5151515151515151,
+      "grad_norm": 16.151382446289062,
+      "learning_rate": 3.877665544332211e-05,
+      "loss": 1.4668,
+      "step": 1500
+    },
+    {
+      "epoch": 1.5404040404040404,
+      "grad_norm": 15.978365898132324,
+      "learning_rate": 3.849607182940517e-05,
+      "loss": 1.5443,
+      "step": 1525
+    },
+    {
+      "epoch": 1.5656565656565657,
+      "grad_norm": 29.589649200439453,
+      "learning_rate": 3.821548821548822e-05,
+      "loss": 1.4429,
+      "step": 1550
+    },
+    {
+      "epoch": 1.5909090909090908,
+      "grad_norm": 29.138826370239258,
+      "learning_rate": 3.793490460157127e-05,
+      "loss": 1.4719,
+      "step": 1575
+    },
+    {
+      "epoch": 1.6161616161616161,
+      "grad_norm": 14.22740364074707,
+      "learning_rate": 3.7654320987654326e-05,
+      "loss": 1.4467,
+      "step": 1600
+    },
+    {
+      "epoch": 1.6414141414141414,
+      "grad_norm": 13.720157623291016,
+      "learning_rate": 3.7373737373737376e-05,
+      "loss": 1.5102,
+      "step": 1625
+    },
+    {
+      "epoch": 1.6666666666666665,
+      "grad_norm": 17.502704620361328,
+      "learning_rate": 3.7093153759820426e-05,
+      "loss": 1.4633,
+      "step": 1650
+    },
+    {
+      "epoch": 1.691919191919192,
+      "grad_norm": 15.681164741516113,
+      "learning_rate": 3.681257014590348e-05,
+      "loss": 1.4519,
+      "step": 1675
+    },
+    {
+      "epoch": 1.7171717171717171,
+      "grad_norm": 44.3072624206543,
+      "learning_rate": 3.6531986531986534e-05,
+      "loss": 1.4892,
+      "step": 1700
+    },
+    {
+      "epoch": 1.7424242424242424,
+      "grad_norm": 22.672714233398438,
+      "learning_rate": 3.625140291806959e-05,
+      "loss": 1.4918,
+      "step": 1725
+    },
+    {
+      "epoch": 1.7676767676767677,
+      "grad_norm": 29.78325843811035,
+      "learning_rate": 3.5970819304152635e-05,
+      "loss": 1.4672,
+      "step": 1750
+    },
+    {
+      "epoch": 1.7929292929292928,
+      "grad_norm": 23.5821590423584,
+      "learning_rate": 3.569023569023569e-05,
+      "loss": 1.4292,
+      "step": 1775
+    },
+    {
+      "epoch": 1.8181818181818183,
+      "grad_norm": 28.285043716430664,
+      "learning_rate": 3.540965207631874e-05,
+      "loss": 1.4431,
+      "step": 1800
+    },
+    {
+      "epoch": 1.8434343434343434,
+      "grad_norm": 29.603483200073242,
+      "learning_rate": 3.51290684624018e-05,
+      "loss": 1.482,
+      "step": 1825
+    },
+    {
+      "epoch": 1.8686868686868687,
+      "grad_norm": 20.012603759765625,
+      "learning_rate": 3.484848484848485e-05,
+      "loss": 1.5469,
+      "step": 1850
+    },
+    {
+      "epoch": 1.893939393939394,
+      "grad_norm": 21.001644134521484,
+      "learning_rate": 3.45679012345679e-05,
+      "loss": 1.5622,
+      "step": 1875
+    },
+    {
+      "epoch": 1.9191919191919191,
+      "grad_norm": 21.10232925415039,
+      "learning_rate": 3.428731762065096e-05,
+      "loss": 1.3952,
+      "step": 1900
+    },
+    {
+      "epoch": 1.9444444444444444,
+      "grad_norm": 14.726667404174805,
+      "learning_rate": 3.400673400673401e-05,
+      "loss": 1.3896,
+      "step": 1925
+    },
+    {
+      "epoch": 1.9696969696969697,
+      "grad_norm": 25.8332576751709,
+      "learning_rate": 3.3726150392817064e-05,
+      "loss": 1.4457,
+      "step": 1950
+    },
+    {
+      "epoch": 1.9949494949494948,
+      "grad_norm": 13.405915260314941,
+      "learning_rate": 3.3445566778900115e-05,
+      "loss": 1.4202,
+      "step": 1975
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 1.396142601966858,
+      "eval_map": 0.1585,
+      "eval_map_50": 0.3518,
+      "eval_map_75": 0.1208,
+      "eval_map_label0": 0.0454,
+      "eval_map_label1": 0.3192,
+      "eval_map_label2": 0.1108,
+      "eval_map_large": 0.2453,
+      "eval_map_medium": 0.0656,
+      "eval_map_small": 0.001,
+      "eval_mar_1": 0.2464,
+      "eval_mar_10": 0.3794,
+      "eval_mar_100": 0.4095,
+      "eval_mar_100_label0": 0.4123,
+      "eval_mar_100_label1": 0.4825,
+      "eval_mar_100_label2": 0.3339,
+      "eval_mar_large": 0.5798,
+      "eval_mar_medium": 0.3002,
+      "eval_mar_small": 0.0202,
+      "eval_runtime": 129.5946,
+      "eval_samples_per_second": 15.278,
+      "eval_steps_per_second": 0.957,
+      "step": 1980
+    },
+    {
+      "epoch": 2.0202020202020203,
+      "grad_norm": 17.959142684936523,
+      "learning_rate": 3.3164983164983165e-05,
+      "loss": 1.3717,
+      "step": 2000
+    },
+    {
+      "epoch": 2.0454545454545454,
+      "grad_norm": 16.8206729888916,
+      "learning_rate": 3.288439955106622e-05,
+      "loss": 1.4279,
+      "step": 2025
+    },
+    {
+      "epoch": 2.0707070707070705,
+      "grad_norm": 34.60778045654297,
+      "learning_rate": 3.260381593714927e-05,
+      "loss": 1.4862,
+      "step": 2050
+    },
+    {
+      "epoch": 2.095959595959596,
+      "grad_norm": 27.798601150512695,
+      "learning_rate": 3.232323232323233e-05,
+      "loss": 1.4113,
+      "step": 2075
+    },
+    {
+      "epoch": 2.121212121212121,
+      "grad_norm": 36.2835578918457,
+      "learning_rate": 3.204264870931537e-05,
+      "loss": 1.3866,
+      "step": 2100
+    },
+    {
+      "epoch": 2.1464646464646466,
+      "grad_norm": 21.473899841308594,
+      "learning_rate": 3.176206509539843e-05,
+      "loss": 1.4915,
+      "step": 2125
+    },
+    {
+      "epoch": 2.1717171717171717,
+      "grad_norm": 14.18557357788086,
+      "learning_rate": 3.148148148148148e-05,
+      "loss": 1.3965,
+      "step": 2150
+    },
+    {
+      "epoch": 2.196969696969697,
+      "grad_norm": 25.503524780273438,
+      "learning_rate": 3.120089786756454e-05,
+      "loss": 1.3686,
+      "step": 2175
+    },
+    {
+      "epoch": 2.2222222222222223,
+      "grad_norm": 43.49673080444336,
+      "learning_rate": 3.092031425364759e-05,
+      "loss": 1.4288,
+      "step": 2200
+    },
+    {
+      "epoch": 2.2474747474747474,
+      "grad_norm": 13.61823558807373,
+      "learning_rate": 3.063973063973064e-05,
+      "loss": 1.309,
+      "step": 2225
+    },
+    {
+      "epoch": 2.2727272727272725,
+      "grad_norm": 22.609790802001953,
+      "learning_rate": 3.0359147025813696e-05,
+      "loss": 1.3974,
+      "step": 2250
+    },
+    {
+      "epoch": 2.297979797979798,
+      "grad_norm": 15.05124568939209,
+      "learning_rate": 3.007856341189675e-05,
+      "loss": 1.4293,
+      "step": 2275
+    },
+    {
+      "epoch": 2.323232323232323,
+      "grad_norm": 24.605804443359375,
+      "learning_rate": 2.9797979797979796e-05,
+      "loss": 1.3323,
+      "step": 2300
+    },
+    {
+      "epoch": 2.3484848484848486,
+      "grad_norm": 33.4686164855957,
+      "learning_rate": 2.951739618406285e-05,
+      "loss": 1.3623,
+      "step": 2325
+    },
+    {
+      "epoch": 2.3737373737373737,
+      "grad_norm": 22.23702621459961,
+      "learning_rate": 2.9236812570145904e-05,
+      "loss": 1.3697,
+      "step": 2350
+    },
+    {
+      "epoch": 2.398989898989899,
+      "grad_norm": 29.579387664794922,
+      "learning_rate": 2.8956228956228958e-05,
+      "loss": 1.4029,
+      "step": 2375
+    },
+    {
+      "epoch": 2.4242424242424243,
+      "grad_norm": 32.36582565307617,
+      "learning_rate": 2.8675645342312015e-05,
+      "loss": 1.359,
+      "step": 2400
+    },
+    {
+      "epoch": 2.4494949494949494,
+      "grad_norm": 16.40806007385254,
+      "learning_rate": 2.839506172839506e-05,
+      "loss": 1.4343,
+      "step": 2425
+    },
+    {
+      "epoch": 2.474747474747475,
+      "grad_norm": 27.034290313720703,
+      "learning_rate": 2.8114478114478115e-05,
+      "loss": 1.4051,
+      "step": 2450
+    },
+    {
+      "epoch": 2.5,
+      "grad_norm": 19.469768524169922,
+      "learning_rate": 2.783389450056117e-05,
+      "loss": 1.3616,
+      "step": 2475
+    },
+    {
+      "epoch": 2.525252525252525,
+      "grad_norm": 23.027786254882812,
+      "learning_rate": 2.7553310886644223e-05,
+      "loss": 1.3019,
+      "step": 2500
+    },
+    {
+      "epoch": 2.5505050505050506,
+      "grad_norm": 23.63875389099121,
+      "learning_rate": 2.7272727272727273e-05,
+      "loss": 1.3673,
+      "step": 2525
+    },
+    {
+      "epoch": 2.5757575757575757,
+      "grad_norm": 18.26418113708496,
+      "learning_rate": 2.6992143658810327e-05,
+      "loss": 1.3827,
+      "step": 2550
+    },
+    {
+      "epoch": 2.601010101010101,
+      "grad_norm": 43.460304260253906,
+      "learning_rate": 2.671156004489338e-05,
+      "loss": 1.3362,
+      "step": 2575
+    },
+    {
+      "epoch": 2.6262626262626263,
+      "grad_norm": 12.931845664978027,
+      "learning_rate": 2.6430976430976434e-05,
+      "loss": 1.456,
+      "step": 2600
+    },
+    {
+      "epoch": 2.6515151515151514,
+      "grad_norm": 19.35201072692871,
+      "learning_rate": 2.615039281705948e-05,
+      "loss": 1.2981,
+      "step": 2625
+    },
+    {
+      "epoch": 2.676767676767677,
+      "grad_norm": 13.542413711547852,
+      "learning_rate": 2.5869809203142535e-05,
+      "loss": 1.4668,
+      "step": 2650
+    },
+    {
+      "epoch": 2.702020202020202,
+      "grad_norm": 16.890657424926758,
+      "learning_rate": 2.5589225589225592e-05,
+      "loss": 1.321,
+      "step": 2675
+    },
+    {
+      "epoch": 2.7272727272727275,
+      "grad_norm": 32.06181716918945,
+      "learning_rate": 2.5308641975308646e-05,
+      "loss": 1.3692,
+      "step": 2700
+    },
+    {
+      "epoch": 2.7525252525252526,
+      "grad_norm": 17.713001251220703,
+      "learning_rate": 2.50280583613917e-05,
+      "loss": 1.3754,
+      "step": 2725
+    },
+    {
+      "epoch": 2.7777777777777777,
+      "grad_norm": 18.294958114624023,
+      "learning_rate": 2.474747474747475e-05,
+      "loss": 1.323,
+      "step": 2750
+    },
+    {
+      "epoch": 2.8030303030303028,
+      "grad_norm": 19.94571876525879,
+      "learning_rate": 2.44668911335578e-05,
+      "loss": 1.3726,
+      "step": 2775
+    },
+    {
+      "epoch": 2.8282828282828283,
+      "grad_norm": 33.24243927001953,
+      "learning_rate": 2.4186307519640854e-05,
+      "loss": 1.3252,
+      "step": 2800
+    },
+    {
+      "epoch": 2.8535353535353534,
+      "grad_norm": 16.95751190185547,
+      "learning_rate": 2.3905723905723908e-05,
+      "loss": 1.2888,
+      "step": 2825
+    },
+    {
+      "epoch": 2.878787878787879,
+      "grad_norm": 16.71131134033203,
+      "learning_rate": 2.362514029180696e-05,
+      "loss": 1.3961,
+      "step": 2850
+    },
+    {
+      "epoch": 2.904040404040404,
+      "grad_norm": 24.505714416503906,
+      "learning_rate": 2.3344556677890012e-05,
+      "loss": 1.2817,
+      "step": 2875
+    },
+    {
+      "epoch": 2.929292929292929,
+      "grad_norm": 19.099855422973633,
+      "learning_rate": 2.3063973063973065e-05,
+      "loss": 1.2262,
+      "step": 2900
+    },
+    {
+      "epoch": 2.9545454545454546,
+      "grad_norm": 18.465789794921875,
+      "learning_rate": 2.2783389450056116e-05,
+      "loss": 1.3006,
+      "step": 2925
+    },
+    {
+      "epoch": 2.9797979797979797,
+      "grad_norm": 23.741085052490234,
+      "learning_rate": 2.250280583613917e-05,
+      "loss": 1.3211,
+      "step": 2950
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 1.2902663946151733,
+      "eval_map": 0.2016,
+      "eval_map_50": 0.4285,
+      "eval_map_75": 0.168,
+      "eval_map_label0": 0.0804,
+      "eval_map_label1": 0.3685,
+      "eval_map_label2": 0.1561,
+      "eval_map_large": 0.3051,
+      "eval_map_medium": 0.0957,
+      "eval_map_small": 0.0024,
+      "eval_mar_1": 0.2898,
+      "eval_mar_10": 0.4088,
+      "eval_mar_100": 0.4394,
+      "eval_mar_100_label0": 0.4586,
+      "eval_mar_100_label1": 0.5428,
+      "eval_mar_100_label2": 0.3169,
+      "eval_mar_large": 0.6007,
+      "eval_mar_medium": 0.341,
+      "eval_mar_small": 0.0322,
+      "eval_runtime": 135.6725,
+      "eval_samples_per_second": 14.594,
+      "eval_steps_per_second": 0.914,
+      "step": 2970
+    },
+    {
+      "epoch": 3.005050505050505,
+      "grad_norm": 16.176536560058594,
+      "learning_rate": 2.2222222222222223e-05,
+      "loss": 1.2763,
+      "step": 2975
+    },
+    {
+      "epoch": 3.0303030303030303,
+      "grad_norm": 22.124528884887695,
+      "learning_rate": 2.1941638608305277e-05,
+      "loss": 1.2491,
+      "step": 3000
+    },
+    {
+      "epoch": 3.0555555555555554,
+      "grad_norm": 20.725881576538086,
+      "learning_rate": 2.166105499438833e-05,
+      "loss": 1.3218,
+      "step": 3025
+    },
+    {
+      "epoch": 3.080808080808081,
+      "grad_norm": 21.34439468383789,
+      "learning_rate": 2.138047138047138e-05,
+      "loss": 1.3862,
+      "step": 3050
+    },
+    {
+      "epoch": 3.106060606060606,
+      "grad_norm": 27.87030029296875,
+      "learning_rate": 2.1099887766554435e-05,
+      "loss": 1.2895,
+      "step": 3075
+    },
+    {
+      "epoch": 3.1313131313131315,
+      "grad_norm": 37.32668685913086,
+      "learning_rate": 2.0819304152637485e-05,
+      "loss": 1.3541,
+      "step": 3100
+    },
+    {
+      "epoch": 3.1565656565656566,
+      "grad_norm": 17.16813850402832,
+      "learning_rate": 2.0538720538720542e-05,
+      "loss": 1.2823,
+      "step": 3125
+    },
+    {
+      "epoch": 3.1818181818181817,
+      "grad_norm": 22.47783851623535,
+      "learning_rate": 2.0258136924803593e-05,
+      "loss": 1.3354,
+      "step": 3150
+    },
+    {
+      "epoch": 3.207070707070707,
+      "grad_norm": 16.478052139282227,
+      "learning_rate": 1.9977553310886646e-05,
+      "loss": 1.3117,
+      "step": 3175
+    },
+    {
+      "epoch": 3.2323232323232323,
+      "grad_norm": 24.550979614257812,
+      "learning_rate": 1.9696969696969697e-05,
+      "loss": 1.3446,
+      "step": 3200
+    },
+    {
+      "epoch": 3.257575757575758,
+      "grad_norm": 19.664234161376953,
+      "learning_rate": 1.941638608305275e-05,
+      "loss": 1.322,
+      "step": 3225
+    },
+    {
+      "epoch": 3.282828282828283,
+      "grad_norm": 20.59177589416504,
+      "learning_rate": 1.91358024691358e-05,
+      "loss": 1.2819,
+      "step": 3250
+    },
+    {
+      "epoch": 3.308080808080808,
+      "grad_norm": 24.09212303161621,
+      "learning_rate": 1.8855218855218858e-05,
+      "loss": 1.2937,
+      "step": 3275
+    },
+    {
+      "epoch": 3.3333333333333335,
+      "grad_norm": 18.40042495727539,
+      "learning_rate": 1.8574635241301908e-05,
+      "loss": 1.3408,
+      "step": 3300
+    },
+    {
+      "epoch": 3.3585858585858586,
+      "grad_norm": 44.310447692871094,
+      "learning_rate": 1.8294051627384962e-05,
+      "loss": 1.2765,
+      "step": 3325
+    },
+    {
+      "epoch": 3.3838383838383836,
+      "grad_norm": 23.463211059570312,
+      "learning_rate": 1.8013468013468016e-05,
+      "loss": 1.2986,
+      "step": 3350
+    },
+    {
+      "epoch": 3.409090909090909,
+      "grad_norm": 24.56027603149414,
+      "learning_rate": 1.7732884399551066e-05,
+      "loss": 1.2789,
+      "step": 3375
+    },
+    {
+      "epoch": 3.4343434343434343,
+      "grad_norm": 12.601003646850586,
+      "learning_rate": 1.745230078563412e-05,
+      "loss": 1.2991,
+      "step": 3400
+    },
+    {
+      "epoch": 3.45959595959596,
+      "grad_norm": 14.440610885620117,
+      "learning_rate": 1.7171717171717173e-05,
+      "loss": 1.3621,
+      "step": 3425
+    },
+    {
+      "epoch": 3.484848484848485,
+      "grad_norm": 18.45439910888672,
+      "learning_rate": 1.6891133557800227e-05,
+      "loss": 1.3083,
+      "step": 3450
+    },
+    {
+      "epoch": 3.51010101010101,
+      "grad_norm": 18.901931762695312,
+      "learning_rate": 1.6610549943883278e-05,
+      "loss": 1.2736,
+      "step": 3475
+    },
+    {
+      "epoch": 3.5353535353535355,
+      "grad_norm": 40.01392364501953,
+      "learning_rate": 1.632996632996633e-05,
+      "loss": 1.2889,
+      "step": 3500
+    },
+    {
+      "epoch": 3.5606060606060606,
+      "grad_norm": 33.847312927246094,
+      "learning_rate": 1.604938271604938e-05,
+      "loss": 1.3858,
+      "step": 3525
+    },
+    {
+      "epoch": 3.5858585858585856,
+      "grad_norm": 15.7413330078125,
+      "learning_rate": 1.5768799102132435e-05,
+      "loss": 1.2634,
+      "step": 3550
+    },
+    {
+      "epoch": 3.611111111111111,
+      "grad_norm": 11.64206600189209,
+      "learning_rate": 1.548821548821549e-05,
+      "loss": 1.2464,
+      "step": 3575
+    },
+    {
+      "epoch": 3.6363636363636362,
+      "grad_norm": 22.535266876220703,
+      "learning_rate": 1.5207631874298541e-05,
+      "loss": 1.283,
+      "step": 3600
+    },
+    {
+      "epoch": 3.6616161616161618,
+      "grad_norm": 24.02773666381836,
+      "learning_rate": 1.4927048260381593e-05,
+      "loss": 1.2939,
+      "step": 3625
+    },
+    {
+      "epoch": 3.686868686868687,
+      "grad_norm": 24.32711410522461,
+      "learning_rate": 1.4646464646464647e-05,
+      "loss": 1.2618,
+      "step": 3650
+    },
+    {
+      "epoch": 3.712121212121212,
+      "grad_norm": 31.185592651367188,
+      "learning_rate": 1.43658810325477e-05,
+      "loss": 1.2082,
+      "step": 3675
+    },
+    {
+      "epoch": 3.7373737373737375,
+      "grad_norm": 19.14853286743164,
+      "learning_rate": 1.4085297418630753e-05,
+      "loss": 1.2204,
+      "step": 3700
+    },
+    {
+      "epoch": 3.7626262626262625,
+      "grad_norm": 19.671226501464844,
+      "learning_rate": 1.3804713804713806e-05,
+      "loss": 1.2873,
+      "step": 3725
+    },
+    {
+      "epoch": 3.787878787878788,
+      "grad_norm": 37.9943733215332,
+      "learning_rate": 1.3524130190796858e-05,
+      "loss": 1.2267,
+      "step": 3750
+    },
+    {
+      "epoch": 3.813131313131313,
+      "grad_norm": 39.25022506713867,
+      "learning_rate": 1.3243546576879912e-05,
+      "loss": 1.3132,
+      "step": 3775
+    },
+    {
+      "epoch": 3.8383838383838382,
+      "grad_norm": 31.733964920043945,
+      "learning_rate": 1.2962962962962962e-05,
+      "loss": 1.2981,
+      "step": 3800
+    },
+    {
+      "epoch": 3.8636363636363638,
+      "grad_norm": 13.638587951660156,
+      "learning_rate": 1.2682379349046016e-05,
+      "loss": 1.2567,
+      "step": 3825
+    },
+    {
+      "epoch": 3.888888888888889,
+      "grad_norm": 27.432302474975586,
+      "learning_rate": 1.240179573512907e-05,
+      "loss": 1.1788,
+      "step": 3850
+    },
+    {
+      "epoch": 3.9141414141414144,
+      "grad_norm": 26.565326690673828,
+      "learning_rate": 1.2121212121212122e-05,
+      "loss": 1.2726,
+      "step": 3875
+    },
+    {
+      "epoch": 3.9393939393939394,
+      "grad_norm": 15.759629249572754,
+      "learning_rate": 1.1840628507295174e-05,
+      "loss": 1.3079,
+      "step": 3900
+    },
+    {
+      "epoch": 3.9646464646464645,
+      "grad_norm": 32.35866165161133,
+      "learning_rate": 1.1560044893378228e-05,
+      "loss": 1.3048,
+      "step": 3925
+    },
+    {
+      "epoch": 3.98989898989899,
+      "grad_norm": 13.627097129821777,
+      "learning_rate": 1.127946127946128e-05,
+      "loss": 1.293,
+      "step": 3950
+    },
+    {
+      "epoch": 4.0,
+      "eval_loss": 1.2365508079528809,
+      "eval_map": 0.2352,
+      "eval_map_50": 0.4789,
+      "eval_map_75": 0.2113,
+      "eval_map_label0": 0.0958,
+      "eval_map_label1": 0.3932,
+      "eval_map_label2": 0.2165,
+      "eval_map_large": 0.3554,
+      "eval_map_medium": 0.1165,
+      "eval_map_small": 0.0025,
+      "eval_mar_1": 0.3252,
+      "eval_mar_10": 0.4433,
+      "eval_mar_100": 0.479,
+      "eval_mar_100_label0": 0.5128,
+      "eval_mar_100_label1": 0.553,
+      "eval_mar_100_label2": 0.3714,
+      "eval_mar_large": 0.6639,
+      "eval_mar_medium": 0.3693,
+      "eval_mar_small": 0.0282,
+      "eval_runtime": 189.7649,
+      "eval_samples_per_second": 10.434,
+      "eval_steps_per_second": 0.653,
+      "step": 3960
+    },
+    {
+      "epoch": 4.015151515151516,
+      "grad_norm": 16.43737030029297,
+      "learning_rate": 1.0998877665544333e-05,
+      "loss": 1.3154,
+      "step": 3975
+    },
+    {
+      "epoch": 4.040404040404041,
+      "grad_norm": 12.887079238891602,
+      "learning_rate": 1.0718294051627386e-05,
+      "loss": 1.2436,
+      "step": 4000
+    },
+    {
+      "epoch": 4.065656565656566,
+      "grad_norm": 27.211605072021484,
+      "learning_rate": 1.0437710437710438e-05,
+      "loss": 1.2369,
+      "step": 4025
+    },
+    {
+      "epoch": 4.090909090909091,
+      "grad_norm": 30.36830711364746,
+      "learning_rate": 1.0157126823793491e-05,
+      "loss": 1.2688,
+      "step": 4050
+    },
+    {
+      "epoch": 4.116161616161616,
+      "grad_norm": 16.97003936767578,
+      "learning_rate": 9.876543209876543e-06,
+      "loss": 1.1834,
+      "step": 4075
+    },
+    {
+      "epoch": 4.141414141414141,
+      "grad_norm": 19.722625732421875,
+      "learning_rate": 9.595959595959595e-06,
+      "loss": 1.2216,
+      "step": 4100
+    },
+    {
+      "epoch": 4.166666666666667,
+      "grad_norm": 24.40361213684082,
+      "learning_rate": 9.315375982042649e-06,
+      "loss": 1.1382,
+      "step": 4125
+    },
+    {
+      "epoch": 4.191919191919192,
+      "grad_norm": 28.218984603881836,
+      "learning_rate": 9.034792368125703e-06,
+      "loss": 1.1971,
+      "step": 4150
+    },
+    {
+      "epoch": 4.217171717171717,
+      "grad_norm": 23.390958786010742,
+      "learning_rate": 8.754208754208755e-06,
+      "loss": 1.3141,
+      "step": 4175
+    },
+    {
+      "epoch": 4.242424242424242,
+      "grad_norm": 22.968050003051758,
+      "learning_rate": 8.473625140291807e-06,
+      "loss": 1.2497,
+      "step": 4200
+    },
+    {
+      "epoch": 4.267676767676767,
+      "grad_norm": 21.7801570892334,
+      "learning_rate": 8.19304152637486e-06,
+      "loss": 1.2535,
+      "step": 4225
+    },
+    {
+      "epoch": 4.292929292929293,
+      "grad_norm": 32.12472915649414,
+      "learning_rate": 7.912457912457913e-06,
+      "loss": 1.2288,
+      "step": 4250
+    },
+    {
+      "epoch": 4.318181818181818,
+      "grad_norm": 20.222686767578125,
+      "learning_rate": 7.631874298540966e-06,
+      "loss": 1.2274,
+      "step": 4275
+    },
+    {
+      "epoch": 4.343434343434343,
+      "grad_norm": 26.127695083618164,
+      "learning_rate": 7.351290684624018e-06,
+      "loss": 1.1986,
+      "step": 4300
+    },
+    {
+      "epoch": 4.3686868686868685,
+      "grad_norm": 16.555965423583984,
+      "learning_rate": 7.0707070707070704e-06,
+      "loss": 1.2522,
+      "step": 4325
+    },
+    {
+      "epoch": 4.393939393939394,
+      "grad_norm": 16.466201782226562,
+      "learning_rate": 6.790123456790123e-06,
+      "loss": 1.2335,
+      "step": 4350
+    },
+    {
+      "epoch": 4.41919191919192,
+      "grad_norm": 18.98979949951172,
+      "learning_rate": 6.509539842873176e-06,
+      "loss": 1.3064,
+      "step": 4375
+    },
+    {
+      "epoch": 4.444444444444445,
+      "grad_norm": 13.089599609375,
+      "learning_rate": 6.2401795735129076e-06,
+      "loss": 1.1926,
+      "step": 4400
+    },
+    {
+      "epoch": 4.46969696969697,
+      "grad_norm": 51.39873504638672,
+      "learning_rate": 5.9595959595959605e-06,
+      "loss": 1.211,
+      "step": 4425
+    },
+    {
+      "epoch": 4.494949494949495,
+      "grad_norm": 16.774805068969727,
+      "learning_rate": 5.6790123456790125e-06,
+      "loss": 1.2553,
+      "step": 4450
+    },
+    {
+      "epoch": 4.52020202020202,
+      "grad_norm": 15.329991340637207,
+      "learning_rate": 5.398428731762065e-06,
+      "loss": 1.1924,
+      "step": 4475
+    },
+    {
+      "epoch": 4.545454545454545,
+      "grad_norm": 27.15462875366211,
+      "learning_rate": 5.117845117845118e-06,
+      "loss": 1.2463,
+      "step": 4500
+    },
+    {
+      "epoch": 4.570707070707071,
+      "grad_norm": 21.43892478942871,
+      "learning_rate": 4.83726150392817e-06,
+      "loss": 1.2831,
+      "step": 4525
+    },
+    {
+      "epoch": 4.595959595959596,
+      "grad_norm": 33.843936920166016,
+      "learning_rate": 4.556677890011223e-06,
+      "loss": 1.1781,
+      "step": 4550
+    },
+    {
+      "epoch": 4.621212121212121,
+      "grad_norm": 20.4368896484375,
+      "learning_rate": 4.276094276094277e-06,
+      "loss": 1.2344,
+      "step": 4575
+    },
+    {
+      "epoch": 4.646464646464646,
+      "grad_norm": 25.551361083984375,
+      "learning_rate": 3.995510662177329e-06,
+      "loss": 1.2114,
+      "step": 4600
+    },
+    {
+      "epoch": 4.671717171717171,
+      "grad_norm": 18.057945251464844,
+      "learning_rate": 3.714927048260382e-06,
+      "loss": 1.2301,
+      "step": 4625
+    },
+    {
+      "epoch": 4.696969696969697,
+      "grad_norm": 25.322641372680664,
+      "learning_rate": 3.4343434343434343e-06,
+      "loss": 1.1766,
+      "step": 4650
+    },
+    {
+      "epoch": 4.722222222222222,
+      "grad_norm": 21.608871459960938,
+      "learning_rate": 3.153759820426487e-06,
+      "loss": 1.1757,
+      "step": 4675
+    },
+    {
+      "epoch": 4.747474747474747,
+      "grad_norm": 12.744592666625977,
+      "learning_rate": 2.87317620650954e-06,
+      "loss": 1.1878,
+      "step": 4700
+    },
+    {
+      "epoch": 4.7727272727272725,
+      "grad_norm": 18.519357681274414,
+      "learning_rate": 2.5925925925925925e-06,
+      "loss": 1.185,
+      "step": 4725
+    },
+    {
+      "epoch": 4.797979797979798,
+      "grad_norm": 17.793031692504883,
+      "learning_rate": 2.312008978675646e-06,
+      "loss": 1.1464,
+      "step": 4750
+    },
+    {
+      "epoch": 4.8232323232323235,
+      "grad_norm": 16.70855712890625,
+      "learning_rate": 2.0314253647586983e-06,
+      "loss": 1.2202,
+      "step": 4775
+    },
+    {
+      "epoch": 4.848484848484849,
+      "grad_norm": 23.166088104248047,
+      "learning_rate": 1.750841750841751e-06,
+      "loss": 1.2478,
+      "step": 4800
+    },
+    {
+      "epoch": 4.873737373737374,
+      "grad_norm": 25.1901798248291,
+      "learning_rate": 1.4702581369248036e-06,
+      "loss": 1.2884,
+      "step": 4825
+    },
+    {
+      "epoch": 4.898989898989899,
+      "grad_norm": 18.20812225341797,
+      "learning_rate": 1.1896745230078565e-06,
+      "loss": 1.1887,
+      "step": 4850
+    },
+    {
+      "epoch": 4.924242424242424,
+      "grad_norm": 18.666954040527344,
+      "learning_rate": 9.09090909090909e-07,
+      "loss": 1.2136,
+      "step": 4875
+    },
+    {
+      "epoch": 4.94949494949495,
+      "grad_norm": 31.150278091430664,
+      "learning_rate": 6.285072951739619e-07,
+      "loss": 1.2078,
+      "step": 4900
+    },
+    {
+      "epoch": 4.974747474747475,
+      "grad_norm": 12.956293106079102,
+      "learning_rate": 3.479236812570146e-07,
+      "loss": 1.2789,
+      "step": 4925
+    },
+    {
+      "epoch": 5.0,
+      "grad_norm": 21.77115249633789,
+      "learning_rate": 6.734006734006734e-08,
+      "loss": 1.1564,
+      "step": 4950
+    },
+    {
+      "epoch": 5.0,
+      "eval_loss": 1.1927123069763184,
+      "eval_map": 0.2537,
+      "eval_map_50": 0.502,
+      "eval_map_75": 0.2303,
+      "eval_map_label0": 0.1064,
+      "eval_map_label1": 0.4212,
+      "eval_map_label2": 0.2333,
+      "eval_map_large": 0.3796,
+      "eval_map_medium": 0.1325,
+      "eval_map_small": 0.0016,
+      "eval_mar_1": 0.3388,
+      "eval_mar_10": 0.4646,
+      "eval_mar_100": 0.5012,
+      "eval_mar_100_label0": 0.5197,
+      "eval_mar_100_label1": 0.5865,
+      "eval_mar_100_label2": 0.3974,
+      "eval_mar_large": 0.678,
+      "eval_mar_medium": 0.4027,
+      "eval_mar_small": 0.0456,
+      "eval_runtime": 190.0886,
+      "eval_samples_per_second": 10.416,
+      "eval_steps_per_second": 0.652,
+      "step": 4950
+    }
+  ],
+  "logging_steps": 25,
+  "max_steps": 4950,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 5,
+        "early_stopping_threshold": 0.01
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 8.94903394074624e+18,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-4950/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:93a9f65387e850cdb532b8cc40a1f985541a476dd8baaabe7a5b1b280545a9e9
+size 5304

config.json ADDED Viewed

	@@ -0,0 +1,46 @@

+{
+  "_name_or_path": "hustvl/yolos-small",
+  "architectures": [
+    "YolosForObjectDetection"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "auxiliary_loss": false,
+  "bbox_cost": 5,
+  "bbox_loss_coefficient": 5,
+  "class_cost": 1,
+  "eos_coefficient": 0.1,
+  "giou_cost": 2,
+  "giou_loss_coefficient": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 384,
+  "id2label": {
+    "0": "brain-tumor",
+    "1": "label0",
+    "2": "label1",
+    "3": "label2"
+  },
+  "image_size": [
+    512,
+    864
+  ],
+  "initializer_range": 0.02,
+  "intermediate_size": 1536,
+  "label2id": {
+    "brain-tumor": 0,
+    "label0": 1,
+    "label1": 2,
+    "label2": 3
+  },
+  "layer_norm_eps": 1e-12,
+  "model_type": "yolos",
+  "num_attention_heads": 6,
+  "num_channels": 3,
+  "num_detection_tokens": 100,
+  "num_hidden_layers": 12,
+  "patch_size": 16,
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.46.2",
+  "use_mid_position_embeddings": true
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:91f9a40cd583f7353f09a374ff308a89d686aef6c0682d2edb9a5613668f6ae4
+size 122629292

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,25 @@

+{
+  "do_convert_annotations": true,
+  "do_normalize": true,
+  "do_pad": false,
+  "do_rescale": true,
+  "do_resize": false,
+  "format": "coco_detection",
+  "image_mean": [
+    0.485,
+    0.456,
+    0.406
+  ],
+  "image_processor_type": "YolosImageProcessor",
+  "image_std": [
+    0.229,
+    0.224,
+    0.225
+  ],
+  "pad_size": null,
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "longest_edge": 640
+  }
+}

runs/Nov19_07-08-55_659d872c1556/events.out.tfevents.1732000135.659d872c1556.241.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:943bb0d20a2fda86715a4a3293ed9f3e763074d4b99779e3d137b92a10bfd28a
-size 51204

 version https://git-lfs.github.com/spec/v1
+oid sha256:8f5061c54c6ec2418a0e7d548dffbaf679ea3103cecc0c54eb2688fba4e4ed50
+size 53626

runs/Nov19_07-08-55_659d872c1556/events.out.tfevents.1732008067.659d872c1556.241.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7d477735ed8524a485d99e88524dbe6fce610299b2787cab2dc2e38bd11cc8cd
+size 1312

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:93a9f65387e850cdb532b8cc40a1f985541a476dd8baaabe7a5b1b280545a9e9
+size 5304

training_params.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+    "data_path": "Francesco/brain-tumor-m2pbp",
+    "model": "hustvl/yolos-small",
+    "username": "Aryan-401",
+    "lr": 5e-05,
+    "epochs": 4,
+    "batch_size": 32,
+    "warmup_ratio": 0.1,
+    "gradient_accumulation": 1,
+    "optimizer": "adamw_torch",
+    "scheduler": "linear",
+    "weight_decay": 0.0,
+    "max_grad_norm": 1.0,
+    "seed": 42,
+    "train_split": "train+validation",
+    "valid_split": "test",
+    "logging_steps": -1,
+    "project_name": "tumor-detect-yolo-small",
+    "auto_find_batch_size": false,
+    "mixed_precision": "fp16",
+    "save_total_limit": 1,
+    "push_to_hub": true,
+    "eval_strategy": "epoch",
+    "image_column": "image",
+    "objects_column": "objects",
+    "log": "tensorboard",
+    "image_square_size": 640,
+    "early_stopping_patience": 5,
+    "early_stopping_threshold": 0.01
+}