Evaluation on the test set completed on 2024_10_31.

Browse files

Files changed (13) hide show

README.md +46 -66
all_results.json +15 -15
config.json +90 -106
logs/events.out.tfevents.1730353344.datavisu3 +2 -2
logs/events.out.tfevents.1730354208.datavisu4 +3 -0
logs/events.out.tfevents.1730354489.datavisu4 +3 -0
model.safetensors +1 -1
runs/events.out.tfevents.1730352882.datavisu3 +3 -0
runs/events.out.tfevents.1730354197.datavisu4 +0 -0
test_results.json +12 -1
threshold.json +1 -0
train_results.json +7 -7
trainer_state.json +336 -596

README.md CHANGED Viewed

@@ -16,12 +16,12 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [facebook/dinov2-large](https://huggingface.co/facebook/dinov2-large) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.6333
-- Rmse: 0.3468
-- Mae: 0.3060
-- R2: -1.9752
-- Explained Variance: 0.1029
-- Learning Rate: 0.0000
 ## Model description
@@ -53,66 +53,46 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Rmse   | Mae    | R2       | Explained Variance | Rate   |
 |:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:--------:|:------------------:|:------:|
-| No log        | 1.0   | 2    | 0.7005          | 0.3966 | 0.3705 | -21.5069 | 0.0684             | 0.001  |
-| No log        | 2.0   | 4    | 0.7249          | 0.4021 | 0.3746 | -26.3836 | 0.0822             | 0.001  |
-| No log        | 3.0   | 6    | 0.7532          | 0.4114 | 0.3816 | -29.6868 | 0.1178             | 0.001  |
-| No log        | 4.0   | 8    | 0.7681          | 0.4186 | 0.3850 | -29.0398 | 0.0566             | 0.001  |
-| No log        | 5.0   | 10   | 0.7665          | 0.4178 | 0.3827 | -26.6101 | 0.0116             | 0.001  |
-| No log        | 6.0   | 12   | 0.7594          | 0.4152 | 0.3779 | -24.2590 | -0.0414            | 0.001  |
-| No log        | 7.0   | 14   | 0.7494          | 0.4108 | 0.3715 | -22.3016 | -0.1878            | 0.001  |
-| No log        | 8.0   | 16   | 0.7214          | 0.3992 | 0.3610 | -20.1630 | -0.1876            | 0.0001 |
-| No log        | 9.0   | 18   | 0.7013          | 0.3905 | 0.3530 | -18.6708 | -0.1643            | 0.0001 |
-| No log        | 10.0  | 20   | 0.6869          | 0.3836 | 0.3467 | -17.4192 | -0.1505            | 0.0001 |
-| No log        | 11.0  | 22   | 0.6764          | 0.3787 | 0.3425 | -16.5076 | -0.1282            | 0.0001 |
-| No log        | 12.0  | 24   | 0.6669          | 0.3740 | 0.3384 | -16.0072 | -0.1085            | 0.0001 |
-| No log        | 13.0  | 26   | 0.6617          | 0.3712 | 0.3358 | -15.5612 | -0.0882            | 0.0001 |
-| No log        | 14.0  | 28   | 0.6557          | 0.3683 | 0.3332 | -14.8471 | -0.0399            | 0.0001 |
-| No log        | 15.0  | 30   | 0.6517          | 0.3661 | 0.3313 | -14.3744 | -0.0149            | 0.0001 |
-| No log        | 16.0  | 32   | 0.6494          | 0.3650 | 0.3302 | -14.0923 | 0.0009             | 0.0001 |
-| No log        | 17.0  | 34   | 0.6469          | 0.3634 | 0.3284 | -14.0430 | 0.0076             | 0.0001 |
-| No log        | 18.0  | 36   | 0.6455          | 0.3626 | 0.3275 | -13.8481 | 0.0275             | 0.0001 |
-| No log        | 19.0  | 38   | 0.6437          | 0.3617 | 0.3270 | -13.7294 | 0.0458             | 0.0001 |
-| No log        | 20.0  | 40   | 0.6426          | 0.3611 | 0.3265 | -13.4695 | 0.0571             | 0.0001 |
-| No log        | 21.0  | 42   | 0.6414          | 0.3605 | 0.3256 | -13.4449 | 0.0581             | 0.0001 |
-| No log        | 22.0  | 44   | 0.6422          | 0.3605 | 0.3257 | -13.3180 | 0.0542             | 0.0001 |
-| No log        | 23.0  | 46   | 0.6407          | 0.3593 | 0.3246 | -13.2487 | 0.0755             | 0.0001 |
-| No log        | 24.0  | 48   | 0.6375          | 0.3576 | 0.3230 | -13.2495 | 0.0741             | 0.0001 |
-| No log        | 25.0  | 50   | 0.6332          | 0.3551 | 0.3205 | -12.9650 | 0.0843             | 0.0001 |
-| No log        | 26.0  | 52   | 0.6316          | 0.3540 | 0.3191 | -12.7124 | 0.0903             | 0.0001 |
-| No log        | 27.0  | 54   | 0.6298          | 0.3527 | 0.3176 | -12.5315 | 0.0972             | 0.0001 |
-| No log        | 28.0  | 56   | 0.6287          | 0.3519 | 0.3168 | -12.3934 | 0.1010             | 0.0001 |
-| No log        | 29.0  | 58   | 0.6279          | 0.3514 | 0.3163 | -12.3234 | 0.1064             | 0.0001 |
-| No log        | 30.0  | 60   | 0.6246          | 0.3494 | 0.3141 | -12.2314 | 0.1160             | 0.0001 |
-| No log        | 31.0  | 62   | 0.6211          | 0.3475 | 0.3123 | -12.0643 | 0.1264             | 0.0001 |
-| No log        | 32.0  | 64   | 0.6218          | 0.3477 | 0.3125 | -11.9670 | 0.1294             | 0.0001 |
-| No log        | 33.0  | 66   | 0.6202          | 0.3470 | 0.3120 | -11.7550 | 0.1365             | 0.0001 |
-| No log        | 34.0  | 68   | 0.6191          | 0.3463 | 0.3111 | -11.6145 | 0.1364             | 0.0001 |
-| No log        | 35.0  | 70   | 0.6174          | 0.3455 | 0.3105 | -11.5861 | 0.1400             | 0.0001 |
-| No log        | 36.0  | 72   | 0.6195          | 0.3462 | 0.3109 | -11.7605 | 0.1398             | 0.0001 |
-| No log        | 37.0  | 74   | 0.6210          | 0.3470 | 0.3114 | -11.7035 | 0.1367             | 0.0001 |
-| No log        | 38.0  | 76   | 0.6201          | 0.3463 | 0.3107 | -11.6608 | 0.1387             | 0.0001 |
-| No log        | 39.0  | 78   | 0.6195          | 0.3461 | 0.3106 | -11.6294 | 0.1362             | 0.0001 |
-| No log        | 40.0  | 80   | 0.6195          | 0.3459 | 0.3101 | -11.6709 | 0.1279             | 0.0001 |
-| No log        | 41.0  | 82   | 0.6196          | 0.3456 | 0.3095 | -11.4656 | 0.1154             | 0.0001 |
-| No log        | 42.0  | 84   | 0.6185          | 0.3453 | 0.3096 | -11.4190 | 0.1220             | 1e-05  |
-| No log        | 43.0  | 86   | 0.6196          | 0.3457 | 0.3099 | -11.4211 | 0.1224             | 1e-05  |
-| No log        | 44.0  | 88   | 0.6175          | 0.3448 | 0.3091 | -11.3422 | 0.1252             | 1e-05  |
-| No log        | 45.0  | 90   | 0.6148          | 0.3435 | 0.3079 | -11.2377 | 0.1267             | 1e-05  |
-| No log        | 46.0  | 92   | 0.6156          | 0.3439 | 0.3081 | -11.2161 | 0.1232             | 1e-05  |
-| No log        | 47.0  | 94   | 0.6162          | 0.3442 | 0.3084 | -11.2359 | 0.1219             | 1e-05  |
-| No log        | 48.0  | 96   | 0.6153          | 0.3438 | 0.3079 | -11.1407 | 0.1218             | 1e-05  |
-| No log        | 49.0  | 98   | 0.6142          | 0.3434 | 0.3075 | -11.0878 | 0.1259             | 1e-05  |
-| No log        | 50.0  | 100  | 0.6125          | 0.3427 | 0.3071 | -11.1648 | 0.1241             | 1e-05  |
-| No log        | 51.0  | 102  | 0.6131          | 0.3430 | 0.3072 | -11.2371 | 0.1274             | 1e-05  |
-| No log        | 52.0  | 104  | 0.6137          | 0.3434 | 0.3077 | -11.3909 | 0.1274             | 1e-05  |
-| No log        | 53.0  | 106  | 0.6139          | 0.3434 | 0.3077 | -11.5018 | 0.1224             | 1e-05  |
-| No log        | 54.0  | 108  | 0.6157          | 0.3445 | 0.3089 | -11.6674 | 0.1222             | 1e-05  |
-| No log        | 55.0  | 110  | 0.6168          | 0.3448 | 0.3090 | -11.6467 | 0.1222             | 1e-05  |
-| No log        | 56.0  | 112  | 0.6140          | 0.3434 | 0.3077 | -11.4968 | 0.1250             | 1e-05  |
-| No log        | 57.0  | 114  | 0.6133          | 0.3430 | 0.3071 | -11.5002 | 0.1216             | 0.0000 |
-| No log        | 58.0  | 116  | 0.6130          | 0.3428 | 0.3070 | -11.4475 | 0.1210             | 0.0000 |
-| No log        | 59.0  | 118  | 0.6150          | 0.3441 | 0.3083 | -11.5562 | 0.1178             | 0.0000 |
-| No log        | 60.0  | 120  | 0.6167          | 0.3450 | 0.3092 | -11.4676 | 0.1243             | 0.0000 |
 ### Framework versions

 This model is a fine-tuned version of [facebook/dinov2-large](https://huggingface.co/facebook/dinov2-large) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.6195
+- Rmse: 0.3419
+- Mae: 0.3068
+- R2: -1.6131
+- Explained Variance: 0.2071
+- Learning Rate: 1e-05
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss | Rmse   | Mae    | R2       | Explained Variance | Rate   |
 |:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:--------:|:------------------:|:------:|
+| No log        | 1.0   | 2    | 0.7150          | 0.4100 | 0.3849 | -20.2909 | 0.0364             | 0.001  |
+| No log        | 2.0   | 4    | 0.7314          | 0.4163 | 0.3895 | -21.2182 | 0.0241             | 0.001  |
+| No log        | 3.0   | 6    | 0.7726          | 0.4321 | 0.4041 | -24.8224 | -0.0469            | 0.001  |
+| No log        | 4.0   | 8    | 0.7917          | 0.4380 | 0.4095 | -26.5816 | -0.0667            | 0.001  |
+| No log        | 5.0   | 10   | 0.7853          | 0.4318 | 0.4021 | -26.9559 | -0.1362            | 0.001  |
+| No log        | 6.0   | 12   | 0.7648          | 0.4224 | 0.3905 | -24.4015 | -0.1297            | 0.001  |
+| No log        | 7.0   | 14   | 0.7392          | 0.4103 | 0.3760 | -22.5579 | -0.1098            | 0.001  |
+| No log        | 8.0   | 16   | 0.7115          | 0.3983 | 0.3639 | -20.0674 | -0.1054            | 0.0001 |
+| No log        | 9.0   | 18   | 0.6897          | 0.3879 | 0.3535 | -18.1665 | -0.0925            | 0.0001 |
+| No log        | 10.0  | 20   | 0.6777          | 0.3818 | 0.3468 | -16.9447 | -0.1029            | 0.0001 |
+| No log        | 11.0  | 22   | 0.6702          | 0.3780 | 0.3424 | -16.0375 | -0.1169            | 0.0001 |
+| No log        | 12.0  | 24   | 0.6639          | 0.3744 | 0.3389 | -15.6052 | -0.1121            | 0.0001 |
+| No log        | 13.0  | 26   | 0.6565          | 0.3703 | 0.3346 | -14.8051 | -0.1065            | 0.0001 |
+| No log        | 14.0  | 28   | 0.6501          | 0.3668 | 0.3310 | -14.2312 | -0.0958            | 0.0001 |
+| No log        | 15.0  | 30   | 0.6468          | 0.3648 | 0.3289 | -14.0799 | -0.0855            | 0.0001 |
+| No log        | 16.0  | 32   | 0.6471          | 0.3650 | 0.3289 | -14.2557 | -0.0823            | 0.0001 |
+| No log        | 17.0  | 34   | 0.6435          | 0.3631 | 0.3268 | -14.0598 | -0.0810            | 0.0001 |
+| No log        | 18.0  | 36   | 0.6438          | 0.3634 | 0.3270 | -14.0369 | -0.0799            | 0.0001 |
+| No log        | 19.0  | 38   | 0.6400          | 0.3614 | 0.3250 | -13.8152 | -0.0888            | 0.0001 |
+| No log        | 20.0  | 40   | 0.6392          | 0.3609 | 0.3246 | -13.7104 | -0.0935            | 0.0001 |
+| No log        | 21.0  | 42   | 0.6387          | 0.3606 | 0.3246 | -13.8099 | -0.0993            | 0.0001 |
+| No log        | 22.0  | 44   | 0.6388          | 0.3606 | 0.3243 | -13.8497 | -0.1056            | 0.0001 |
+| No log        | 23.0  | 46   | 0.6362          | 0.3590 | 0.3228 | -13.5622 | -0.1035            | 0.0001 |
+| No log        | 24.0  | 48   | 0.6354          | 0.3585 | 0.3223 | -13.6453 | -0.1058            | 0.0001 |
+| No log        | 25.0  | 50   | 0.6345          | 0.3578 | 0.3214 | -13.6023 | -0.1036            | 0.0001 |
+| No log        | 26.0  | 52   | 0.6349          | 0.3581 | 0.3212 | -13.6304 | -0.1173            | 0.0001 |
+| No log        | 27.0  | 54   | 0.6333          | 0.3571 | 0.3201 | -13.5613 | -0.1148            | 0.0001 |
+| No log        | 28.0  | 56   | 0.6295          | 0.3548 | 0.3177 | -13.2331 | -0.1083            | 0.0001 |
+| No log        | 29.0  | 58   | 0.6285          | 0.3543 | 0.3173 | -13.1623 | -0.1047            | 0.0001 |
+| No log        | 30.0  | 60   | 0.6263          | 0.3532 | 0.3163 | -12.7132 | -0.0926            | 0.0001 |
+| No log        | 31.0  | 62   | 0.6273          | 0.3538 | 0.3167 | -12.8739 | -0.0893            | 0.0001 |
+| No log        | 32.0  | 64   | 0.6294          | 0.3550 | 0.3181 | -12.9355 | -0.0790            | 0.0001 |
+| No log        | 33.0  | 66   | 0.6299          | 0.3554 | 0.3185 | -12.9352 | -0.0752            | 0.0001 |
+| No log        | 34.0  | 68   | 0.6321          | 0.3564 | 0.3193 | -13.2672 | -0.0702            | 0.0001 |
+| No log        | 35.0  | 70   | 0.6279          | 0.3541 | 0.3175 | -12.9995 | -0.0487            | 0.0001 |
+| No log        | 36.0  | 72   | 0.6280          | 0.3541 | 0.3174 | -13.0074 | -0.0466            | 0.0001 |
+| No log        | 37.0  | 74   | 0.6304          | 0.3554 | 0.3187 | -13.2310 | -0.0494            | 1e-05  |
+| No log        | 38.0  | 76   | 0.6297          | 0.3551 | 0.3183 | -12.9830 | -0.0439            | 1e-05  |
+| No log        | 39.0  | 78   | 0.6308          | 0.3558 | 0.3193 | -13.1598 | -0.0430            | 1e-05  |
+| No log        | 40.0  | 80   | 0.6292          | 0.3548 | 0.3183 | -13.0698 | -0.0435            | 1e-05  |
 ### Framework versions

all_results.json CHANGED Viewed

@@ -1,17 +1,17 @@
 {
-    "epoch": 60.0,
-    "eval_explained_variance": 0.10288698971271515,
-    "eval_loss": 0.633324384689331,
-    "eval_mae": 0.30597275495529175,
-    "eval_r2": -1.975172758102417,
-    "eval_rmse": 0.3468049466609955,
-    "eval_runtime": 1.0485,
-    "eval_samples_per_second": 47.685,
-    "eval_steps_per_second": 1.907,
-    "learning_rate": 1.0000000000000002e-06,
-    "total_flos": 4.4402778184752e+17,
-    "train_loss": 0.6329069137573242,
-    "train_runtime": 375.0945,
-    "train_samples_per_second": 19.995,
-    "train_steps_per_second": 0.8
 }

 {
+    "epoch": 40.0,
+    "eval_explained_variance": 0.20714369416236877,
+    "eval_loss": 0.6195399761199951,
+    "eval_mae": 0.3067561388015747,
+    "eval_r2": -1.6130945682525635,
+    "eval_rmse": 0.34193673729896545,
+    "eval_runtime": 1.099,
+    "eval_samples_per_second": 45.496,
+    "eval_steps_per_second": 1.82,
+    "learning_rate": 1e-05,
+    "total_flos": 2.9601852123168e+17,
+    "train_loss": 0.64580397605896,
+    "train_runtime": 275.9938,
+    "train_samples_per_second": 27.175,
+    "train_steps_per_second": 1.087
 }

config.json CHANGED Viewed

@@ -1,107 +1,91 @@
 {
-    "_name_or_path": "facebook/dinov2-large",
-    "apply_layernorm": true,
-    "architectures": [
-        "Dinov2ForImageClassification"
-    ],
-    "attention_probs_dropout_prob": 0.0,
-    "drop_path_rate": 0.0,
-    "hidden_act": "gelu",
-    "hidden_dropout_prob": 0.0,
-    "hidden_size": 1024,
-    "id2label": {
-        "0": "Acropore_branched",
-        "1": "Acropore_digitised",
-        "2": "Acropore_tabular",
-        "3": "Algae",
-        "4": "Dead_coral",
-        "5": "Fish",
-        "6": "Millepore",
-        "7": "No_acropore_encrusting",
-        "8": "No_acropore_massive",
-        "9": "No_acropore_sub_massive",
-        "10": "Rock",
-        "11": "Rubble",
-        "12": "Sand"
-    },
-    "image_size": 164,
-    "initializer_range": 0.02,
-    "label2id": {
-        "Acropore_branched": 0,
-        "Acropore_digitised": 1,
-        "Acropore_tabular": 2,
-        "Algae": 3,
-        "Dead_coral": 4,
-        "Fish": 5,
-        "Millepore": 6,
-        "No_acropore_encrusting": 7,
-        "No_acropore_massive": 8,
-        "No_acropore_sub_massive": 9,
-        "Rock": 10,
-        "Rubble": 11,
-        "Sand": 12
-    },
-    "layer_norm_eps": 1e-06,
-    "layerscale_value": 1.0,
-    "mlp_ratio": 4,
-    "model_type": "dinov2",
-    "num_attention_heads": 16,
-    "num_channels": 3,
-    "num_hidden_layers": 24,
-    "out_features": [
-        "stage24"
-    ],
-    "out_indices": [
-        24
-    ],
-    "patch_size": 14,
-    "problem_type": "multi_label_classification",
-    "qkv_bias": true,
-    "reshape_hidden_states": true,
-    "stage_names": [
-        "stem",
-        "stage1",
-        "stage2",
-        "stage3",
-        "stage4",
-        "stage5",
-        "stage6",
-        "stage7",
-        "stage8",
-        "stage9",
-        "stage10",
-        "stage11",
-        "stage12",
-        "stage13",
-        "stage14",
-        "stage15",
-        "stage16",
-        "stage17",
-        "stage18",
-        "stage19",
-        "stage20",
-        "stage21",
-        "stage22",
-        "stage23",
-        "stage24"
-    ],
-    "torch_dtype": "float32",
-    "transformers_version": "4.44.2",
-    "use_swiglu_ffn": false,
-    "initial_learning_rate": 0.001,
-    "train_batch_size": 32,
-    "eval_batch_size": 32,
-    "optimizer": {
-        "type": "Adam"
-    },
-    "lr_scheduler_type": {
-        "type": "ReduceLROnPlateau"
-    },
-    "patience_lr_scheduler": 5,
-    "factor_lr_scheduler": 0.1,
-    "weight_decay": 0.0001,
-    "early_stopping_patience": 10,
-    "freeze_encoder": true,
-    "data_augmentation": true,
-    "num_epochs": 150
-}

 {
+  "_name_or_path": "facebook/dinov2-large",
+  "apply_layernorm": true,
+  "architectures": [
+    "Dinov2ForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "drop_path_rate": 0.0,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 1024,
+  "id2label": {
+    "0": "Acropore_branched",
+    "1": "Acropore_digitised",
+    "2": "Acropore_tabular",
+    "3": "Algae",
+    "4": "Dead_coral",
+    "5": "Fish",
+    "6": "Millepore",
+    "7": "No_acropore_encrusting",
+    "8": "No_acropore_massive",
+    "9": "No_acropore_sub_massive",
+    "10": "Rock",
+    "11": "Rubble",
+    "12": "Sand"
+  },
+  "image_size": 164,
+  "initializer_range": 0.02,
+  "label2id": {
+    "Acropore_branched": 0,
+    "Acropore_digitised": 1,
+    "Acropore_tabular": 2,
+    "Algae": 3,
+    "Dead_coral": 4,
+    "Fish": 5,
+    "Millepore": 6,
+    "No_acropore_encrusting": 7,
+    "No_acropore_massive": 8,
+    "No_acropore_sub_massive": 9,
+    "Rock": 10,
+    "Rubble": 11,
+    "Sand": 12
+  },
+  "layer_norm_eps": 1e-06,
+  "layerscale_value": 1.0,
+  "mlp_ratio": 4,
+  "model_type": "dinov2",
+  "num_attention_heads": 16,
+  "num_channels": 3,
+  "num_hidden_layers": 24,
+  "out_features": [
+    "stage24"
+  ],
+  "out_indices": [
+    24
+  ],
+  "patch_size": 14,
+  "problem_type": "multi_label_classification",
+  "qkv_bias": true,
+  "reshape_hidden_states": true,
+  "stage_names": [
+    "stem",
+    "stage1",
+    "stage2",
+    "stage3",
+    "stage4",
+    "stage5",
+    "stage6",
+    "stage7",
+    "stage8",
+    "stage9",
+    "stage10",
+    "stage11",
+    "stage12",
+    "stage13",
+    "stage14",
+    "stage15",
+    "stage16",
+    "stage17",
+    "stage18",
+    "stage19",
+    "stage20",
+    "stage21",
+    "stage22",
+    "stage23",
+    "stage24"
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.44.2",
+  "use_swiglu_ffn": false
+}

logs/events.out.tfevents.1730353344.datavisu3 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:599619c4bf040e2e2108488a096b7ab47b8d33f71ba2deaec16843b577491876
-size 40

 version https://git-lfs.github.com/spec/v1
+oid sha256:da2ac5ad39216a587fed6417c22c3f0c9fbe120eb5f2fda537c771f1c00547eb
+size 562

logs/events.out.tfevents.1730354208.datavisu4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f09a86ceb3ba5902bb455494bc444ad34068b80a03b84a1af738deee197d3aa9
+size 27578

logs/events.out.tfevents.1730354489.datavisu4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d595ee38637c40e64c90e923415ce5643091f9cce108836d577f42de7b55d900
+size 40

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0ec42591f36bdfb80f97bb92cd3915ad2b8ba59617c4a381b145ce5e3de2f726
 size 1222958756

 version https://git-lfs.github.com/spec/v1
+oid sha256:3bb8018d733bef1a8345ef794b9f74c454fe90a64f664c4f475de6f2ce48c64d
 size 1222958756

runs/events.out.tfevents.1730352882.datavisu3 CHANGED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4f4f2c5da543c6ae5472319e39eb74aed35ce6a0508f4bfe799213764e16657e
+size 40

runs/events.out.tfevents.1730354197.datavisu4 ADDED Viewed

File without changes

test_results.json CHANGED Viewed

	@@ -1 +1,12 @@
1	- {"test_loss": 0.6322654485702515, "test_model_preparation_time": 0.0067, "test_rmse": 0.34622713923454285, "test_mae": 0.30555403232574463, "test_r2": -1.965573787689209, "test_explained_variance": 0.10564449429512024, "test_mse_per_class": [0.26136571168899536, 0.29893758893013, 0.36430591344833374, 0.42200082540512085, 0.3574856221675873, 0.26048266887664795, 0.434121310710907, 0.4173690378665924, 0.40536266565322876, 0.2731235921382904, 0.3835618793964386, 0.2693272531032562, 0.3535088896751404], "test_f1_micro": 0.9515717926932881, "test_f1_macro": 0.9342119494403047, "test_accuracy": 0.3, "test_f1_per_class": [0.9397590361445783, 0.6511627906976745, 1.0, 1.0, 0.8, 0.8674698795180723, 1.0, 1.0, 1.0, 0.8863636363636364, 1.0, 1.0, 1.0], "test_runtime": 0.5432, "test_samples_per_second": 92.049, "test_steps_per_second": 12.887}

+{
+    "epoch": 40.0,
+    "eval_explained_variance": 0.20714369416236877,
+    "eval_loss": 0.6195399761199951,
+    "eval_mae": 0.3067561388015747,
+    "eval_r2": -1.6130945682525635,
+    "eval_rmse": 0.34193673729896545,
+    "eval_runtime": 1.099,
+    "eval_samples_per_second": 45.496,
+    "eval_steps_per_second": 1.82,
+    "learning_rate": 1e-05
+}

threshold.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"Acropore_branched": 0.085, "Acropore_digitised": 0.431, "Acropore_tabular": 0.0, "Algae": 0.0, "Dead_coral": 0.17, "Fish": 0.009, "Millepore": 0.0, "No_acropore_encrusting": 0.0, "No_acropore_massive": 0.0, "No_acropore_sub_massive": 0.077, "Rock": 0.0, "Rubble": 0.0, "Sand": 0.0}

train_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-    "epoch": 60.0,
-    "learning_rate": 1.0000000000000002e-06,
-    "total_flos": 4.4402778184752e+17,
-    "train_loss": 0.6329069137573242,
-    "train_runtime": 375.0945,
-    "train_samples_per_second": 19.995,
-    "train_steps_per_second": 0.8
 }

 {
+    "epoch": 40.0,
+    "learning_rate": 1e-05,
+    "total_flos": 2.9601852123168e+17,
+    "train_loss": 0.64580397605896,
+    "train_runtime": 275.9938,
+    "train_samples_per_second": 27.175,
+    "train_steps_per_second": 1.087
 }

trainer_state.json CHANGED Viewed

@@ -1,802 +1,542 @@
 {
-  "best_metric": 0.6125256419181824,
-  "best_model_checkpoint": "/home1/datahome/villien/project_hub/DinoVdeau/models/Ziboiai-large-2024_10_31-prova_batch-size32_freeze_probs/checkpoint-100",
-  "epoch": 60.0,
   "eval_steps": 500,
-  "global_step": 120,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_explained_variance": 0.06840751320123672,
-      "eval_loss": 0.7004616260528564,
-      "eval_mae": 0.37051576375961304,
-      "eval_r2": -21.506893157958984,
-      "eval_rmse": 0.3965546190738678,
-      "eval_runtime": 1.2359,
-      "eval_samples_per_second": 40.458,
-      "eval_steps_per_second": 1.618,
       "learning_rate": 0.001,
       "step": 2
     },
     {
       "epoch": 2.0,
-      "eval_explained_variance": 0.08221305161714554,
-      "eval_loss": 0.7249369621276855,
-      "eval_mae": 0.37463027238845825,
-      "eval_r2": -26.38355827331543,
-      "eval_rmse": 0.40212786197662354,
-      "eval_runtime": 0.3187,
-      "eval_samples_per_second": 156.871,
-      "eval_steps_per_second": 6.275,
       "learning_rate": 0.001,
       "step": 4
     },
     {
       "epoch": 3.0,
-      "eval_explained_variance": 0.11782943457365036,
-      "eval_loss": 0.7532215118408203,
-      "eval_mae": 0.3815617859363556,
-      "eval_r2": -29.68680763244629,
-      "eval_rmse": 0.4113939702510834,
-      "eval_runtime": 0.3018,
-      "eval_samples_per_second": 165.696,
-      "eval_steps_per_second": 6.628,
       "learning_rate": 0.001,
       "step": 6
     },
     {
       "epoch": 4.0,
-      "eval_explained_variance": 0.05660984292626381,
-      "eval_loss": 0.7681224942207336,
-      "eval_mae": 0.384958416223526,
-      "eval_r2": -29.039794921875,
-      "eval_rmse": 0.4185601472854614,
-      "eval_runtime": 0.3198,
-      "eval_samples_per_second": 156.355,
-      "eval_steps_per_second": 6.254,
       "learning_rate": 0.001,
       "step": 8
     },
     {
       "epoch": 5.0,
-      "eval_explained_variance": 0.011602365411818027,
-      "eval_loss": 0.7665389776229858,
-      "eval_mae": 0.3826686143875122,
-      "eval_r2": -26.610107421875,
-      "eval_rmse": 0.4177513122558594,
-      "eval_runtime": 0.2997,
-      "eval_samples_per_second": 166.846,
-      "eval_steps_per_second": 6.674,
       "learning_rate": 0.001,
       "step": 10
     },
     {
       "epoch": 6.0,
-      "eval_explained_variance": -0.041439518332481384,
-      "eval_loss": 0.7593734860420227,
-      "eval_mae": 0.37791818380355835,
-      "eval_r2": -24.258955001831055,
-      "eval_rmse": 0.41521450877189636,
-      "eval_runtime": 0.3036,
-      "eval_samples_per_second": 164.675,
-      "eval_steps_per_second": 6.587,
       "learning_rate": 0.001,
       "step": 12
     },
     {
       "epoch": 7.0,
-      "eval_explained_variance": -0.18780630826950073,
-      "eval_loss": 0.7493597269058228,
-      "eval_mae": 0.3714950978755951,
-      "eval_r2": -22.30160903930664,
-      "eval_rmse": 0.41082921624183655,
-      "eval_runtime": 0.3045,
-      "eval_samples_per_second": 164.187,
-      "eval_steps_per_second": 6.567,
       "learning_rate": 0.001,
       "step": 14
     },
     {
       "epoch": 8.0,
-      "eval_explained_variance": -0.1876310557126999,
-      "eval_loss": 0.7214367389678955,
-      "eval_mae": 0.36099693179130554,
-      "eval_r2": -20.16297149658203,
-      "eval_rmse": 0.3992151916027069,
-      "eval_runtime": 0.325,
-      "eval_samples_per_second": 153.846,
-      "eval_steps_per_second": 6.154,
       "learning_rate": 0.0001,
       "step": 16
     },
     {
       "epoch": 9.0,
-      "eval_explained_variance": -0.164337158203125,
-      "eval_loss": 0.7012718915939331,
-      "eval_mae": 0.352971613407135,
-      "eval_r2": -18.67078971862793,
-      "eval_rmse": 0.3905433118343353,
-      "eval_runtime": 0.3097,
-      "eval_samples_per_second": 161.468,
-      "eval_steps_per_second": 6.459,
       "learning_rate": 0.0001,
       "step": 18
     },
     {
       "epoch": 10.0,
-      "eval_explained_variance": -0.15046803653240204,
-      "eval_loss": 0.6868528723716736,
-      "eval_mae": 0.346741646528244,
-      "eval_r2": -17.41924476623535,
-      "eval_rmse": 0.3835551142692566,
-      "eval_runtime": 0.3073,
-      "eval_samples_per_second": 162.696,
-      "eval_steps_per_second": 6.508,
       "learning_rate": 0.0001,
       "step": 20
     },
     {
       "epoch": 11.0,
-      "eval_explained_variance": -0.12824733555316925,
-      "eval_loss": 0.6764166951179504,
-      "eval_mae": 0.34248146414756775,
-      "eval_r2": -16.507604598999023,
-      "eval_rmse": 0.3787185549736023,
-      "eval_runtime": 0.3242,
-      "eval_samples_per_second": 154.219,
-      "eval_steps_per_second": 6.169,
       "learning_rate": 0.0001,
       "step": 22
     },
     {
       "epoch": 12.0,
-      "eval_explained_variance": -0.10852393507957458,
-      "eval_loss": 0.6669396758079529,
-      "eval_mae": 0.33840715885162354,
-      "eval_r2": -16.007225036621094,
-      "eval_rmse": 0.3739539384841919,
-      "eval_runtime": 0.3298,
-      "eval_samples_per_second": 151.614,
-      "eval_steps_per_second": 6.065,
       "learning_rate": 0.0001,
       "step": 24
     },
     {
       "epoch": 13.0,
-      "eval_explained_variance": -0.08818976581096649,
-      "eval_loss": 0.661744236946106,
-      "eval_mae": 0.3357750177383423,
-      "eval_r2": -15.561150550842285,
-      "eval_rmse": 0.3711845278739929,
-      "eval_runtime": 0.3053,
-      "eval_samples_per_second": 163.757,
-      "eval_steps_per_second": 6.55,
       "learning_rate": 0.0001,
       "step": 26
     },
     {
       "epoch": 14.0,
-      "eval_explained_variance": -0.03988352045416832,
-      "eval_loss": 0.6557328701019287,
-      "eval_mae": 0.33316293358802795,
-      "eval_r2": -14.847132682800293,
-      "eval_rmse": 0.3683193624019623,
-      "eval_runtime": 0.3055,
-      "eval_samples_per_second": 163.645,
-      "eval_steps_per_second": 6.546,
       "learning_rate": 0.0001,
       "step": 28
     },
     {
       "epoch": 15.0,
-      "eval_explained_variance": -0.014903265982866287,
-      "eval_loss": 0.6516609787940979,
-      "eval_mae": 0.33125975728034973,
-      "eval_r2": -14.374401092529297,
-      "eval_rmse": 0.36609962582588196,
-      "eval_runtime": 0.3245,
-      "eval_samples_per_second": 154.102,
-      "eval_steps_per_second": 6.164,
       "learning_rate": 0.0001,
       "step": 30
     },
     {
       "epoch": 16.0,
-      "eval_explained_variance": 0.0008760415366850793,
-      "eval_loss": 0.6493728756904602,
-      "eval_mae": 0.33018919825553894,
-      "eval_r2": -14.09227180480957,
-      "eval_rmse": 0.36498352885246277,
-      "eval_runtime": 0.2973,
-      "eval_samples_per_second": 168.196,
-      "eval_steps_per_second": 6.728,
       "learning_rate": 0.0001,
       "step": 32
     },
     {
       "epoch": 17.0,
-      "eval_explained_variance": 0.007616698741912842,
-      "eval_loss": 0.6469070315361023,
-      "eval_mae": 0.3284085690975189,
-      "eval_r2": -14.042997360229492,
-      "eval_rmse": 0.3634098768234253,
-      "eval_runtime": 0.2968,
-      "eval_samples_per_second": 168.439,
-      "eval_steps_per_second": 6.738,
       "learning_rate": 0.0001,
       "step": 34
     },
     {
       "epoch": 18.0,
-      "eval_explained_variance": 0.027522683143615723,
-      "eval_loss": 0.6455032825469971,
-      "eval_mae": 0.327472984790802,
-      "eval_r2": -13.848074913024902,
-      "eval_rmse": 0.3625529706478119,
-      "eval_runtime": 0.3023,
-      "eval_samples_per_second": 165.395,
-      "eval_steps_per_second": 6.616,
       "learning_rate": 0.0001,
       "step": 36
     },
     {
       "epoch": 19.0,
-      "eval_explained_variance": 0.04580416530370712,
-      "eval_loss": 0.64373379945755,
-      "eval_mae": 0.3270127475261688,
-      "eval_r2": -13.729372024536133,
-      "eval_rmse": 0.36171066761016846,
-      "eval_runtime": 0.2975,
-      "eval_samples_per_second": 168.069,
-      "eval_steps_per_second": 6.723,
       "learning_rate": 0.0001,
       "step": 38
     },
     {
       "epoch": 20.0,
-      "eval_explained_variance": 0.05705893412232399,
-      "eval_loss": 0.6426065564155579,
-      "eval_mae": 0.3264869153499603,
-      "eval_r2": -13.46953296661377,
-      "eval_rmse": 0.3610925078392029,
-      "eval_runtime": 0.303,
-      "eval_samples_per_second": 164.994,
-      "eval_steps_per_second": 6.6,
       "learning_rate": 0.0001,
       "step": 40
     },
     {
       "epoch": 21.0,
-      "eval_explained_variance": 0.058054760098457336,
-      "eval_loss": 0.6413648128509521,
-      "eval_mae": 0.32564398646354675,
-      "eval_r2": -13.444860458374023,
-      "eval_rmse": 0.36047738790512085,
-      "eval_runtime": 0.2971,
-      "eval_samples_per_second": 168.316,
-      "eval_steps_per_second": 6.733,
       "learning_rate": 0.0001,
       "step": 42
     },
     {
       "epoch": 22.0,
-      "eval_explained_variance": 0.05415903031826019,
-      "eval_loss": 0.6421814560890198,
-      "eval_mae": 0.32565081119537354,
-      "eval_r2": -13.317983627319336,
-      "eval_rmse": 0.360535204410553,
-      "eval_runtime": 0.2965,
-      "eval_samples_per_second": 168.653,
-      "eval_steps_per_second": 6.746,
       "learning_rate": 0.0001,
       "step": 44
     },
     {
       "epoch": 23.0,
-      "eval_explained_variance": 0.07554426789283752,
-      "eval_loss": 0.6406619548797607,
-      "eval_mae": 0.3246156871318817,
-      "eval_r2": -13.248732566833496,
-      "eval_rmse": 0.35933929681777954,
-      "eval_runtime": 0.2972,
-      "eval_samples_per_second": 168.22,
-      "eval_steps_per_second": 6.729,
       "learning_rate": 0.0001,
       "step": 46
     },
     {
       "epoch": 24.0,
-      "eval_explained_variance": 0.07407143712043762,
-      "eval_loss": 0.637528121471405,
-      "eval_mae": 0.32300955057144165,
-      "eval_r2": -13.249483108520508,
-      "eval_rmse": 0.35758209228515625,
-      "eval_runtime": 0.3004,
-      "eval_samples_per_second": 166.463,
-      "eval_steps_per_second": 6.659,
       "learning_rate": 0.0001,
       "step": 48
     },
     {
       "epoch": 25.0,
-      "eval_explained_variance": 0.08428207039833069,
-      "eval_loss": 0.6331558227539062,
-      "eval_mae": 0.3205055892467499,
-      "eval_r2": -12.964966773986816,
-      "eval_rmse": 0.35511815547943115,
-      "eval_runtime": 0.2968,
-      "eval_samples_per_second": 168.439,
-      "eval_steps_per_second": 6.738,
       "learning_rate": 0.0001,
       "step": 50
     },
     {
       "epoch": 26.0,
-      "eval_explained_variance": 0.0902879610657692,
-      "eval_loss": 0.6315688490867615,
-      "eval_mae": 0.3191172182559967,
-      "eval_r2": -12.712376594543457,
-      "eval_rmse": 0.3540325164794922,
-      "eval_runtime": 0.3046,
-      "eval_samples_per_second": 164.139,
-      "eval_steps_per_second": 6.566,
       "learning_rate": 0.0001,
       "step": 52
     },
     {
       "epoch": 27.0,
-      "eval_explained_variance": 0.09721990674734116,
-      "eval_loss": 0.6297861337661743,
-      "eval_mae": 0.3175807297229767,
-      "eval_r2": -12.53150749206543,
-      "eval_rmse": 0.3526574671268463,
-      "eval_runtime": 0.2981,
-      "eval_samples_per_second": 167.733,
-      "eval_steps_per_second": 6.709,
       "learning_rate": 0.0001,
       "step": 54
     },
     {
       "epoch": 28.0,
-      "eval_explained_variance": 0.10100533068180084,
-      "eval_loss": 0.6287277340888977,
-      "eval_mae": 0.3168259263038635,
-      "eval_r2": -12.393423080444336,
-      "eval_rmse": 0.35192248225212097,
-      "eval_runtime": 0.305,
-      "eval_samples_per_second": 163.956,
-      "eval_steps_per_second": 6.558,
       "learning_rate": 0.0001,
       "step": 56
     },
     {
       "epoch": 29.0,
-      "eval_explained_variance": 0.1064082533121109,
-      "eval_loss": 0.627882719039917,
-      "eval_mae": 0.3163486123085022,
-      "eval_r2": -12.323440551757812,
-      "eval_rmse": 0.35138675570487976,
-      "eval_runtime": 0.2979,
-      "eval_samples_per_second": 167.823,
-      "eval_steps_per_second": 6.713,
       "learning_rate": 0.0001,
       "step": 58
     },
     {
       "epoch": 30.0,
-      "eval_explained_variance": 0.1159624308347702,
-      "eval_loss": 0.6246291995048523,
-      "eval_mae": 0.3141040503978729,
-      "eval_r2": -12.231378555297852,
-      "eval_rmse": 0.3494300842285156,
-      "eval_runtime": 0.2969,
-      "eval_samples_per_second": 168.407,
-      "eval_steps_per_second": 6.736,
       "learning_rate": 0.0001,
       "step": 60
     },
     {
       "epoch": 31.0,
-      "eval_explained_variance": 0.1264413446187973,
-      "eval_loss": 0.6210973262786865,
-      "eval_mae": 0.31232017278671265,
-      "eval_r2": -12.064345359802246,
-      "eval_rmse": 0.34745490550994873,
-      "eval_runtime": 0.2987,
-      "eval_samples_per_second": 167.391,
-      "eval_steps_per_second": 6.696,
       "learning_rate": 0.0001,
       "step": 62
     },
     {
       "epoch": 32.0,
-      "eval_explained_variance": 0.12937316298484802,
-      "eval_loss": 0.6217814087867737,
-      "eval_mae": 0.31251102685928345,
-      "eval_r2": -11.966958045959473,
-      "eval_rmse": 0.3476860225200653,
-      "eval_runtime": 0.2966,
-      "eval_samples_per_second": 168.6,
-      "eval_steps_per_second": 6.744,
       "learning_rate": 0.0001,
       "step": 64
     },
     {
       "epoch": 33.0,
-      "eval_explained_variance": 0.13646358251571655,
-      "eval_loss": 0.6202294230461121,
-      "eval_mae": 0.3120400309562683,
-      "eval_r2": -11.754964828491211,
-      "eval_rmse": 0.3470361530780792,
-      "eval_runtime": 0.2983,
-      "eval_samples_per_second": 167.594,
-      "eval_steps_per_second": 6.704,
       "learning_rate": 0.0001,
       "step": 66
     },
     {
       "epoch": 34.0,
-      "eval_explained_variance": 0.13642433285713196,
-      "eval_loss": 0.6191384792327881,
-      "eval_mae": 0.31109973788261414,
-      "eval_r2": -11.614458084106445,
-      "eval_rmse": 0.34630581736564636,
-      "eval_runtime": 0.2968,
-      "eval_samples_per_second": 168.491,
-      "eval_steps_per_second": 6.74,
       "learning_rate": 0.0001,
       "step": 68
     },
     {
       "epoch": 35.0,
-      "eval_explained_variance": 0.1399742215871811,
-      "eval_loss": 0.617404043674469,
-      "eval_mae": 0.31046897172927856,
-      "eval_r2": -11.586063385009766,
-      "eval_rmse": 0.3454545736312866,
-      "eval_runtime": 0.3043,
-      "eval_samples_per_second": 164.292,
-      "eval_steps_per_second": 6.572,
       "learning_rate": 0.0001,
       "step": 70
     },
     {
       "epoch": 36.0,
-      "eval_explained_variance": 0.13982802629470825,
-      "eval_loss": 0.6194512248039246,
-      "eval_mae": 0.31094375252723694,
-      "eval_r2": -11.760537147521973,
-      "eval_rmse": 0.34623825550079346,
-      "eval_runtime": 0.3044,
-      "eval_samples_per_second": 164.269,
-      "eval_steps_per_second": 6.571,
       "learning_rate": 0.0001,
       "step": 72
     },
     {
       "epoch": 37.0,
-      "eval_explained_variance": 0.13672398030757904,
-      "eval_loss": 0.6209845542907715,
-      "eval_mae": 0.3114151358604431,
-      "eval_r2": -11.703511238098145,
-      "eval_rmse": 0.34697073698043823,
-      "eval_runtime": 0.2966,
-      "eval_samples_per_second": 168.568,
-      "eval_steps_per_second": 6.743,
-      "learning_rate": 0.0001,
       "step": 74
     },
     {
       "epoch": 38.0,
-      "eval_explained_variance": 0.1387355923652649,
-      "eval_loss": 0.6201078295707703,
-      "eval_mae": 0.31073129177093506,
-      "eval_r2": -11.660818099975586,
-      "eval_rmse": 0.3463174104690552,
-      "eval_runtime": 0.3051,
-      "eval_samples_per_second": 163.878,
-      "eval_steps_per_second": 6.555,
-      "learning_rate": 0.0001,
       "step": 76
     },
     {
       "epoch": 39.0,
-      "eval_explained_variance": 0.1361588090658188,
-      "eval_loss": 0.6195101141929626,
-      "eval_mae": 0.31057408452033997,
-      "eval_r2": -11.629423141479492,
-      "eval_rmse": 0.34605538845062256,
-      "eval_runtime": 0.3059,
-      "eval_samples_per_second": 163.478,
-      "eval_steps_per_second": 6.539,
-      "learning_rate": 0.0001,
       "step": 78
     },
     {
       "epoch": 40.0,
-      "eval_explained_variance": 0.12785865366458893,
-      "eval_loss": 0.619523823261261,
-      "eval_mae": 0.3101230263710022,
-      "eval_r2": -11.670927047729492,
-      "eval_rmse": 0.34588271379470825,
-      "eval_runtime": 0.2984,
-      "eval_samples_per_second": 167.532,
-      "eval_steps_per_second": 6.701,
-      "learning_rate": 0.0001,
-      "step": 80
-    },
-    {
-      "epoch": 41.0,
-      "eval_explained_variance": 0.11544161289930344,
-      "eval_loss": 0.6195899844169617,
-      "eval_mae": 0.30954211950302124,
-      "eval_r2": -11.46561050415039,
-      "eval_rmse": 0.34560662508010864,
-      "eval_runtime": 0.3049,
-      "eval_samples_per_second": 163.969,
-      "eval_steps_per_second": 6.559,
-      "learning_rate": 0.0001,
-      "step": 82
-    },
-    {
-      "epoch": 42.0,
-      "eval_explained_variance": 0.12202569097280502,
-      "eval_loss": 0.6184768676757812,
-      "eval_mae": 0.3095985949039459,
-      "eval_r2": -11.41903305053711,
-      "eval_rmse": 0.3453018367290497,
-      "eval_runtime": 0.3052,
-      "eval_samples_per_second": 163.826,
-      "eval_steps_per_second": 6.553,
-      "learning_rate": 1e-05,
-      "step": 84
-    },
-    {
-      "epoch": 43.0,
-      "eval_explained_variance": 0.12239150702953339,
-      "eval_loss": 0.619608998298645,
-      "eval_mae": 0.3099028468132019,
-      "eval_r2": -11.421133995056152,
-      "eval_rmse": 0.3457002341747284,
-      "eval_runtime": 0.2987,
-      "eval_samples_per_second": 167.405,
-      "eval_steps_per_second": 6.696,
-      "learning_rate": 1e-05,
-      "step": 86
-    },
-    {
-      "epoch": 44.0,
-      "eval_explained_variance": 0.12524205446243286,
-      "eval_loss": 0.6175010204315186,
-      "eval_mae": 0.3090519905090332,
-      "eval_r2": -11.342177391052246,
-      "eval_rmse": 0.34480178356170654,
-      "eval_runtime": 0.3287,
-      "eval_samples_per_second": 152.124,
-      "eval_steps_per_second": 6.085,
-      "learning_rate": 1e-05,
-      "step": 88
-    },
-    {
-      "epoch": 45.0,
-      "eval_explained_variance": 0.12674368917942047,
-      "eval_loss": 0.6147510409355164,
-      "eval_mae": 0.307899534702301,
-      "eval_r2": -11.237728118896484,
-      "eval_rmse": 0.3434869647026062,
-      "eval_runtime": 0.3235,
-      "eval_samples_per_second": 154.557,
-      "eval_steps_per_second": 6.182,
-      "learning_rate": 1e-05,
-      "step": 90
-    },
-    {
-      "epoch": 46.0,
-      "eval_explained_variance": 0.12321905046701431,
-      "eval_loss": 0.6155768036842346,
-      "eval_mae": 0.3080970048904419,
-      "eval_r2": -11.216095924377441,
-      "eval_rmse": 0.3438577651977539,
-      "eval_runtime": 0.299,
-      "eval_samples_per_second": 167.246,
-      "eval_steps_per_second": 6.69,
-      "learning_rate": 1e-05,
-      "step": 92
-    },
-    {
-      "epoch": 47.0,
-      "eval_explained_variance": 0.12190257012844086,
-      "eval_loss": 0.616154670715332,
-      "eval_mae": 0.30844491720199585,
-      "eval_r2": -11.23585319519043,
-      "eval_rmse": 0.3442190885543823,
-      "eval_runtime": 0.299,
-      "eval_samples_per_second": 167.245,
-      "eval_steps_per_second": 6.69,
-      "learning_rate": 1e-05,
-      "step": 94
-    },
-    {
-      "epoch": 48.0,
-      "eval_explained_variance": 0.12182028591632843,
-      "eval_loss": 0.6153092980384827,
-      "eval_mae": 0.3079487085342407,
-      "eval_r2": -11.14069652557373,
-      "eval_rmse": 0.34381839632987976,
-      "eval_runtime": 0.3282,
-      "eval_samples_per_second": 152.339,
-      "eval_steps_per_second": 6.094,
-      "learning_rate": 1e-05,
-      "step": 96
-    },
-    {
-      "epoch": 49.0,
-      "eval_explained_variance": 0.12591353058815002,
-      "eval_loss": 0.6142339110374451,
-      "eval_mae": 0.3075259327888489,
-      "eval_r2": -11.087849617004395,
-      "eval_rmse": 0.3433670699596405,
-      "eval_runtime": 0.3232,
-      "eval_samples_per_second": 154.7,
-      "eval_steps_per_second": 6.188,
       "learning_rate": 1e-05,
-      "step": 98
-    },
-    {
-      "epoch": 50.0,
-      "eval_explained_variance": 0.12409819662570953,
-      "eval_loss": 0.6125256419181824,
-      "eval_mae": 0.3070906400680542,
-      "eval_r2": -11.164841651916504,
-      "eval_rmse": 0.34268108010292053,
-      "eval_runtime": 0.323,
-      "eval_samples_per_second": 154.8,
-      "eval_steps_per_second": 6.192,
-      "learning_rate": 1e-05,
-      "step": 100
     },
     {
-      "epoch": 51.0,
-      "eval_explained_variance": 0.12737669050693512,
-      "eval_loss": 0.6131001114845276,
-      "eval_mae": 0.3071759045124054,
-      "eval_r2": -11.23709487915039,
-      "eval_rmse": 0.34303510189056396,
-      "eval_runtime": 0.3251,
-      "eval_samples_per_second": 153.791,
-      "eval_steps_per_second": 6.152,
-      "learning_rate": 1e-05,
-      "step": 102
-    },
-    {
-      "epoch": 52.0,
-      "eval_explained_variance": 0.12739494442939758,
-      "eval_loss": 0.6136941313743591,
-      "eval_mae": 0.30773404240608215,
-      "eval_r2": -11.390901565551758,
-      "eval_rmse": 0.34343937039375305,
-      "eval_runtime": 0.3154,
-      "eval_samples_per_second": 158.551,
-      "eval_steps_per_second": 6.342,
-      "learning_rate": 1e-05,
-      "step": 104
-    },
-    {
-      "epoch": 53.0,
-      "eval_explained_variance": 0.12241682410240173,
-      "eval_loss": 0.613895058631897,
-      "eval_mae": 0.3076512813568115,
-      "eval_r2": -11.501760482788086,
-      "eval_rmse": 0.3434452712535858,
-      "eval_runtime": 0.3001,
-      "eval_samples_per_second": 166.603,
-      "eval_steps_per_second": 6.664,
-      "learning_rate": 1e-05,
-      "step": 106
-    },
-    {
-      "epoch": 54.0,
-      "eval_explained_variance": 0.1222328469157219,
-      "eval_loss": 0.6156599521636963,
-      "eval_mae": 0.30890733003616333,
-      "eval_r2": -11.667372703552246,
-      "eval_rmse": 0.3445097804069519,
-      "eval_runtime": 0.3773,
-      "eval_samples_per_second": 132.51,
-      "eval_steps_per_second": 5.3,
-      "learning_rate": 1e-05,
-      "step": 108
-    },
-    {
-      "epoch": 55.0,
-      "eval_explained_variance": 0.12218669801950455,
-      "eval_loss": 0.6167553067207336,
-      "eval_mae": 0.30896657705307007,
-      "eval_r2": -11.646692276000977,
-      "eval_rmse": 0.34482434391975403,
-      "eval_runtime": 0.3779,
-      "eval_samples_per_second": 132.317,
-      "eval_steps_per_second": 5.293,
-      "learning_rate": 1e-05,
-      "step": 110
-    },
-    {
-      "epoch": 56.0,
-      "eval_explained_variance": 0.12501628696918488,
-      "eval_loss": 0.6139956116676331,
-      "eval_mae": 0.3077108561992645,
-      "eval_r2": -11.49679946899414,
-      "eval_rmse": 0.3434431850910187,
-      "eval_runtime": 0.2984,
-      "eval_samples_per_second": 167.575,
-      "eval_steps_per_second": 6.703,
       "learning_rate": 1e-05,
-      "step": 112
-    },
-    {
-      "epoch": 57.0,
-      "eval_explained_variance": 0.12155170738697052,
-      "eval_loss": 0.6132706999778748,
-      "eval_mae": 0.3070979416370392,
-      "eval_r2": -11.500228881835938,
-      "eval_rmse": 0.342957466840744,
-      "eval_runtime": 0.3776,
-      "eval_samples_per_second": 132.398,
-      "eval_steps_per_second": 5.296,
-      "learning_rate": 1.0000000000000002e-06,
-      "step": 114
-    },
-    {
-      "epoch": 58.0,
-      "eval_explained_variance": 0.12097452580928802,
-      "eval_loss": 0.6130067706108093,
-      "eval_mae": 0.30698391795158386,
-      "eval_r2": -11.447521209716797,
-      "eval_rmse": 0.3428483307361603,
-      "eval_runtime": 0.3786,
-      "eval_samples_per_second": 132.082,
-      "eval_steps_per_second": 5.283,
-      "learning_rate": 1.0000000000000002e-06,
-      "step": 116
-    },
-    {
-      "epoch": 59.0,
-      "eval_explained_variance": 0.11784002184867859,
-      "eval_loss": 0.61500084400177,
-      "eval_mae": 0.30830222368240356,
-      "eval_r2": -11.556161880493164,
-      "eval_rmse": 0.34413495659828186,
-      "eval_runtime": 0.3056,
-      "eval_samples_per_second": 163.604,
-      "eval_steps_per_second": 6.544,
-      "learning_rate": 1.0000000000000002e-06,
-      "step": 118
-    },
-    {
-      "epoch": 60.0,
-      "eval_explained_variance": 0.12427856028079987,
-      "eval_loss": 0.6166698336601257,
-      "eval_mae": 0.30922549962997437,
-      "eval_r2": -11.467646598815918,
-      "eval_rmse": 0.34501928091049194,
-      "eval_runtime": 0.3778,
-      "eval_samples_per_second": 132.332,
-      "eval_steps_per_second": 5.293,
-      "learning_rate": 1.0000000000000002e-06,
-      "step": 120
-    },
-    {
-      "epoch": 60.0,
-      "learning_rate": 1.0000000000000002e-06,
-      "step": 120,
-      "total_flos": 4.4402778184752e+17,
-      "train_loss": 0.6329069137573242,
-      "train_runtime": 375.0945,
-      "train_samples_per_second": 19.995,
-      "train_steps_per_second": 0.8
     }
   ],
   "logging_steps": 500,
@@ -825,7 +565,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 4.4402778184752e+17,
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 0.6263097524642944,
+  "best_model_checkpoint": "/home1/datahome/villien/project_hub/DinoVdeau/models/Ziboiai-large-2024_10_31-prova_batch-size32_freeze_probs/checkpoint-60",
+  "epoch": 40.0,
   "eval_steps": 500,
+  "global_step": 80,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_explained_variance": 0.03638218343257904,
+      "eval_loss": 0.7150455713272095,
+      "eval_mae": 0.3848940134048462,
+      "eval_r2": -20.29086685180664,
+      "eval_rmse": 0.40997111797332764,
+      "eval_runtime": 1.32,
+      "eval_samples_per_second": 37.88,
+      "eval_steps_per_second": 1.515,
       "learning_rate": 0.001,
       "step": 2
     },
     {
       "epoch": 2.0,
+      "eval_explained_variance": 0.0240942370146513,
+      "eval_loss": 0.7314126491546631,
+      "eval_mae": 0.3895121216773987,
+      "eval_r2": -21.218204498291016,
+      "eval_rmse": 0.4163060486316681,
+      "eval_runtime": 0.3125,
+      "eval_samples_per_second": 160.002,
+      "eval_steps_per_second": 6.4,
       "learning_rate": 0.001,
       "step": 4
     },
     {
       "epoch": 3.0,
+      "eval_explained_variance": -0.04694412648677826,
+      "eval_loss": 0.7726277112960815,
+      "eval_mae": 0.40413352847099304,
+      "eval_r2": -24.822391510009766,
+      "eval_rmse": 0.4320966601371765,
+      "eval_runtime": 0.3275,
+      "eval_samples_per_second": 152.667,
+      "eval_steps_per_second": 6.107,
       "learning_rate": 0.001,
       "step": 6
     },
     {
       "epoch": 4.0,
+      "eval_explained_variance": -0.06671242415904999,
+      "eval_loss": 0.7917326092720032,
+      "eval_mae": 0.4094983637332916,
+      "eval_r2": -26.581586837768555,
+      "eval_rmse": 0.4379725754261017,
+      "eval_runtime": 0.3153,
+      "eval_samples_per_second": 158.574,
+      "eval_steps_per_second": 6.343,
       "learning_rate": 0.001,
       "step": 8
     },
     {
       "epoch": 5.0,
+      "eval_explained_variance": -0.13621382415294647,
+      "eval_loss": 0.7852649092674255,
+      "eval_mae": 0.402120441198349,
+      "eval_r2": -26.95589256286621,
+      "eval_rmse": 0.43184274435043335,
+      "eval_runtime": 0.3123,
+      "eval_samples_per_second": 160.086,
+      "eval_steps_per_second": 6.403,
       "learning_rate": 0.001,
       "step": 10
     },
     {
       "epoch": 6.0,
+      "eval_explained_variance": -0.12974193692207336,
+      "eval_loss": 0.7647674679756165,
+      "eval_mae": 0.3905399441719055,
+      "eval_r2": -24.40153694152832,
+      "eval_rmse": 0.42244094610214233,
+      "eval_runtime": 0.3317,
+      "eval_samples_per_second": 150.759,
+      "eval_steps_per_second": 6.03,
       "learning_rate": 0.001,
       "step": 12
     },
     {
       "epoch": 7.0,
+      "eval_explained_variance": -0.10977767407894135,
+      "eval_loss": 0.7391812205314636,
+      "eval_mae": 0.376028835773468,
+      "eval_r2": -22.557889938354492,
+      "eval_rmse": 0.41028541326522827,
+      "eval_runtime": 0.3205,
+      "eval_samples_per_second": 155.989,
+      "eval_steps_per_second": 6.24,
       "learning_rate": 0.001,
       "step": 14
     },
     {
       "epoch": 8.0,
+      "eval_explained_variance": -0.10544480383396149,
+      "eval_loss": 0.7115270495414734,
+      "eval_mae": 0.36385056376457214,
+      "eval_r2": -20.067392349243164,
+      "eval_rmse": 0.39825379848480225,
+      "eval_runtime": 0.3104,
+      "eval_samples_per_second": 161.103,
+      "eval_steps_per_second": 6.444,
       "learning_rate": 0.0001,
       "step": 16
     },
     {
       "epoch": 9.0,
+      "eval_explained_variance": -0.09249210357666016,
+      "eval_loss": 0.6896975040435791,
+      "eval_mae": 0.35347798466682434,
+      "eval_r2": -18.16646385192871,
+      "eval_rmse": 0.3878582715988159,
+      "eval_runtime": 0.3226,
+      "eval_samples_per_second": 155.006,
+      "eval_steps_per_second": 6.2,
       "learning_rate": 0.0001,
       "step": 18
     },
     {
       "epoch": 10.0,
+      "eval_explained_variance": -0.10285507887601852,
+      "eval_loss": 0.6777035593986511,
+      "eval_mae": 0.34683120250701904,
+      "eval_r2": -16.94469451904297,
+      "eval_rmse": 0.3818005323410034,
+      "eval_runtime": 0.3016,
+      "eval_samples_per_second": 165.76,
+      "eval_steps_per_second": 6.63,
       "learning_rate": 0.0001,
       "step": 20
     },
     {
       "epoch": 11.0,
+      "eval_explained_variance": -0.11687294393777847,
+      "eval_loss": 0.6701759099960327,
+      "eval_mae": 0.3423532247543335,
+      "eval_r2": -16.037521362304688,
+      "eval_rmse": 0.3779585659503937,
+      "eval_runtime": 0.3107,
+      "eval_samples_per_second": 160.916,
+      "eval_steps_per_second": 6.437,
       "learning_rate": 0.0001,
       "step": 22
     },
     {
       "epoch": 12.0,
+      "eval_explained_variance": -0.11208173632621765,
+      "eval_loss": 0.663905918598175,
+      "eval_mae": 0.3388546407222748,
+      "eval_r2": -15.605177879333496,
+      "eval_rmse": 0.37438222765922546,
+      "eval_runtime": 0.3308,
+      "eval_samples_per_second": 151.17,
+      "eval_steps_per_second": 6.047,
       "learning_rate": 0.0001,
       "step": 24
     },
     {
       "epoch": 13.0,
+      "eval_explained_variance": -0.10647904872894287,
+      "eval_loss": 0.656491219997406,
+      "eval_mae": 0.3345881700515747,
+      "eval_r2": -14.805088996887207,
+      "eval_rmse": 0.3702985942363739,
+      "eval_runtime": 0.3222,
+      "eval_samples_per_second": 155.166,
+      "eval_steps_per_second": 6.207,
       "learning_rate": 0.0001,
       "step": 26
     },
     {
       "epoch": 14.0,
+      "eval_explained_variance": -0.0958017110824585,
+      "eval_loss": 0.6501385569572449,
+      "eval_mae": 0.33100754022598267,
+      "eval_r2": -14.231175422668457,
+      "eval_rmse": 0.3668138384819031,
+      "eval_runtime": 0.3293,
+      "eval_samples_per_second": 151.853,
+      "eval_steps_per_second": 6.074,
       "learning_rate": 0.0001,
       "step": 28
     },
     {
       "epoch": 15.0,
+      "eval_explained_variance": -0.08547426015138626,
+      "eval_loss": 0.6467865705490112,
+      "eval_mae": 0.32885220646858215,
+      "eval_r2": -14.07986831665039,
+      "eval_rmse": 0.36475783586502075,
+      "eval_runtime": 0.3253,
+      "eval_samples_per_second": 153.717,
+      "eval_steps_per_second": 6.149,
       "learning_rate": 0.0001,
       "step": 30
     },
     {
       "epoch": 16.0,
+      "eval_explained_variance": -0.08231981098651886,
+      "eval_loss": 0.6471170783042908,
+      "eval_mae": 0.3288896679878235,
+      "eval_r2": -14.255745887756348,
+      "eval_rmse": 0.3650059998035431,
+      "eval_runtime": 0.305,
+      "eval_samples_per_second": 163.945,
+      "eval_steps_per_second": 6.558,
       "learning_rate": 0.0001,
       "step": 32
     },
     {
       "epoch": 17.0,
+      "eval_explained_variance": -0.08097466081380844,
+      "eval_loss": 0.6435126662254333,
+      "eval_mae": 0.3268200755119324,
+      "eval_r2": -14.059813499450684,
+      "eval_rmse": 0.36310678720474243,
+      "eval_runtime": 0.3322,
+      "eval_samples_per_second": 150.492,
+      "eval_steps_per_second": 6.02,
       "learning_rate": 0.0001,
       "step": 34
     },
     {
       "epoch": 18.0,
+      "eval_explained_variance": -0.07994352281093597,
+      "eval_loss": 0.6437923908233643,
+      "eval_mae": 0.3269612491130829,
+      "eval_r2": -14.036934852600098,
+      "eval_rmse": 0.36342939734458923,
+      "eval_runtime": 0.3107,
+      "eval_samples_per_second": 160.922,
+      "eval_steps_per_second": 6.437,
       "learning_rate": 0.0001,
       "step": 36
     },
     {
       "epoch": 19.0,
+      "eval_explained_variance": -0.08883289247751236,
+      "eval_loss": 0.6399621367454529,
+      "eval_mae": 0.3249860107898712,
+      "eval_r2": -13.81522274017334,
+      "eval_rmse": 0.36136963963508606,
+      "eval_runtime": 0.3104,
+      "eval_samples_per_second": 161.092,
+      "eval_steps_per_second": 6.444,
       "learning_rate": 0.0001,
       "step": 38
     },
     {
       "epoch": 20.0,
+      "eval_explained_variance": -0.09353505074977875,
+      "eval_loss": 0.6391971707344055,
+      "eval_mae": 0.3246455192565918,
+      "eval_r2": -13.710391998291016,
+      "eval_rmse": 0.3608955144882202,
+      "eval_runtime": 0.3119,
+      "eval_samples_per_second": 160.306,
+      "eval_steps_per_second": 6.412,
       "learning_rate": 0.0001,
       "step": 40
     },
     {
       "epoch": 21.0,
+      "eval_explained_variance": -0.09930111467838287,
+      "eval_loss": 0.6386714577674866,
+      "eval_mae": 0.32462170720100403,
+      "eval_r2": -13.809860229492188,
+      "eval_rmse": 0.3606450855731964,
+      "eval_runtime": 0.3149,
+      "eval_samples_per_second": 158.8,
+      "eval_steps_per_second": 6.352,
       "learning_rate": 0.0001,
       "step": 42
     },
     {
       "epoch": 22.0,
+      "eval_explained_variance": -0.10561199486255646,
+      "eval_loss": 0.6388444304466248,
+      "eval_mae": 0.3243348002433777,
+      "eval_r2": -13.849721908569336,
+      "eval_rmse": 0.36056435108184814,
+      "eval_runtime": 0.3094,
+      "eval_samples_per_second": 161.607,
+      "eval_steps_per_second": 6.464,
       "learning_rate": 0.0001,
       "step": 44
     },
     {
       "epoch": 23.0,
+      "eval_explained_variance": -0.1035044863820076,
+      "eval_loss": 0.6361631155014038,
+      "eval_mae": 0.3227779269218445,
+      "eval_r2": -13.562189102172852,
+      "eval_rmse": 0.35895633697509766,
+      "eval_runtime": 0.3094,
+      "eval_samples_per_second": 161.581,
+      "eval_steps_per_second": 6.463,
       "learning_rate": 0.0001,
       "step": 46
     },
     {
       "epoch": 24.0,
+      "eval_explained_variance": -0.10584529489278793,
+      "eval_loss": 0.635435163974762,
+      "eval_mae": 0.3223152160644531,
+      "eval_r2": -13.645319938659668,
+      "eval_rmse": 0.35847193002700806,
+      "eval_runtime": 0.3094,
+      "eval_samples_per_second": 161.602,
+      "eval_steps_per_second": 6.464,
       "learning_rate": 0.0001,
       "step": 48
     },
     {
       "epoch": 25.0,
+      "eval_explained_variance": -0.1035505086183548,
+      "eval_loss": 0.6344550848007202,
+      "eval_mae": 0.32144099473953247,
+      "eval_r2": -13.602314949035645,
+      "eval_rmse": 0.35783687233924866,
+      "eval_runtime": 0.3092,
+      "eval_samples_per_second": 161.704,
+      "eval_steps_per_second": 6.468,
       "learning_rate": 0.0001,
       "step": 50
     },
     {
       "epoch": 26.0,
+      "eval_explained_variance": -0.11728200316429138,
+      "eval_loss": 0.6348865628242493,
+      "eval_mae": 0.3211889863014221,
+      "eval_r2": -13.630416870117188,
+      "eval_rmse": 0.3580625355243683,
+      "eval_runtime": 0.331,
+      "eval_samples_per_second": 151.064,
+      "eval_steps_per_second": 6.043,
       "learning_rate": 0.0001,
       "step": 52
     },
     {
       "epoch": 27.0,
+      "eval_explained_variance": -0.11483900249004364,
+      "eval_loss": 0.6332749724388123,
+      "eval_mae": 0.32009246945381165,
+      "eval_r2": -13.561347007751465,
+      "eval_rmse": 0.3570806384086609,
+      "eval_runtime": 0.3173,
+      "eval_samples_per_second": 157.565,
+      "eval_steps_per_second": 6.303,
       "learning_rate": 0.0001,
       "step": 54
     },
     {
       "epoch": 28.0,
+      "eval_explained_variance": -0.10828801989555359,
+      "eval_loss": 0.6295092701911926,
+      "eval_mae": 0.31767499446868896,
+      "eval_r2": -13.23308277130127,
+      "eval_rmse": 0.35479238629341125,
+      "eval_runtime": 0.3087,
+      "eval_samples_per_second": 161.989,
+      "eval_steps_per_second": 6.48,
       "learning_rate": 0.0001,
       "step": 56
     },
     {
       "epoch": 29.0,
+      "eval_explained_variance": -0.1047045886516571,
+      "eval_loss": 0.6285346746444702,
+      "eval_mae": 0.3173280954360962,
+      "eval_r2": -13.162256240844727,
+      "eval_rmse": 0.35434553027153015,
+      "eval_runtime": 0.3277,
+      "eval_samples_per_second": 152.596,
+      "eval_steps_per_second": 6.104,
       "learning_rate": 0.0001,
       "step": 58
     },
     {
       "epoch": 30.0,
+      "eval_explained_variance": -0.09264782071113586,
+      "eval_loss": 0.6263097524642944,
+      "eval_mae": 0.31627562642097473,
+      "eval_r2": -12.713174819946289,
+      "eval_rmse": 0.3532228171825409,
+      "eval_runtime": 0.3523,
+      "eval_samples_per_second": 141.931,
+      "eval_steps_per_second": 5.677,
       "learning_rate": 0.0001,
       "step": 60
     },
     {
       "epoch": 31.0,
+      "eval_explained_variance": -0.08934260159730911,
+      "eval_loss": 0.6272528767585754,
+      "eval_mae": 0.316723495721817,
+      "eval_r2": -12.873921394348145,
+      "eval_rmse": 0.35376670956611633,
+      "eval_runtime": 0.3073,
+      "eval_samples_per_second": 162.723,
+      "eval_steps_per_second": 6.509,
       "learning_rate": 0.0001,
       "step": 62
     },
     {
       "epoch": 32.0,
+      "eval_explained_variance": -0.07898036390542984,
+      "eval_loss": 0.6294133067131042,
+      "eval_mae": 0.31807586550712585,
+      "eval_r2": -12.935453414916992,
+      "eval_rmse": 0.3550169765949249,
+      "eval_runtime": 0.3094,
+      "eval_samples_per_second": 161.626,
+      "eval_steps_per_second": 6.465,
       "learning_rate": 0.0001,
       "step": 64
     },
     {
       "epoch": 33.0,
+      "eval_explained_variance": -0.07519607990980148,
+      "eval_loss": 0.6299176216125488,
+      "eval_mae": 0.3185364603996277,
+      "eval_r2": -12.93520736694336,
+      "eval_rmse": 0.35538923740386963,
+      "eval_runtime": 0.3097,
+      "eval_samples_per_second": 161.472,
+      "eval_steps_per_second": 6.459,
       "learning_rate": 0.0001,
       "step": 66
     },
     {
       "epoch": 34.0,
+      "eval_explained_variance": -0.07019602507352829,
+      "eval_loss": 0.6320692300796509,
+      "eval_mae": 0.3193182349205017,
+      "eval_r2": -13.267191886901855,
+      "eval_rmse": 0.35644862055778503,
+      "eval_runtime": 0.3161,
+      "eval_samples_per_second": 158.177,
+      "eval_steps_per_second": 6.327,
       "learning_rate": 0.0001,
       "step": 68
     },
     {
       "epoch": 35.0,
+      "eval_explained_variance": -0.04873532056808472,
+      "eval_loss": 0.6279481649398804,
+      "eval_mae": 0.31752488017082214,
+      "eval_r2": -12.99951171875,
+      "eval_rmse": 0.3541102707386017,
+      "eval_runtime": 0.3124,
+      "eval_samples_per_second": 160.036,
+      "eval_steps_per_second": 6.401,
       "learning_rate": 0.0001,
       "step": 70
     },
     {
       "epoch": 36.0,
+      "eval_explained_variance": -0.04663123935461044,
+      "eval_loss": 0.6280075907707214,
+      "eval_mae": 0.31736499071121216,
+      "eval_r2": -13.00741195678711,
+      "eval_rmse": 0.35407301783561707,
+      "eval_runtime": 0.3095,
+      "eval_samples_per_second": 161.554,
+      "eval_steps_per_second": 6.462,
       "learning_rate": 0.0001,
       "step": 72
     },
     {
       "epoch": 37.0,
+      "eval_explained_variance": -0.04936327785253525,
+      "eval_loss": 0.6303659081459045,
+      "eval_mae": 0.3187006115913391,
+      "eval_r2": -13.230977058410645,
+      "eval_rmse": 0.35543760657310486,
+      "eval_runtime": 0.3251,
+      "eval_samples_per_second": 153.806,
+      "eval_steps_per_second": 6.152,
+      "learning_rate": 1e-05,
       "step": 74
     },
     {
       "epoch": 38.0,
+      "eval_explained_variance": -0.04394898936152458,
+      "eval_loss": 0.6297122836112976,
+      "eval_mae": 0.31833118200302124,
+      "eval_r2": -12.983016967773438,
+      "eval_rmse": 0.3550592064857483,
+      "eval_runtime": 0.3087,
+      "eval_samples_per_second": 161.995,
+      "eval_steps_per_second": 6.48,
+      "learning_rate": 1e-05,
       "step": 76
     },
     {
       "epoch": 39.0,
+      "eval_explained_variance": -0.04296223446726799,
+      "eval_loss": 0.630845308303833,
+      "eval_mae": 0.3193325996398926,
+      "eval_r2": -13.159842491149902,
+      "eval_rmse": 0.35580796003341675,
+      "eval_runtime": 0.3097,
+      "eval_samples_per_second": 161.465,
+      "eval_steps_per_second": 6.459,
+      "learning_rate": 1e-05,
       "step": 78
     },
     {
       "epoch": 40.0,
+      "eval_explained_variance": -0.04348618537187576,
+      "eval_loss": 0.6291573643684387,
+      "eval_mae": 0.3182610869407654,
+      "eval_r2": -13.069788932800293,
+      "eval_rmse": 0.3547934889793396,
+      "eval_runtime": 0.3206,
+      "eval_samples_per_second": 155.938,
+      "eval_steps_per_second": 6.238,
       "learning_rate": 1e-05,
+      "step": 80
     },
     {
+      "epoch": 40.0,
       "learning_rate": 1e-05,
+      "step": 80,
+      "total_flos": 2.9601852123168e+17,
+      "train_loss": 0.64580397605896,
+      "train_runtime": 275.9938,
+      "train_samples_per_second": 27.175,
+      "train_steps_per_second": 1.087
     }
   ],
   "logging_steps": 500,
       "attributes": {}
     }
   },
+  "total_flos": 2.9601852123168e+17,
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null