nu-dialogue
/

sfcoco2022-clipcap

Model card Files Files and versions Community

ohashi56225 commited on Dec 19, 2022

Commit

8b742bc

•

1 Parent(s): fc5444e

Add pretrained checkpoints

Browse files

Files changed (9) hide show

coco-gpt_medium-en_clip_b32-transformer-finetune-ep10-bs48-lr2e-05/004.pt +3 -0
coco-gpt_medium-en_clip_b32-transformer-finetune-ep10-bs48-lr2e-05/args.json +26 -0
coco-gpt_medium-en_clip_b32-transformer-finetune-ep10-bs48-lr2e-05/log.json +52 -0
coco_based-sfcoco2022-gpt_medium-en_clip_b32-transformer-finetune-ep20-bs8-lr2e-05/011.pt +3 -0
coco_based-sfcoco2022-gpt_medium-en_clip_b32-transformer-finetune-ep20-bs8-lr2e-05/args.json +26 -0
coco_based-sfcoco2022-gpt_medium-en_clip_b32-transformer-finetune-ep20-bs8-lr2e-05/log.json +102 -0
coco_based-sfcoco_merged-gpt_medium-en_clip_b32-transformer-finetune-ep20-bs8-lr2e-05/009.pt +3 -0
coco_based-sfcoco_merged-gpt_medium-en_clip_b32-transformer-finetune-ep20-bs8-lr2e-05/args.json +26 -0
coco_based-sfcoco_merged-gpt_medium-en_clip_b32-transformer-finetune-ep20-bs8-lr2e-05/log.json +67 -0

coco-gpt_medium-en_clip_b32-transformer-finetune-ep10-bs48-lr2e-05/004.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:692bec3c3fa7b1c4c4c14dca42d9c5347fb0d9f0ee2478b1a50cb8b2acdc4ed8
+size 1659607609

coco-gpt_medium-en_clip_b32-transformer-finetune-ep10-bs48-lr2e-05/args.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+    "train_name_prefix": null,
+    "dataset_name": "coco",
+    "rinna_gpt_name": "gpt_medium",
+    "clip_model_name": "en_clip_b32",
+    "pretrained_path": null,
+    "datasets_dpath": "./data",
+    "checkpoints_dpath": "./checkpoints",
+    "epochs": 10,
+    "per_gpu_train_batch_size": 24,
+    "per_gpu_eval_batch_size": 24,
+    "lr": 2e-05,
+    "warmup_steps": 5000,
+    "save_every": 1,
+    "mapping_type": "transformer",
+    "prefix_length": 10,
+    "prefix_length_clip": 10,
+    "only_prefix": false,
+    "num_layers": 8,
+    "n_gpu": 2,
+    "prefix_dim": 512,
+    "train_batch_size": 48,
+    "eval_batch_size": 48,
+    "train_data_fpath": "./data/coco/processed-en_clip_b32/train.pkl",
+    "valid_data_fpath": "./data/coco/processed-en_clip_b32/valid.pkl"
+}

coco-gpt_medium-en_clip_b32-transformer-finetune-ep10-bs48-lr2e-05/log.json ADDED Viewed

	@@ -0,0 +1,52 @@

+[
+    {
+        "epoch": 0,
+        "train_avg_loss": 2.900748385220834,
+        "valid_avg_loss": 2.0124718794857497
+    },
+    {
+        "epoch": 1,
+        "train_avg_loss": 1.929572620044265,
+        "valid_avg_loss": 1.842193490397321
+    },
+    {
+        "epoch": 2,
+        "train_avg_loss": 1.755735797382433,
+        "valid_avg_loss": 1.7596544592920011
+    },
+    {
+        "epoch": 3,
+        "train_avg_loss": 1.630243831397732,
+        "valid_avg_loss": 1.7320620456751246
+    },
+    {
+        "epoch": 4,
+        "train_avg_loss": 1.5287480419480448,
+        "valid_avg_loss": 1.7225063604159947
+    },
+    {
+        "epoch": 5,
+        "train_avg_loss": 1.4382578874774836,
+        "valid_avg_loss": 1.7327922234570023
+    },
+    {
+        "epoch": 6,
+        "train_avg_loss": 1.3579212888226693,
+        "valid_avg_loss": 1.7398730559940756
+    },
+    {
+        "epoch": 7,
+        "train_avg_loss": 1.286986698702419,
+        "valid_avg_loss": 1.7643859573524363
+    },
+    {
+        "epoch": 8,
+        "train_avg_loss": 1.229390325198684,
+        "valid_avg_loss": 1.7796538959454447
+    },
+    {
+        "epoch": 9,
+        "train_avg_loss": 1.1848171936080776,
+        "valid_avg_loss": 1.796674854999041
+    }
+]

coco_based-sfcoco2022-gpt_medium-en_clip_b32-transformer-finetune-ep20-bs8-lr2e-05/011.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dbb6f5ed8ca6c04885ffd0a418816b8d715fe1a9330d2696961c0c0e77df1c3f
+size 1659601962

coco_based-sfcoco2022-gpt_medium-en_clip_b32-transformer-finetune-ep20-bs8-lr2e-05/args.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+    "train_name_prefix": "coco_based",
+    "dataset_name": "sfcoco2022",
+    "rinna_gpt_name": "gpt_medium",
+    "clip_model_name": "en_clip_b32",
+    "pretrained_path": "checkpoints/coco-gpt_medium-en_clip_b32-transformer-finetune-ep10-bs48-lr2e-05/004.pt",
+    "datasets_dpath": "./data",
+    "checkpoints_dpath": "./checkpoints",
+    "epochs": 20,
+    "per_gpu_train_batch_size": 8,
+    "per_gpu_eval_batch_size": 4,
+    "lr": 2e-05,
+    "warmup_steps": 5000,
+    "save_every": 2,
+    "mapping_type": "transformer",
+    "prefix_length": 10,
+    "prefix_length_clip": 10,
+    "only_prefix": false,
+    "num_layers": 8,
+    "n_gpu": 1,
+    "prefix_dim": 512,
+    "train_batch_size": 8,
+    "eval_batch_size": 4,
+    "train_data_fpath": "./data/sfcoco2022/processed-en_clip_b32/train.pkl",
+    "valid_data_fpath": "./data/sfcoco2022/processed-en_clip_b32/valid.pkl"
+}

coco_based-sfcoco2022-gpt_medium-en_clip_b32-transformer-finetune-ep20-bs8-lr2e-05/log.json ADDED Viewed

	@@ -0,0 +1,102 @@

+[
+    {
+        "epoch": 0,
+        "train_avg_loss": 5.23631593082728,
+        "valid_avg_loss": 4.589402989907698
+    },
+    {
+        "epoch": 1,
+        "train_avg_loss": 4.692692512876532,
+        "valid_avg_loss": 4.057069377465681
+    },
+    {
+        "epoch": 2,
+        "train_avg_loss": 4.1836722861515,
+        "valid_avg_loss": 3.802787184715271
+    },
+    {
+        "epoch": 3,
+        "train_avg_loss": 3.912685916664895,
+        "valid_avg_loss": 3.6272812431508843
+    },
+    {
+        "epoch": 4,
+        "train_avg_loss": 3.71119554123182,
+        "valid_avg_loss": 3.5032514225352895
+    },
+    {
+        "epoch": 5,
+        "train_avg_loss": 3.5524264828542647,
+        "valid_avg_loss": 3.416551037268205
+    },
+    {
+        "epoch": 6,
+        "train_avg_loss": 3.4106314369801725,
+        "valid_avg_loss": 3.3739624565297905
+    },
+    {
+        "epoch": 7,
+        "train_avg_loss": 3.2732532479789818,
+        "valid_avg_loss": 3.311254208738154
+    },
+    {
+        "epoch": 8,
+        "train_avg_loss": 3.1427170078406172,
+        "valid_avg_loss": 3.307594797827981
+    },
+    {
+        "epoch": 9,
+        "train_avg_loss": 3.010394993792759,
+        "valid_avg_loss": 3.2557569200342353
+    },
+    {
+        "epoch": 10,
+        "train_avg_loss": 2.878009672914998,
+        "valid_avg_loss": 3.2686923525550147
+    },
+    {
+        "epoch": 11,
+        "train_avg_loss": 2.7372213776191967,
+        "valid_avg_loss": 3.2398276220668447
+    },
+    {
+        "epoch": 12,
+        "train_avg_loss": 2.5947886558061235,
+        "valid_avg_loss": 3.308401259509
+    },
+    {
+        "epoch": 13,
+        "train_avg_loss": 2.436928727653589,
+        "valid_avg_loss": 3.3593532172116367
+    },
+    {
+        "epoch": 14,
+        "train_avg_loss": 2.2813261600022905,
+        "valid_avg_loss": 3.457464749162847
+    },
+    {
+        "epoch": 15,
+        "train_avg_loss": 2.141249016429601,
+        "valid_avg_loss": 3.4138374870473687
+    },
+    {
+        "epoch": 16,
+        "train_avg_loss": 1.9144119077853943,
+        "valid_avg_loss": 3.4829627058722754
+    },
+    {
+        "epoch": 17,
+        "train_avg_loss": 1.757168180487129,
+        "valid_avg_loss": 3.509248224171725
+    },
+    {
+        "epoch": 18,
+        "train_avg_loss": 1.572956797781955,
+        "valid_avg_loss": 3.5913555296984585
+    },
+    {
+        "epoch": 19,
+        "train_avg_loss": 1.3907193682166967,
+        "valid_avg_loss": 3.651268948208202
+    }
+]

coco_based-sfcoco_merged-gpt_medium-en_clip_b32-transformer-finetune-ep20-bs8-lr2e-05/009.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bf67194444f24c8de46efdaa3e74f4a3475e10554deaa2aae1fd168e72493761
+size 1659602257

coco_based-sfcoco_merged-gpt_medium-en_clip_b32-transformer-finetune-ep20-bs8-lr2e-05/args.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+    "train_name_prefix": "coco_based",
+    "dataset_name": "sfcoco_merged",
+    "rinna_gpt_name": "gpt_medium",
+    "clip_model_name": "en_clip_b32",
+    "pretrained_path": "checkpoints/coco-gpt_medium-en_clip_b32-transformer-finetune-ep10-bs48-lr2e-05/004.pt",
+    "datasets_dpath": "./data",
+    "checkpoints_dpath": "./checkpoints",
+    "epochs": 20,
+    "per_gpu_train_batch_size": 8,
+    "per_gpu_eval_batch_size": 4,
+    "lr": 2e-05,
+    "warmup_steps": 5000,
+    "save_every": 2,
+    "mapping_type": "transformer",
+    "prefix_length": 10,
+    "prefix_length_clip": 10,
+    "only_prefix": false,
+    "num_layers": 8,
+    "n_gpu": 1,
+    "prefix_dim": 512,
+    "train_batch_size": 8,
+    "eval_batch_size": 4,
+    "train_data_fpath": "./data/sfcoco_merged/processed-en_clip_b32/train.pkl",
+    "valid_data_fpath": "./data/sfcoco_merged/processed-en_clip_b32/valid.pkl"
+}

coco_based-sfcoco_merged-gpt_medium-en_clip_b32-transformer-finetune-ep20-bs8-lr2e-05/log.json ADDED Viewed

	@@ -0,0 +1,67 @@

+[
+    {
+        "epoch": 0,
+        "train_avg_loss": 4.911076001559986,
+        "valid_avg_loss": 4.273226414408002
+    },
+    {
+        "epoch": 1,
+        "train_avg_loss": 4.039783334732055,
+        "valid_avg_loss": 3.7189245564596995
+    },
+    {
+        "epoch": 2,
+        "train_avg_loss": 3.6596964639775895,
+        "valid_avg_loss": 3.472972523598444
+    },
+    {
+        "epoch": 3,
+        "train_avg_loss": 3.440858439838185,
+        "valid_avg_loss": 3.344558346839178
+    },
+    {
+        "epoch": 4,
+        "train_avg_loss": 3.2580301088445327,
+        "valid_avg_loss": 3.2396208558763777
+    },
+    {
+        "epoch": 5,
+        "train_avg_loss": 3.100968130897073,
+        "valid_avg_loss": 3.191791926111494
+    },
+    {
+        "epoch": 6,
+        "train_avg_loss": 2.943284174975227,
+        "valid_avg_loss": 3.1369220245452154
+    },
+    {
+        "epoch": 7,
+        "train_avg_loss": 2.7977304584839766,
+        "valid_avg_loss": 3.0809161152158464
+    },
+    {
+        "epoch": 8,
+        "train_avg_loss": 2.6307832703870884,
+        "valid_avg_loss": 3.0518643458684287
+    },
+    {
+        "epoch": 9,
+        "train_avg_loss": 2.455103006783654,
+        "valid_avg_loss": 3.0716028610865274
+    },
+    {
+        "epoch": 10,
+        "train_avg_loss": 2.2595722352757175,
+        "valid_avg_loss": 3.074081716083345
+    },
+    {
+        "epoch": 11,
+        "train_avg_loss": 2.0651670189464792,
+        "valid_avg_loss": 3.1168776012602306
+    },
+    {
+        "epoch": 12,
+        "train_avg_loss": 1.8646753367255715,
+        "valid_avg_loss": 3.179236167953128
+    }
+]