t1101675
/

PICL

Model card Files Files and versions Community

addf400 commited on Jul 30, 2023

Commit

9c7e379

•

1 Parent(s): f60a5cd

add files

Browse files

Files changed (24) hide show

pretrain_data/80M_128/gpt2/icl_0.bin +3 -0
pretrain_data/80M_128/gpt2/icl_0.idx +3 -0
pretrain_data/80M_128/gpt2/map.h5 +3 -0
pretrain_data/full_doc/gpt2/train_lm_0.bin +3 -0
pretrain_data/full_doc/gpt2/train_lm_0.idx +3 -0
pretrain_data/full_doc/gpt2/valid_lm_0.bin +3 -0
pretrain_data/full_doc/gpt2/valid_lm_0.idx +3 -0
pretrain_data/picl/80M_128_TRAIN_p1_en1_hn4_s42_lr5e-05-bs64-G1_4000.pt_L2_filtered_0.0/train_icl_0.bin +3 -0
pretrain_data/picl/80M_128_TRAIN_p1_en1_hn4_s42_lr5e-05-bs64-G1_4000.pt_L2_filtered_0.0/train_icl_0.idx +3 -0
pretrain_data/picl/80M_128_TRAIN_p1_en1_hn4_s42_lr5e-05-bs64-G1_4000.pt_L2_filtered_0.0/valid_icl_0.bin +3 -0
pretrain_data/picl/80M_128_TRAIN_p1_en1_hn4_s42_lr5e-05-bs64-G1_4000.pt_L2_filtered_0.0/valid_icl_0.idx +3 -0
results/picl/picl-large/config.json +39 -0
results/picl/picl-large/merges.txt +0 -0
results/picl/picl-large/pytorch_model.bin +3 -0
results/picl/picl-large/special_tokens_map.json +23 -0
results/picl/picl-large/tokenizer_config.json +34 -0
results/picl/picl-large/vocab.json +0 -0
results/picl/picl-xlarge/config.json +39 -0
results/picl/picl-xlarge/merges.txt +0 -0
results/picl/picl-xlarge/pytorch_model.bin +3 -0
results/picl/picl-xlarge/special_tokens_map.json +23 -0
results/picl/picl-xlarge/tokenizer_config.json +34 -0
results/picl/picl-xlarge/vocab.json +0 -0
results/retriever/TRAIN_p1_en1_hn1_s42/lr5e-05-bs64-G1/4375.pt +3 -0

pretrain_data/80M_128/gpt2/icl_0.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c6e07c1865844d392318466010dce1026d5a592a69d1d3e465f5fced25784df1
+size 13220664808

pretrain_data/80M_128/gpt2/icl_0.idx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c018666a482e925a630bb81bc9b9790def7be0687e0a62d46c2ebafcd98ece04
+size 903856950

pretrain_data/80M_128/gpt2/map.h5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c3318c0840a6388e0c24b6382cb91a59c3bb718dd151bf0bce624bf5417ed59c
+size 602919592

pretrain_data/full_doc/gpt2/train_lm_0.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b350e6c72aa5d4fa123f11947551d273666a4287d1816d122bd709ae48f07dd5
+size 30578057216

pretrain_data/full_doc/gpt2/train_lm_0.idx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:304eae06f145b31d5348eee4817e5c1acf015abdefa7c573a9d97c19c6d59ab4
+size 179168346

pretrain_data/full_doc/gpt2/valid_lm_0.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:68a2e68773ea702a13c1b4f8d97fd152f8a189f57498da034e5fb2d9a8796732
+size 20480000

pretrain_data/full_doc/gpt2/valid_lm_0.idx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:df140cb38a42bd208a8e1effeebb11151026371a99d3271a65155b740472ef4b
+size 120042

pretrain_data/picl/80M_128_TRAIN_p1_en1_hn4_s42_lr5e-05-bs64-G1_4000.pt_L2_filtered_0.0/train_icl_0.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:844de2c2128cec3ffc36d329bdc578d25e9b3e20c186bae9a6c19f3e292e2ab0
+size 2015868720

pretrain_data/picl/80M_128_TRAIN_p1_en1_hn4_s42_lr5e-05-bs64-G1_4000.pt_L2_filtered_0.0/train_icl_0.idx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fbd4f468a05ebfc7368975faea392e602b80d385a746ac5fcc27140e8157d071
+size 302380350

pretrain_data/picl/80M_128_TRAIN_p1_en1_hn4_s42_lr5e-05-bs64-G1_4000.pt_L2_filtered_0.0/valid_icl_0.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0f863cd36c098b0b7d2506c201d93ca21cf02ded3767feb9303c395cf3e1354f
+size 800000

pretrain_data/picl/80M_128_TRAIN_p1_en1_hn4_s42_lr5e-05-bs64-G1_4000.pt_L2_filtered_0.0/valid_icl_0.idx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d34064e37bfadba00cc38cb1ed7c7d369a79a3fb3357e11f5fb9278bf987ae4a
+size 120042

results/picl/picl-large/config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "_name_or_path": "/home/lidong1/CodeRepo/icl_train/results_new/gpt2-xl/",
+  "activation_function": "gelu_new",
+  "architectures": [
+    "GPT2LMHeadModel"
+  ],
+  "attn_pdrop": 0.1,
+  "bos_token_id": 50256,
+  "embd_pdrop": 0.1,
+  "eos_token_id": 50256,
+  "initializer_range": 0.02,
+  "layer_norm_epsilon": 1e-05,
+  "model_type": "gpt2",
+  "n_ctx": 1024,
+  "n_embd": 1600,
+  "n_head": 25,
+  "n_inner": null,
+  "n_layer": 48,
+  "n_positions": 1024,
+  "output_past": true,
+  "reorder_and_upcast_attn": false,
+  "resid_pdrop": 0.1,
+  "scale_attn_by_inverse_layer_idx": false,
+  "scale_attn_weights": true,
+  "summary_activation": null,
+  "summary_first_dropout": 0.1,
+  "summary_proj_to_labels": true,
+  "summary_type": "cls_index",
+  "summary_use_proj": true,
+  "task_specific_params": {
+    "text-generation": {
+      "do_sample": true,
+      "max_length": 50
+    }
+  },
+  "transformers_version": "4.25.0.dev0",
+  "use_cache": true,
+  "vocab_size": 50257
+}

results/picl/picl-large/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

results/picl/picl-large/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:edb24d596482b4e0046203325ef481e5b748d5e75cdb0a442122de3e32991b26
+size 3165688127

results/picl/picl-large/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "bos_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

results/picl/picl-large/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,34 @@

+{
+  "add_bos_token": false,
+  "add_prefix_space": false,
+  "bos_token": {
+    "__type": "AddedToken",
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "__type": "AddedToken",
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "errors": "replace",
+  "model_max_length": 1000000000000000019884624838656,
+  "name_or_path": "/home/lidong1/CodeRepo/icl_train/results_new/gpt2-xl/",
+  "pad_token": null,
+  "special_tokens_map_file": null,
+  "tokenizer_class": "GPT2Tokenizer",
+  "unk_token": {
+    "__type": "AddedToken",
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

results/picl/picl-large/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

results/picl/picl-xlarge/config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "_name_or_path": "/home/lidong1/CodeRepo/icl_train/results_new/gpt2-xl/",
+  "activation_function": "gelu_new",
+  "architectures": [
+    "GPT2LMHeadModel"
+  ],
+  "attn_pdrop": 0.1,
+  "bos_token_id": 50256,
+  "embd_pdrop": 0.1,
+  "eos_token_id": 50256,
+  "initializer_range": 0.02,
+  "layer_norm_epsilon": 1e-05,
+  "model_type": "gpt2",
+  "n_ctx": 1024,
+  "n_embd": 1600,
+  "n_head": 25,
+  "n_inner": null,
+  "n_layer": 48,
+  "n_positions": 1024,
+  "output_past": true,
+  "reorder_and_upcast_attn": false,
+  "resid_pdrop": 0.1,
+  "scale_attn_by_inverse_layer_idx": false,
+  "scale_attn_weights": true,
+  "summary_activation": null,
+  "summary_first_dropout": 0.1,
+  "summary_proj_to_labels": true,
+  "summary_type": "cls_index",
+  "summary_use_proj": true,
+  "task_specific_params": {
+    "text-generation": {
+      "do_sample": true,
+      "max_length": 50
+    }
+  },
+  "transformers_version": "4.25.0.dev0",
+  "use_cache": true,
+  "vocab_size": 50257
+}

results/picl/picl-xlarge/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

results/picl/picl-xlarge/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8cd5e2042cb917e0f7f47db761ebbf1b1e638a31842c7877cbf6ecd24bdbb867
+size 3165688127

results/picl/picl-xlarge/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "bos_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

results/picl/picl-xlarge/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,34 @@

+{
+  "add_bos_token": false,
+  "add_prefix_space": false,
+  "bos_token": {
+    "__type": "AddedToken",
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "__type": "AddedToken",
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "errors": "replace",
+  "model_max_length": 1000000000000000019884624838656,
+  "name_or_path": "/home/lidong1/CodeRepo/icl_train/results_new/gpt2-xl/",
+  "pad_token": null,
+  "special_tokens_map_file": null,
+  "tokenizer_class": "GPT2Tokenizer",
+  "unk_token": {
+    "__type": "AddedToken",
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

results/picl/picl-xlarge/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

results/retriever/TRAIN_p1_en1_hn1_s42/lr5e-05-bs64-G1/4375.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bb293ee9cde723750b1f0d6e8ae54a8b2e40a77bfdc59799ca4e6ad56c67c704
+size 498717105