Added pytorch model

Files changed (4) hide show

config.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "activation_function": "gelu_new",
   "architectures": [
-    "GPT2LMHeadModel"
   ],
   "attn_pdrop": 0.0,
   "bos_token_id": 50256,

 {
   "activation_function": "gelu_new",
   "architectures": [
+    "GPT2Model"
   ],
   "attn_pdrop": 0.0,
   "bos_token_id": 50256,

events.out.tfevents.1626182455.t1v-n-905ccd3e-w-0.38250.3.v2 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0580a62409b3b4525743c7ec189e64613c9b722043f05f8bc6a1bb88152e486a
-size 1029893

 version https://git-lfs.github.com/spec/v1
+oid sha256:2b4a1ead764f0e1eedb1116e5d27078e1086488dc8b596af480cd5730f7ede04
+size 1103462

pytorch_model.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:6f0735a9f1b2acfbb15130aab162d2cc8b323dabdc0399b25a7f348d0bb0de2d
+size 510397417

save_model.py CHANGED Viewed

@@ -1,6 +1,6 @@
 from transformers.modeling_flax_pytorch_utils import load_flax_checkpoint_in_pytorch_model
-from transformers import GPT2_Config, GPT2_Model
-config = GPT2_Config.from_pretrained("./")
-model = GPT2_Model(config)
 load_flax_checkpoint_in_pytorch_model(model, "./flax_model.msgpack")
 model.save_pretrained("./")

 from transformers.modeling_flax_pytorch_utils import load_flax_checkpoint_in_pytorch_model
+from transformers import GPT2Config, GPT2Model
+config = GPT2Config.from_pretrained("./")
+model = GPT2Model(config)
 load_flax_checkpoint_in_pytorch_model(model, "./flax_model.msgpack")
 model.save_pretrained("./")