Upload folder using huggingface_hub

Browse files

Files changed (9) hide show

config.json +1 -1
generation_config.json +1 -1
onnx/decoder_model.onnx +2 -2
onnx/decoder_model_merged.onnx +2 -2
onnx/decoder_model_merged_quantized.onnx +2 -2
onnx/decoder_model_quantized.onnx +2 -2
onnx/decoder_with_past_model.onnx +2 -2
onnx/decoder_with_past_model_quantized.onnx +2 -2
quantize_config.json +103 -0

config.json CHANGED Viewed

@@ -35,7 +35,7 @@
   },
   "tie_word_embeddings": false,
   "tokenizer_class": "GPT2Tokenizer",
-  "transformers_version": "4.29.2",
   "use_cache": true,
   "vocab_size": 51200
 }

   },
   "tie_word_embeddings": false,
   "tokenizer_class": "GPT2Tokenizer",
+  "transformers_version": "4.33.0.dev0",
   "use_cache": true,
   "vocab_size": 51200
 }

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "_from_model_config": true,
   "bos_token_id": 1,
   "eos_token_id": 50256,
-  "transformers_version": "4.29.2"
 }

   "_from_model_config": true,
   "bos_token_id": 1,
   "eos_token_id": 50256,
+  "transformers_version": "4.33.0.dev0"
 }

onnx/decoder_model.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0f4a019f7ddc5db01fa6c030189bb63a86387343998e3b440c1b61b7c293875a
-size 1435433361

 version https://git-lfs.github.com/spec/v1
+oid sha256:3ddd9281192b6a7efbff7d67f0bbc24767ddd0fab00c560313be4a654a5b1b49
+size 1435431277

onnx/decoder_model_merged.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:96ed0e7febd382ba1f8c159f459f29778de2eaa66dfc3535ade3b06e78eca63e
-size 1436616698

 version https://git-lfs.github.com/spec/v1
+oid sha256:53617d55ffdffa28f737c54f400957ed0459145dca8d0352a44a66423a14ac1b
+size 1440806522

onnx/decoder_model_merged_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3f3362447750bc51fc2bb25e0bf0edcd329f4a6a9751220adffc10fb9f2d4f59
-size 370397188

 version https://git-lfs.github.com/spec/v1
+oid sha256:ccb331ff7b021cbde82a0a2100abdc3245c959c03c31be9f5def260f5b9de077
+size 373406649

onnx/decoder_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e4b53e19b91da8c8f95a5ae630d219a447d05d7d160a56116bf6415547fe8213
-size 368793710

 version https://git-lfs.github.com/spec/v1
+oid sha256:27cc1940441e137ead9cea7fa79c5afeb6e31eb740f292831ae59d369ea29616
+size 367612429

onnx/decoder_with_past_model.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2e106037608bb3ac831acdc84e970dde9192ab2be9eb7f01c446af740ee329f6
-size 1432225419

 version https://git-lfs.github.com/spec/v1
+oid sha256:0f49e897e86b729e22fa1bb31b075e23c01e7d4292cd61cd38fdfcd00117f165
+size 1432223346

onnx/decoder_with_past_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:18bf8111292da9e7c2d24e7d7d7d9dad8f1a310dc62d0c7d165091856a2dcd66
-size 364276590

 version https://git-lfs.github.com/spec/v1
+oid sha256:5845d0a1fb6c7fe3143d9eec00389a06c81dc4fd8326b55c49b0873a4d721548
+size 363095324

quantize_config.json ADDED Viewed

	@@ -0,0 +1,103 @@

+{
+    "per_channel": false,
+    "reduce_range": false,
+    "per_model_config": {
+        "decoder_model": {
+            "op_types": [
+                "Transpose",
+                "Sub",
+                "Cast",
+                "Softmax",
+                "Slice",
+                "ReduceMean",
+                "Squeeze",
+                "Gather",
+                "Range",
+                "Unsqueeze",
+                "Pow",
+                "MatMul",
+                "Add",
+                "Equal",
+                "Concat",
+                "Neg",
+                "Reshape",
+                "Div",
+                "Mul",
+                "Sqrt",
+                "ConstantOfShape",
+                "Where",
+                "Tanh",
+                "Shape",
+                "Expand",
+                "Constant",
+                "Split"
+            ],
+            "weight_type": "QInt8"
+        },
+        "decoder_model_merged": {
+            "op_types": [
+                "Transpose",
+                "Sub",
+                "Cast",
+                "Softmax",
+                "Slice",
+                "ReduceMean",
+                "Squeeze",
+                "Gather",
+                "Range",
+                "Unsqueeze",
+                "Pow",
+                "MatMul",
+                "Add",
+                "Equal",
+                "Concat",
+                "If",
+                "Neg",
+                "Reshape",
+                "Div",
+                "Mul",
+                "Sqrt",
+                "ConstantOfShape",
+                "Where",
+                "Tanh",
+                "Shape",
+                "Expand",
+                "Constant",
+                "Split"
+            ],
+            "weight_type": "QInt8"
+        },
+        "decoder_with_past_model": {
+            "op_types": [
+                "Transpose",
+                "Sub",
+                "Cast",
+                "Softmax",
+                "Slice",
+                "ReduceMean",
+                "Squeeze",
+                "Gather",
+                "Range",
+                "Unsqueeze",
+                "Pow",
+                "MatMul",
+                "Add",
+                "Equal",
+                "Concat",
+                "Neg",
+                "Reshape",
+                "Div",
+                "Mul",
+                "Sqrt",
+                "ConstantOfShape",
+                "Where",
+                "Tanh",
+                "Shape",
+                "Expand",
+                "Constant",
+                "Split"
+            ],
+            "weight_type": "QInt8"
+        }
+    }
+}