Upload folder using huggingface_hub

Browse files

Files changed (8) hide show

config.json +1 -2
generation_config.json +1 -1
onnx/decoder_model_merged.onnx +1 -1
onnx/decoder_model_merged_quantized.onnx +2 -2
onnx/decoder_model_quantized.onnx +2 -2
onnx/decoder_with_past_model_quantized.onnx +2 -2
onnx/encoder_model_quantized.onnx +2 -2
quant_config.json +89 -0

config.json CHANGED Viewed

@@ -141,8 +141,7 @@
     50361,
     50362
   ],
-  "torch_dtype": "float32",
-  "transformers_version": "4.29.2",
   "use_cache": true,
   "use_weighted_layer_sum": false,
   "vocab_size": 51865

     50361,
     50362
   ],
+  "transformers_version": "4.30.2",
   "use_cache": true,
   "use_weighted_layer_sum": false,
   "vocab_size": 51865

generation_config.json CHANGED Viewed

@@ -217,5 +217,5 @@
     "transcribe": 50359,
     "translate": 50358
   },
-  "transformers_version": "4.29.2"
 }

     "transcribe": 50359,
     "translate": 50358
   },
+  "transformers_version": "4.30.2"
 }

onnx/decoder_model_merged.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:eb77e2680627baa157fbba1e95fe6a28610420814d2685ee78bccf0357de44e0
 size 2761864

 version https://git-lfs.github.com/spec/v1
+oid sha256:34eb70fe697d78afa2517f36b32933ab1d7d19e76897d3c8d8156f93dffd3ad6
 size 2761864

onnx/decoder_model_merged_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:75b7dfbbaa56176ea2bac41a3a7ecefd72990da0c1d3c90f75ef836a5580e913
-size 983867549

 version https://git-lfs.github.com/spec/v1
+oid sha256:250fc0db44d671af75069b8b5d3c2fb001503dc7a78cd5a93655eb237053a0c0
+size 980944149

onnx/decoder_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d5a95c979c9dc944cb7246c17f4c7a36d196436dd495442eaf8d0c5165f1dba2
-size 981928446

 version https://git-lfs.github.com/spec/v1
+oid sha256:bff22b6a6dee56fb9da83164265061a5e2f394be1b182d3b5af17778e5dbd4a9
+size 979005046

onnx/decoder_with_past_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:af7524a162c21c2dfbae624df361effd28538f83513d15cf5d01cb9196249e6c
-size 876151256

 version https://git-lfs.github.com/spec/v1
+oid sha256:792e3ec0ed3737b6807ff7b53a0c2005c089a7c73982789186a4a5b6766b6be9
+size 873637776

onnx/encoder_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1ab631c21615158bfda3a824393ab3823dbacf4f204764e3849894f6cc0e132d
-size 646822577

 version https://git-lfs.github.com/spec/v1
+oid sha256:4d25cdce63acc9b2ca2de12091dfdc7977e2bdfff75a74a170e1a710e0706deb
+size 644978452

quant_config.json ADDED Viewed

	@@ -0,0 +1,89 @@

+{
+    "per_channel": false,
+    "reduce_range": false,
+    "per_model_config": {
+        "encoder_model": {
+            "op_types": [
+                "Erf",
+                "Sub",
+                "Pow",
+                "Reshape",
+                "ReduceMean",
+                "MatMul",
+                "Constant",
+                "Conv",
+                "Div",
+                "Gather",
+                "Mul",
+                "Unsqueeze",
+                "Concat",
+                "Shape",
+                "Sqrt",
+                "Transpose",
+                "Softmax",
+                "Add"
+            ],
+            "weight_type": "QUInt8"
+        },
+        "decoder_model": {
+            "op_types": [
+                "MatMul",
+                "Constant",
+                "Gather",
+                "Concat",
+                "Cast",
+                "Squeeze",
+                "Softmax",
+                "Range",
+                "Equal",
+                "Mul",
+                "Less",
+                "Erf",
+                "Reshape",
+                "Pow",
+                "Div",
+                "Expand",
+                "Slice",
+                "Add",
+                "ConstantOfShape",
+                "Sub",
+                "ReduceMean",
+                "Where",
+                "Unsqueeze",
+                "Shape",
+                "Sqrt",
+                "Transpose"
+            ],
+            "weight_type": "QInt8"
+        },
+        "decoder_model_merged": {
+            "op_types": [
+                "If"
+            ],
+            "weight_type": "QInt8"
+        },
+        "decoder_with_past_model": {
+            "op_types": [
+                "Erf",
+                "Reshape",
+                "Sub",
+                "Pow",
+                "ReduceMean",
+                "MatMul",
+                "Constant",
+                "Gather",
+                "Div",
+                "Unsqueeze",
+                "Concat",
+                "Slice",
+                "Mul",
+                "Shape",
+                "Sqrt",
+                "Transpose",
+                "Softmax",
+                "Add"
+            ],
+            "weight_type": "QInt8"
+        }
+    }
+}