Upload folder using huggingface_hub

Files changed (6) hide show

.gitattributes CHANGED Viewed

@@ -33,3 +33,7 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+Gemma-2-9B-It-SPPO-Iter3.f16.gguf filter=lfs diff=lfs merge=lfs -text
+Gemma-2-9B-It-SPPO-Iter3.q5_k.gguf filter=lfs diff=lfs merge=lfs -text
+Gemma-2-9B-It-SPPO-Iter3.q6_k.gguf filter=lfs diff=lfs merge=lfs -text
+Gemma-2-9B-It-SPPO-Iter3.q8_0.gguf filter=lfs diff=lfs merge=lfs -text

Gemma-2-9B-It-SPPO-Iter3.f16.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:5ff4e2820ad48154eab809340cee4d5a656bd03f3126474a0d79906af48fa430
+size 18490680928

Gemma-2-9B-It-SPPO-Iter3.q5_k.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:475fb6ed10f20d7bbd73da8621dd2a5da3399185f67dadf6022952cf573827e8
+size 7729735264

Gemma-2-9B-It-SPPO-Iter3.q6_k.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:5e989f14e13f0c15e51d8f6b523e0aeaba182a8099e490c2d9642f9ee04fcb9f
+size 8671438432

Gemma-2-9B-It-SPPO-Iter3.q8_0.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:fbfc4870dad8ad4c395dd65c3160ad6ff734352c52ec984cdd8d39663642c53c
+size 10687309408

README.md ADDED Viewed

+---
+license: mit
+language:
+- en
+---
+My own (ZeroWw) quantizations.
+output and embed tensors quantized to f16.
+all other tensors quantized to q5_k or q6_k.
+Result:
+both f16.q6 and f16.q5 are smaller than q8_0 standard quantization
+and they perform as well as the pure f16.