Probably best speed to perplexity ratio of any 7b gguf model so far

Files changed (2) hide show

.gitattributes CHANGED Viewed

@@ -48,3 +48,4 @@ qwen7bq4xsoutput6k.gguf filter=lfs diff=lfs merge=lfs -text
 8bitimatrix.dat filter=lfs diff=lfs merge=lfs -text
 qwenv2instruct7b_q8.gguf filter=lfs diff=lfs merge=lfs -text
 qwen7bv2instruct_q5km.gguf filter=lfs diff=lfs merge=lfs -text

 8bitimatrix.dat filter=lfs diff=lfs merge=lfs -text
 qwenv2instruct7b_q8.gguf filter=lfs diff=lfs merge=lfs -text
 qwen7bv2instruct_q5km.gguf filter=lfs diff=lfs merge=lfs -text
+qwen7bv2_iq4xs_output8bit.gguf filter=lfs diff=lfs merge=lfs -text

qwen7bq4xsoutput8bit.gguf → qwen7bv2_iq4xs_output8bit.gguf RENAMED Viewed

File without changes