DeepSilicon
/

Llama_3_8B_SQ_21616

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Llama_3_8B_SQ_21616

1 contributor

History: 2 commits

kaizen9's picture

Quantized model upload with DuQuant

d5123f9 verified 6 days ago