neuralmagic
/

Meta-Llama-3.1-8B-FP8

Text Generation

text-generation-inference

Inference Endpoints

compressed-tensors

Model card Files Files and versions Community

Meta-Llama-3.1-8B-FP8

Commit History

Updated compression_config to quantization_config

e50167c
verified

mgoin commited on Oct 9

Update README.md

91994a9
verified

alexmarques commited on Aug 13

Create README.md

e85dd59
verified

Lin-K76 commited on Jul 31

Upload folder using huggingface_hub

b9c19e4
verified

Lin-K76 commited on Jul 31

initial commit

23b10b9
verified

Lin-K76 commited on Jul 31