casperhansen
/

mpt-7b-8k-chat-gptq

Text Generation

text-generation-inference

Model card Files Files and versions Community

mpt-7b-8k-chat-gptq / flash_attn_triton.py

Commit History

GPTQ quantized MPT model

081aec9

casperhansen commited on Jul 27, 2023