jojo1899
/

Llama-2-13b-chat-hf-ov-int4

Text Generation

Inference Endpoints

Model card Files Files and versions Community

Llama-2-13b-chat-hf-ov-int4

1 contributor

History: 7 commits

jojo1899's picture

Improved quantization using Openvino 2024.5.0rc1

0869f09 3 days ago

.gitattributes

1.52 kB

initial commit 5 months ago
README.md

977 Bytes

Improved quantization using Openvino 2024.5.0rc1 3 days ago
config.json

801 Bytes

Improved quantization using Openvino 2024.5.0rc1 3 days ago
generation_config.json

193 Bytes

Improved quantization using Openvino 2024.5.0rc1 3 days ago
openvino_model.bin

6.71 GB
LFS

Improved quantization using Openvino 2024.5.0rc1 3 days ago
openvino_model.xml

3.16 MB

Improved quantization using Openvino 2024.5.0rc1 3 days ago
special_tokens_map.json

414 Bytes

Improved quantization using Openvino 2024.5.0rc1 3 days ago
tokenizer.json

3.62 MB

Quantized using nncf 2.13.0 4 days ago
tokenizer.model

500 kB
LFS

Improved quantization using Openvino 2024.5.0rc1 3 days ago
tokenizer_config.json

1.83 kB

Quantized using nncf 2.13.0 4 days ago