72 15 20

Michael Goin PRO

mgoin

mgoin_
mgoin

AI & ML interests

LLM inference optimization, compression, quantization, pruning, distillation

Recent Activity

updated a model 6 days ago

nm-testing/pixtral-12b-FP8-dynamic-all

updated a model 9 days ago

mistralai/Pixtral-Large-Instruct-2411

New activity 9 days ago

mistralai/Pixtral-Large-Instruct-2411:Add config_format and load_format to vLLM args

View all activity

Organizations

Collections 1

TinyStories DeepSparse

models 73

mgoin/Pixtral-Large-Instruct-2411

Updated 9 days ago

mgoin/Qwen2.5-Coder-32B-Instruct-fp8

Updated 14 days ago

mgoin/nemotron-3-8b-chat-4k-sft-hf

Text Generation • Updated 14 days ago • 83

mgoin/llava-onevision-qwen2-7b-ov-hf-bnb-full-4bit

Image-Text-to-Text • Updated 22 days ago • 55

mgoin/MiniCPM-Llama3-V-2_5-int4

Visual Question Answering • Updated 27 days ago • 16

mgoin/pixtral-12b

Image-Text-to-Text • Updated Oct 18 • 526

mgoin/DeepSeek-Coder-V2-Lite-Instruct-FP8

Updated Sep 20 • 4.82k

mgoin/Mixtral-8x7B-Instruct-v0.1-FP8

Updated Sep 20 • 3

mgoin/Nemotron-nemo-checkpoints

Updated Aug 30

Michael Goin PRO

AI & ML interests

Recent Activity

Organizations

Collections 1

mgoin/Nemotron-4-340B-Instruct-hf-FP8

mgoin/Nemotron-4-340B-Base-hf-FP8

mgoin/Nemotron-4-340B-Instruct-hf

mgoin/Nemotron-4-340B-Base-hf

Papers 4

spaces 4

Convert Fp8

Hermes Mistral 7b Vllm

Sparse Llama Gsm8k

TinyStories DeepSparse

models 73

mgoin/Pixtral-Large-Instruct-2411

mgoin/Qwen2.5-Coder-32B-Instruct-fp8

mgoin/nemotron-3-8b-chat-4k-sft-hf

mgoin/llava-onevision-qwen2-7b-ov-hf-bnb-full-4bit

mgoin/MiniCPM-Llama3-V-2_5-int4

mgoin/pixtral-12b

mgoin/DeepSeek-Coder-V2-Lite-Instruct-FP8

mgoin/Mixtral-8x7B-Instruct-v0.1-FP8

mgoin/Nemotron-nemo-checkpoints

mgoin/Minitron-4B-Base-FP8

datasets 1

mgoin/ultrachat_2k

Michael Goin PRO

AI & ML interests

Recent Activity

Organizations

Collections 1

Papers 4

spaces 4 Sort: Recently updated

Convert Fp8

Hermes Mistral 7b Vllm

Sparse Llama Gsm8k

TinyStories DeepSparse

models 73 Sort: Recently updated

datasets 1

spaces 4

models 73