Mantis - a TIGER-Lab Collection

TIGER-Lab 's Collections

VLM2Vec

MAmmoTH

UniIR

Science

Mantis

Mantis

updated Jul 2

Mantis model family optimized for multi-image reasoning with interleaved text/image format

TIGER-Lab/Mantis-8B-Idefics2

Image-Text-to-Text • Updated 16 days ago • 597 • 10

Note Current SoTA Mantis variant
TIGER-Lab/Mantis-8B-clip-llama3

Image-Text-to-Text • Updated 16 days ago • 1.35k • 1
TIGER-Lab/Mantis-8B-siglip-llama3

Image-Text-to-Text • Updated 16 days ago • 1.78k • 31

Note Current SoTA Mantis variant without multi-image pre-training
TIGER-Lab/Mantis-Instruct

Viewer • Updated 16 days ago • 999k • 1.9k • 30

Note Our training dataset
TIGER-Lab/Mantis-Eval

Viewer • Updated 16 days ago • 217 • 1.8k • 6

Note Curated evaluation benchmark for multi-image scenarios
MANTIS: Interleaved Multi-Image Instruction Tuning

Paper • 2405.01483 • Published May 2 • 6
Running on Zero

24

👁

Mantis

Multimodal Language Model
TIGER-Lab/Mantis-llava-7b

Image-Text-to-Text • Updated May 18 • 22 • 15
TIGER-Lab/Mantis-bakllava-7b

Image-Text-to-Text • Updated May 18 • 376 • 5
TIGER-Lab/Mantis-8B-Fuyu

Text Generation • Updated May 4 • 285 • 4
TIGER-Lab/OBELICS-100K

Viewer • Updated May 16 • 212k • 39 • 2