vlm data - a poonyZ Collection

poonyZ 's Collections

T2I

agi

fancy

VLM

llm

vlm data

updated 4 days ago

MIT-10M: A Large Scale Parallel Corpus of Multilingual Image Translation

Paper • 2412.07147 • Published 17 days ago • 5
Grounding Descriptions in Images informs Zero-Shot Visual Recognition

Paper • 2412.04429 • Published 21 days ago
Exploring Multi-Grained Concept Annotations for Multimodal Large Language Models

Paper • 2412.05939 • Published 18 days ago • 12
Euclid: Supercharging Multimodal LLMs with Synthetic High-Fidelity Visual Descriptions

Paper • 2412.08737 • Published 15 days ago • 51
VisionArena: 230K Real World User-VLM Conversations with Preference Labels

Paper • 2412.08687 • Published 15 days ago • 13
BiMediX2: Bio-Medical EXpert LMM for Diverse Medical Modalities

Paper • 2412.07769 • Published 16 days ago • 26
How to Synthesize Text Data without Model Collapse?

Paper • 2412.14689 • Published 7 days ago • 46