Boyuan Zheng's picture

4 4 10

Boyuan Zheng

boyuanzheng010

·

https://boyuanzheng010.github.io/

AI & ML interests

Language Agents, Multilinguality

Organizations

boyuanzheng010's activity

upvoted a paper about 1 month ago

Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents

Paper • 2410.05243 • Published Oct 7 • 16

upvoted a paper 7 months ago

MagicLens: Self-Supervised Image Retrieval with Open-Ended Instructions

Paper • 2403.19651 • Published Mar 28 • 23

upvoted a paper 8 months ago

GPT-4V(ision) is a Generalist Web Agent, if Grounded

Paper • 2401.01614 • Published Jan 3 • 21

upvoted a paper 12 months ago

MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI

Paper • 2311.16502 • Published Nov 27, 2023 • 35