Yuanshi's picture

Yuanshi

Yuanshi

·

AI & ML interests

Reinforcement Learning; Large Language Model; Multimodality; AI Infrastructure;

Recent Activity

upvoted a paper about 18 hours ago

ShowUI: One Vision-Language-Action Model for GUI Visual Agent

New activity about 22 hours ago

Yuanshi/OminiControl:deactivate server side rendering to avoid css breaks on mobile

upvoted a paper 2 days ago

Large-Scale Text-to-Image Model with Inpainting is a Zero-Shot Subject-Driven Image Generator

View all activity

Organizations

None yet

Yuanshi's activity

upvoted a paper about 18 hours ago

ShowUI: One Vision-Language-Action Model for GUI Visual Agent

Paper • 2411.17465 • Published 1 day ago • 46

upvoted 2 papers 2 days ago

Large-Scale Text-to-Image Model with Inpainting is a Zero-Shot Subject-Driven Image Generator

Paper • 2411.15466 • Published 5 days ago • 32

Style-Friendly SNR Sampler for Style-Driven Generation

Paper • 2411.14793 • Published 6 days ago • 34

upvoted a paper 3 days ago

OminiControl: Minimal and Universal Control for Diffusion Transformer

Paper • 2411.15098 • Published 5 days ago • 38

upvoted a paper about 2 months ago

Attention Prompting on Image for Large Vision-Language Models

Paper • 2409.17143 • Published Sep 25 • 7

upvoted 2 papers 3 months ago

LinFusion: 1 GPU, 1 Minute, 16K Image

Paper • 2409.02097 • Published Sep 3 • 32

Heavy Labels Out! Dataset Distillation with Label Space Lightening

Paper • 2408.08201 • Published Aug 15 • 18

upvoted 2 papers 5 months ago

Compositional Video Generation as Flow Equalization

Paper • 2407.06182 • Published Jun 10 • 12

Video-Infinity: Distributed Long Video Generation

Paper • 2406.16260 • Published Jun 24 • 28

upvoted a paper 8 months ago

Hash3D: Training-free Acceleration for 3D Generation

Paper • 2404.06091 • Published Apr 9 • 12