Jon Wang's picture

9 5 24

Jon Wang

Cornmonster

·

UranusSeven

AI & ML interests

None yet

Recent Activity

upvoted a paper 10 days ago

SageAttention2 Technical Report: Accurate 4 Bit Attention for Plug-and-play Inference Acceleration

liked a model about 1 month ago

genmo/mochi-1-preview

View all activity

Organizations

Cornmonster's activity

upvoted a paper 10 days ago

SageAttention2 Technical Report: Accurate 4 Bit Attention for Plug-and-play Inference Acceleration

Paper • 2411.10958 • Published 17 days ago • 47

upvoted a paper 3 months ago

Efficient LLM Scheduling by Learning to Rank

Paper • 2408.15792 • Published Aug 28 • 19

upvoted a paper 9 months ago

EAGLE: Speculative Sampling Requires Rethinking Feature Uncertainty

Paper • 2401.15077 • Published Jan 26 • 19

upvoted 2 papers about 1 year ago

FlashDecoding++: Faster Large Language Model Inference on GPUs

Paper • 2311.01282 • Published Nov 2, 2023 • 35

Efficient Memory Management for Large Language Model Serving with PagedAttention

Paper • 2309.06180 • Published Sep 12, 2023 • 25