15 500 226

Taufiq Dwi Purnomo

taufiqdp

https://taufiqdp.com

AI & ML interests

SLM, VLM

Recent Activity

upvoted a paper about 18 hours ago

ShowUI: One Vision-Language-Action Model for GUI Visual Agent

upvoted a paper about 18 hours ago

Star Attention: Efficient LLM Inference over Long Sequences

liked a model 1 day ago

HuggingFaceTB/SmolVLM-Instruct

View all activity

Organizations

taufiqdp's activity

upvoted 2 papers about 18 hours ago

ShowUI: One Vision-Language-Action Model for GUI Visual Agent

Paper • 2411.17465 • Published 1 day ago • 49

Star Attention: Efficient LLM Inference over Long Sequences

Paper • 2411.17116 • Published 2 days ago • 32

upvoted a collection 1 day ago

SmolVLM

Collection

State-of-the-art compact VLMs for on-device applications: Base, Synthetic, and Instruct • 5 items • Updated 1 day ago • 18

upvoted a paper 2 days ago

MH-MoE:Multi-Head Mixture-of-Experts

Paper • 2411.16205 • Published 3 days ago • 19

upvoted a paper 4 days ago

Hymba: A Hybrid-head Architecture for Small Language Models

Paper • 2411.13676 • Published 7 days ago • 37

upvoted 2 papers 6 days ago

Enhancing the Reasoning Ability of Multimodal Large Language Models via Mixed Preference Optimization

Paper • 2411.10442 • Published 12 days ago • 60

Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions

Paper • 2411.14405 • Published 6 days ago • 51

upvoted 2 papers 7 days ago

RedPajama: an Open Dataset for Training Large Language Models

Paper • 2411.12372 • Published 9 days ago • 47

SageAttention2 Technical Report: Accurate 4 Bit Attention for Plug-and-play Inference Acceleration

Paper • 2411.10958 • Published 11 days ago • 47

upvoted 2 papers 9 days ago

Xmodel-1.5: An 1B-scale Multilingual LLM

Paper • 2411.10083 • Published 13 days ago • 14

BlueLM-V-3B: Algorithm and System Co-Design for Multimodal Large Language Models on Mobile Devices

Paper • 2411.10640 • Published 12 days ago • 41

upvoted an article 9 days ago

Article

The Beginners Guide to Cleaning a Dataset

•

9 days ago

• 23

upvoted a paper 19 days ago

FrontierMath: A Benchmark for Evaluating Advanced Mathematical Reasoning in AI

Paper • 2411.04872 • Published 20 days ago • 4

upvoted a paper 20 days ago

BitNet a4.8: 4-bit Activations for 1-bit LLMs

Paper • 2411.04965 • Published 20 days ago • 63

upvoted a paper 22 days ago

HtmlRAG: HTML is Better Than Plain Text for Modeling Retrieved Knowledge in RAG Systems

Paper • 2411.02959 • Published 23 days ago • 64

upvoted a paper 23 days ago

Hunyuan-Large: An Open-Source MoE Model with 52 Billion Activated Parameters by Tencent

Paper • 2411.02265 • Published 23 days ago • 24

upvoted a collection 24 days ago

MobileLLM

Collection

Optimizing Sub-billion Parameter Language Models for On-Device Use Cases (ICML 2024) https://arxiv.org/abs/2402.14905 • 9 items • Updated about 23 hours ago • 97

upvoted a paper 27 days ago

Stealing User Prompts from Mixture of Experts

Paper • 2410.22884 • Published 29 days ago • 13

upvoted 2 papers 30 days ago

GPT-4o System Card

Paper • 2410.21276 • Published Oct 25 • 79

A Survey of Small Language Models

Paper • 2410.20011 • Published Oct 25 • 38