Yuxian Gu's picture

6 9 1

Yuxian Gu

t1101675

·

https://t1101675.github.io/

AI & ML interests

Efficient methods for language models

Organizations

t1101675's activity

upvoted a paper 15 days ago

MiniPLM: Knowledge Distillation for Pre-Training Language Models

Paper • 2410.17215 • Published 16 days ago • 12

upvoted a paper 29 days ago

Data Selection via Optimal Control for Language Models

Paper • 2410.07064 • Published 29 days ago • 8

upvoted a paper 4 months ago

Compact Language Models via Pruning and Knowledge Distillation

Paper • 2407.14679 • Published Jul 19 • 37

upvoted 2 papers 8 months ago

Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context

Paper • 2403.05530 • Published Mar 8 • 59

Towards Optimal Learning of Language Models

Paper • 2402.17759 • Published Feb 27 • 16

upvoted a paper about 1 year ago

An Emulator for Fine-Tuning Large Language Models using Small Language Models

Paper • 2310.12962 • Published Oct 19, 2023 • 14

upvoted 3 papers over 1 year ago

Pre-Training to Learn in Context

Paper • 2305.09137 • Published May 16, 2023 • 2

Retentive Network: A Successor to Transformer for Large Language Models

Paper • 2307.08621 • Published Jul 17, 2023 • 170

Knowledge Distillation of Large Language Models

Paper • 2306.08543 • Published Jun 14, 2023 • 20