Shihan Dou's picture

11 4 6

Shihan Dou

Ablustrund

·

https://shihandou.com

Ablustrund

AI & ML interests

Natural Language Processing, Large Language Models

Organizations

Ablustrund's activity

upvoted an article 6 months ago

Article

BigCodeBench: Benchmarking Large Language Models on Solving Practical and Challenging Programming Tasks

Jun 18

• 42

upvoted 2 papers 10 months ago

Secrets of RLHF in Large Language Models Part II: Reward Modeling

Paper • 2401.06080 • Published Jan 11 • 26

StepCoder: Improve Code Generation with Reinforcement Learning from Compiler Feedback

Paper • 2402.01391 • Published Feb 2 • 41

upvoted a paper over 1 year ago

Secrets of RLHF in Large Language Models Part I: PPO

Paper • 2307.04964 • Published Jul 11, 2023 • 28