李浩's picture

10 2

李浩

lihaocruiser

·

lihaocruiser

AI & ML interests

None yet

Organizations

None yet

lihaocruiser's activity

upvoted a paper 18 days ago

Physics of Language Models: Part 2.2, How to Learn From Mistakes on Grade-School Math Problems

Paper • 2408.16293 • Published 22 days ago • 23

upvoted 3 papers 6 months ago

Agent-FLAN: Designing Data and Methods of Effective Agent Tuning for Large Language Models

Paper • 2403.12881 • Published Mar 19 • 16

LLM Agent Operating System

Paper • 2403.16971 • Published Mar 25 • 64

LLM2LLM: Boosting LLMs with Novel Iterative Data Enhancement

Paper • 2403.15042 • Published Mar 22 • 24

upvoted 2 papers 7 months ago

When Scaling Meets LLM Finetuning: The Effect of Data, Model and Finetuning Method

Paper • 2402.17193 • Published Feb 27 • 23

Chain-of-Thought Reasoning Without Prompting

Paper • 2402.10200 • Published Feb 15 • 94

upvoted 4 papers 8 months ago

The Impact of Reasoning Step Length on Large Language Models

Paper • 2401.04925 • Published Jan 10 • 15

Towards Conversational Diagnostic AI

Paper • 2401.05654 • Published Jan 11 • 15

Secrets of RLHF in Large Language Models Part II: Reward Modeling

Paper • 2401.06080 • Published Jan 11 • 24

Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18 • 140