Prompt-only datasets - a trl-lib Collection

trl-lib 's Collections

Preference datasets

Stepwise supervision datasets

Prompt-completion datasets

Prompt-only datasets

Unpaired preference datasets

Comparing DPO with IPO and KTO

Prompt-only datasets

updated 7 days ago

trl-lib/ultrafeedback-prompt

Viewer • Updated 7 days ago • 39.8k • 642 • 3