Tulu 3 Datasets - a allenai Collection

allenai 's Collections

PixMo

OLMo 2

Tulu 3 Datasets

Molmo

OLMoE

Tulu V2.5 Suite

Paloma

SciRIFF

AI2 Safety Toolkit

Zebra Logic Bench

ACE

Tulu 3 Datasets

updated about 2 hours ago

All datasets released with Tulu 3 -- state of the art open post-training recipes.

allenai/tulu-3-sft-mixture

Viewer • Updated 6 days ago • 939k • 1.12k • 47

Note Our main SFT mixture.
allenai/llama-3.1-tulu-3-8b-preference-mixture

Preview • Updated 6 days ago • 100 • 5

Note The full preference mixture used for DPO on our 8B SFT checkpoint.
allenai/llama-3.1-tulu-3-70b-preference-mixture

Viewer • Updated 6 days ago • 334k • 451 • 7

Note The full preference mixture used for DPO on our 70B SFT checkpoint.
allenai/tulu-3-sft-personas-math

Viewer • Updated 6 days ago • 150k • 95 • 4

Note The rest from here are individual new SFT or preference datasets we created!
allenai/tulu-3-sft-personas-instruction-following

Viewer • Updated 6 days ago • 30k • 88 • 7
allenai/tulu-3-sft-personas-math-grade

Viewer • Updated 6 days ago • 50k • 130 • 3
allenai/tulu-3-sft-personas-algebra

Viewer • Updated 6 days ago • 20k • 57 • 1
allenai/tulu-3-sft-personas-code

Viewer • Updated 26 days ago • 35k • 68 • 2
allenai/coconot

Viewer • Updated Jul 18 • 13.8k • 303 • 4
allenai/wildjailbreak

Viewer • Updated Aug 8 • 2.21k • 1.01k • 23
allenai/tulu-3-hard-coded

Viewer • Updated 7 days ago • 240 • 52 • 2
allenai/tulu-3-pref-personas-instruction-following

Viewer • Updated 6 days ago • 19.9k • 61 • 3
allenai/tulu-3-wildchat-ultrafeedback

Viewer • Updated 6 days ago • 139k • 40
allenai/tulu-3-sft-prompts-ultrafeedback

Viewer • Updated 6 days ago • 267k • 36 • 1
allenai/tulu-3-sft-reused-off-policy

Viewer • Updated 6 days ago • 96.9k • 49 • 1
allenai/tulu-3-sft-reused-on-policy-8b

Viewer • Updated 6 days ago • 19.4k • 31
allenai/tulu-3-wildchat-if-on-policy-8b

Viewer • Updated 6 days ago • 10.8k • 26
allenai/tulu-3-IF-augmented-on-policy-8b

Viewer • Updated 6 days ago • 65.5k • 30
allenai/tulu-3-wildchat-reused-on-policy-8b

Viewer • Updated 6 days ago • 17.2k • 33
allenai/tulu-3-ultrafeedback-cleaned-on-policy-8b

Viewer • Updated 6 days ago • 41.6k • 28 • 1
allenai/tulu-3-sft-reused-on-policy-70b

Viewer • Updated 6 days ago • 19.5k • 28
allenai/tulu-3-wildchat-if-on-policy-70b

Viewer • Updated 6 days ago • 10.8k • 36
allenai/tulu-3-IF-augmented-on-policy-70b

Viewer • Updated 6 days ago • 65.6k • 31
allenai/tulu-3-wildchat-unused

Viewer • Updated 6 days ago • 82.8k • 26
allenai/tulu-3-wildchat-reused-on-policy-70b

Viewer • Updated 6 days ago • 17.2k • 26
allenai/tulu-3-ultrafeedback-cleaned-on-policy-70b

Viewer • Updated 6 days ago • 41.6k • 22
allenai/RLVR-GSM-MATH-IF-Mixed-Constraints

Viewer • Updated 2 days ago • 29.9k • 79 • 3
allenai/RLVR-GSM

Viewer • Updated 7 days ago • 8.79k • 24
allenai/RLVR-MATH

Viewer • Updated 7 days ago • 7.5k • 25
allenai/RLVR-IFeval

Viewer • Updated 7 days ago • 15k • 31
allenai/wildguardmix

Viewer • Updated Jun 29 • 88.5k • 3.54k • 13