Anikait Singh's picture

3 2 1

Anikait Singh

Asap7772

·

https://asap7772.github.io

AI & ML interests

Deep Learning, Reinforcement Learning, Robotics

Organizations

Papers 5

arxiv:2408.08441

arxiv:2404.14367

arxiv:2310.08864

arxiv:2309.13041

models

None public yet

datasets 145

Asap7772/prm800k_backtracks_onpolicy_bofn_valuemc_turn_dependent_sep_reward_relabeledvalue_balanced_mc

Viewer • Updated 1 day ago • 20k

Asap7772/prm800k_backtracks_onpolicy_bofn_valuemc_turn_dependent_sep_reward_relabeledvalue_unbalanced_mc

Viewer • Updated 1 day ago • 20k

Asap7772/prm800k_backtracks_onpolicy_bofn_valuemc_turn_independent_sep_reward_relabeledvalue_balanced_mc

Viewer • Updated 1 day ago • 20k • 1

Asap7772/ogmath5_backtracks_onpolicy_bofn_valuemc_turn_dependent_cummulative_reward

Viewer • Updated 1 day ago • 268k • 40

Asap7772/ogmath5_backtracks_onpolicy_bofn_valuemc_turn_dependent_sep_reward

Viewer • Updated 1 day ago • 268k • 24

Asap7772/ogmath5_backtracks_onpolicy_bofn_valuemc_turn_independent_sep_reward

Viewer • Updated 1 day ago • 268k • 24

Asap7772/prm800k_backtracks_onpolicy_bofn_valuemc_turn_dependent_cummulative_reward

Viewer • Updated 2 days ago • 226k • 112

Asap7772/prm800k_backtracks_onpolicy_bofn_valuemc_turn_dependent_sep_reward

Viewer • Updated 2 days ago • 226k • 144

Asap7772/prm800k_backtracks_onpolicy_bofn_valuemc_turn_independent_sep_reward

Viewer • Updated 2 days ago • 226k • 104

Asap7772/aime_dataset

Viewer • Updated 5 days ago • 933 • 8