Models
Datasets
Spaces
Posts
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2412.06769

about 20 hours ago

Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18 • 144
Orion-14B: Open-source Multilingual Large Language Models

Paper • 2401.12246 • Published Jan 20 • 12
MambaByte: Token-free Selective State Space Model

Paper • 2401.13660 • Published Jan 24 • 51
MM-LLMs: Recent Advances in MultiModal Large Language Models

Paper • 2401.13601 • Published Jan 24 • 45

about 7 hours ago

The Impact of Hyperparameters on Large Language Model Inference Performance: An Evaluation of vLLM and HuggingFace Pipelines

Paper • 2408.01050 • Published Aug 2 • 8
Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters

Paper • 2408.03314 • Published Aug 6 • 33
Towards a Unified View of Preference Learning for Large Language Models: A Survey

Paper • 2409.02795 • Published Sep 4 • 72
Paper Copilot: A Self-Evolving and Efficient LLM System for Personalized Academic Assistance

Paper • 2409.04593 • Published Sep 6 • 23

Papers - CoT - Latent Search Tree

about 12 hours ago

Training Large Language Models to Reason in a Continuous Latent Space

Paper • 2412.06769 • Published 2 days ago • 42

Papers - Reasoning - CoT - Tree Search - BFS

about 12 hours ago

Training Large Language Models to Reason in a Continuous Latent Space

Paper • 2412.06769 • Published 2 days ago • 42

about 22 hours ago

Training Large Language Models to Reason in a Continuous Latent Space

Paper • 2412.06769 • Published 2 days ago • 42

about 24 hours ago

Training Large Language Models to Reason in a Continuous Latent Space

Paper • 2412.06769 • Published 2 days ago • 42

Training Large Language Models to Reason in a Continuous Latent Space

Paper • 2412.06769 • Published 2 days ago • 42

Training Large Language Models to Reason in a Continuous Latent Space

Paper • 2412.06769 • Published 2 days ago • 42

Training Large Language Models to Reason in a Continuous Latent Space

Paper • 2412.06769 • Published 2 days ago • 42

about 15 hours ago

Search, Verify and Feedback: Towards Next Generation Post-training Paradigm of Foundation Models via Verifier Engineering

Paper • 2411.11504 • Published 24 days ago • 19
Top-nσ: Not All Logits Are You Need

Paper • 2411.07641 • Published 30 days ago • 18
Adaptive Decoding via Latent Preference Optimization

Paper • 2411.09661 • Published 27 days ago • 10
When Precision Meets Position: BFloat16 Breaks Down RoPE in Long-Context Training

Paper • 2411.13476 • Published 21 days ago • 14

Previous
1
2
Next

Company

© Hugging Face

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs