Models
Datasets
Spaces
Posts
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2412.09871

Papers - Tokenizers - Bytes - Incremental Patching

Note: BPE does not handle incremental patching like BLT

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published 14 days ago • 76

Papers - Tokenizers- Bytes - Entropy Patching - Threshold

Helps with finding the end of the byte patch

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published 14 days ago • 76

Papers - Tokenizers - Bytes - Space - First Char - Patch Len

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published 14 days ago • 76

Papers - Tokenizers - Bytes - Patches - Space Detection

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published 14 days ago • 76

Papers - Tokenizers - Bytes - Patches - Entropy-based

Patch start detected by entropy crossing a threshold

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published 14 days ago • 76

Papers - Tokenizers - Bytes - Strided Patches - MegaByte

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published 14 days ago • 76

Papers - Text - Tokenizer - Bytes - Strided Patches

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published 14 days ago • 76

Papers - Training Research - Bytes - No Vocabulary

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published 14 days ago • 76

Papers - Training - Activation Function - SwiGLU

Qwen2.5 Technical Report

Paper • 2412.15115 • Published 8 days ago • 328
Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published 14 days ago • 76

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published 14 days ago • 76
Large Action Models: From Inception to Implementation

Paper • 2412.10047 • Published 14 days ago • 29

Previous
1
2
3
4
5
6
...
8
Next

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs