Inference Acceleration - a Kevin16 Collection

Kevin16 's Collections

Inference Acceleration

Video Understanding

Corpus

Inference Acceleration

updated 30 days ago

SwiftKV: Fast Prefill-Optimized Inference with Knowledge-Preserving Model Transformation

Paper • 2410.03960 • Published Oct 4 • 1