ArabicWeb24-ablation-models - a lightonai Collection

lightonai 's Collections

updated Aug 5

900M models trained on 25BT to compare different data processing choices (filtering, sentence dedup, minhash, etc)