dilmash release - a tahrirchi Collection

tahrirchi 's Collections

updated Sep 10

Dilmash: Karakalpak Machine Translation

Open Language Data Initiative: Advancing Low-Resource Machine Translation for Karakalpak

Paper • 2409.04269 • Published Sep 6 • 9

Note Describes the development and evaluation of Dilmash models for Karakalpak machine translation, including datasets and methodologies used.
tahrirchi/dilmash-raw

Translation • Updated Sep 10 • 16 • 1

Note Fine-tuned the original nllb-200-600M model on Dilmash parallel corpus
tahrirchi/dilmash

Translation • Updated Sep 10 • 27 • 1

Note Fine-tuned the original nllb-200-600M model on Dilmash parallel corpus with additional tokens from a larger Karakalpak monocorpus
tahrirchi/dilmash-til

Translation • Updated Sep 10 • 15 • 1

Note Fine-tuned the original nllb-200-600M model on Dilmash parallel corpus and additional multilingual data from the TIL corpus with additional tokens from a larger Karakalpak monocorpus
tahrirchi/dilmash

Viewer • Updated Sep 10 • 300k • 61 • 5

Note Dilmash parallel corpus that is used to fine-tune dilmash models.