Spanish LLM Benchmark Annotation with Argilla
Collaborative effort on Spanish ARC-C, HellaSwag, and MMLU
Colección de esfuerzos colaborativos para crear corpus en español de calidad. Toda persona hispanohablante puede contribuir :)
Collaborative effort on Spanish ARC-C, HellaSwag, and MMLU
Note Contribuye a la creación de la primera leaderboard abierta de LLMs en español. El objetivo es que personas nativas validen las traducciones de los datasets de la Open LLM Leaderboard hechas automáticamente por la Universidad de Oregón. ¡Tu nombre aparecerá como parte del equipo y por cada set de 50 traducciones validadas tendrás una recompensa! (Ahora mismo priorizamos colaborar a ARC-C y HellaSwag)
Note Dashboard para ver cómo avanzamos en comunidad en la validación de los benchmarks.
Note Nos sumamos a la iniciativa internacional "Data Is Better Together" traduciendo esta base de datos de prompts al español, ¡anímate a validar las traducciones!
Note Dashboard para ver cómo avanzamos en comunidad en la validación de DIBT-ES.
Note Dashboard general del proyecto "Data Is Better Together".
Note Espacio de anotación de un proyecto del Hackathon #Somos600M. Invitamos a todo el mundo a apoyar la creación de este dataset sobre reglamento aeronáutico. Usuario: admin, contraseña: 12345678