Giada Pistilli

giadap

AI & ML interests

Principal Ethicist @ HF

Recent Activity

Reacted to malhajar's post with 🔥 7 days ago
🇫🇷 Lancement officiel de l'OpenLLM French Leaderboard : initiative open-source pour référencer l’évaluation des LLMs francophones Après beaucoup d’efforts et de sueurs avec Alexandre Lavallee, nous sommes ravis d’annoncer que le OpenLLMFrenchLeaderboard est en ligne sur Hugging Face (space url: https://huggingface.co/spaces/le-leadboard/OpenLLMFrenchLeaderboard) la toute première plateforme dédiée à l’évaluation des grands modèles de langage (LLM) en français. 🇫🇷✨ Ce projet de longue haleine est avant tout une œuvre de passion mais surtout une nécessité absolue. Il devient urgent et vital d'oeuvrer à plus de transparence dans ce domaine stratégique des LLM dits multilingues. La première pièce à l'édifice est donc la mise en place d'une évaluation systématique et systémique des modèles actuels et futurs. Votre modèle IA français est-il prêt à se démarquer ? Soumettez le dans notre espace, et voyez comment vous vous comparez par rapport aux autres modèles. ❓ Comment ça marche : Soumettez votre LLM français pour évaluation, et nous le testerons sur des benchmarks de référence spécifiquement adaptés pour la langue française — notre suite de benchmarks comprend : - BBH-fr : Raisonnement complexe - IFEval-fr : Suivi d'instructions - GPQA-fr : Connaissances avancées - MUSR-fr : Raisonnement narratif - MATH_LVL5-fr : Capacités mathématiques - MMMLU-fr : Compréhension multitâche Le processus est encore manuel, mais nous travaillons sur son automatisation, avec le soutien de la communauté Hugging Face. @clem , on se prépare pour une mise à niveau de l’espace ? 😏👀 Ce n'est pas qu'une question de chiffres—il s'agit de créer une IA qui reflète vraiment notre langue, notre culture et nos valeurs. OpenLLMFrenchLeaderboard est notre contribution personnelle pour façonner l'avenir des LLM en France.
View all activity

Articles

Organizations

giadap's activity

Reacted to malhajar's post with 🔥 7 days ago
view post
Post
3933
🇫🇷 Lancement officiel de l'OpenLLM French Leaderboard : initiative open-source pour référencer l’évaluation des LLMs francophones

Après beaucoup d’efforts et de sueurs avec Alexandre Lavallee, nous sommes ravis d’annoncer que le OpenLLMFrenchLeaderboard est en ligne sur Hugging Face (space url: le-leadboard/OpenLLMFrenchLeaderboard) la toute première plateforme dédiée à l’évaluation des grands modèles de langage (LLM) en français. 🇫🇷✨

Ce projet de longue haleine est avant tout une œuvre de passion mais surtout une nécessité absolue. Il devient urgent et vital d'oeuvrer à plus de transparence dans ce domaine stratégique des LLM dits multilingues. La première pièce à l'édifice est donc la mise en place d'une évaluation systématique et systémique des modèles actuels et futurs.

Votre modèle IA français est-il prêt à se démarquer ? Soumettez le dans notre espace, et voyez comment vous vous comparez par rapport aux autres modèles.

❓ Comment ça marche :
Soumettez votre LLM français pour évaluation, et nous le testerons sur des benchmarks de référence spécifiquement adaptés pour la langue française — notre suite de benchmarks comprend :

- BBH-fr : Raisonnement complexe
- IFEval-fr : Suivi d'instructions
- GPQA-fr : Connaissances avancées
- MUSR-fr : Raisonnement narratif
- MATH_LVL5-fr : Capacités mathématiques
- MMMLU-fr : Compréhension multitâche

Le processus est encore manuel, mais nous travaillons sur son automatisation, avec le soutien de la communauté Hugging Face.

@clem , on se prépare pour une mise à niveau de l’espace ? 😏👀

Ce n'est pas qu'une question de chiffres—il s'agit de créer une IA qui reflète vraiment notre langue, notre culture et nos valeurs. OpenLLMFrenchLeaderboard est notre contribution personnelle pour façonner l'avenir des LLM en France.
  • 1 reply
·
published an article 5 months ago
view article
Article

Unveiling CIVICS: A New Dataset for Examining Cultural Values in Language Models

By giadap
10
upvoted an article 6 months ago
view article
Article

Reports on the Hub: A First Look at Self-governance in Open Source AI Development

By frimelle
8
New activity in sapienzanlp/Minerva-3B-base-v1.0 7 months ago

🚩 Report: Ethical issue(s)

3
#2 opened 7 months ago by giadap

Update Model Card

#3 opened 7 months ago by giadap
upvoted an article 7 months ago
New activity in stablediffusionapi/real-amateur-nudes 7 months ago
New activity in UnfilteredAI/NSFW-gen-v2 8 months ago
New activity in UnfilteredAI/NSFW-gen 8 months ago
New activity in Dremmar/nsfw-xl 9 months ago

Add "Not-For-All-Audiences" Tag

#2 opened 9 months ago by giadap
New activity in stablediffusionapi/newrealityxl-global-nsfw 10 months ago
New activity in miqudev/miqu-1-70b 10 months ago
liked a Space 10 months ago