Spaces:

TheFinAI
/

Open-Financial-LLM-Leaderboard

Running

mirageco commited on 29 days ago

Commit

ee62fba

•

1 Parent(s): e9d718d

Display results on the dashboard even if the result is missing by filling in "missings" into the column

Files changed (1) hide show

src/leaderboard/read_evals.py CHANGED Viewed

@@ -86,6 +86,9 @@ class EvalResult:
         missing_benchmarks = task_benchmarks - results.keys()
         if missing_benchmarks:
             print(f"(Missing results) Model {model} is missing {', '.join(missing_benchmarks)} from result files")
         return self(
@@ -157,11 +160,16 @@ class EvalResult:
         # Calculate the mean for each category and add to data_dict
         data_dict = {}
         for category, scores in category_averages.items():
-            average = sum(scores) / len(scores) if scores else 0
             data_dict[category] = average
         # Overall average
-        total_scores = [v for v in self.results.values() if v is not None]
         overall_average = sum(total_scores) / len(total_scores) if total_scores else 0
         # Add other columns

         missing_benchmarks = task_benchmarks - results.keys()
         if missing_benchmarks:
             print(f"(Missing results) Model {model} is missing {', '.join(missing_benchmarks)} from result files")
+            for benchmark in missing_benchmarks:
+                results[benchmark] = "missing"
         return self(
         # Calculate the mean for each category and add to data_dict
         data_dict = {}
         for category, scores in category_averages.items():
+            # Calculate the average if there are valid scores, otherwise set to 0
+            valid_scores = [score for score in scores if score != "missing"]
+            if valid_scores:
+                average = sum(valid_scores) / len(valid_scores)
+            else:
+                average = 0
             data_dict[category] = average
         # Overall average
+        total_scores = [v for v in self.results.values() if v != "missing"]
         overall_average = sum(total_scores) / len(total_scores) if total_scores else 0
         # Add other columns