Spaces:

CONDA-Workshop
/

Data-Contamination-Database

Running

App Files Files Community

Data-Contamination-Database

Commit History

Add PR number + postprocessing

1e54760

OSainz commited on May 30

GPT-3.5 HumanEval_R CodeForces2305 contamination based on https://arxiv.org/abs/2402.15938

42e416f
verified

suryanshs16103 commited on May 26

Add reports from Benchmarking paper "Benchmark Leakage in Large Language Models" (#27)

25633c4
verified

SinclairWang commited on May 24

Add Reports Based on "Llemma: An Open Language Model For Mathematics" (#23)

9fba4d8
verified

wlchen commited on May 13

add flores contamination in xP3 (#20)

100cb5e
verified

davidstap commited on May 7

Add Aquila model series which have gsm8k test set contamination (#21)

8f6a7cc
verified

bpHigh commited on May 6

Update README.md

e190954
verified

OSainz commited on May 6

GPT-3.5 Spider contamination based on https://arxiv.org/pdf/2402.08100 (#18)

dc4c3f8
verified

bpHigh commited on May 6

update interface

95be02e

OSainz commited on Apr 29

Merge branch 'pr/17'

77404ae

OSainz commited on Apr 29

Updates

d4d0c64

OSainz commited on Apr 29

File fixes and cleaning (#17)

99a8650
verified

OSainz commited on Apr 29

Add info about the changes in the markdown.

4a1e5cc

OSainz commited on Apr 29

Add changes

23add19

OSainz commited on Apr 29

Superglue/RealNews Contamination based on "Noise-Robust De-Duplication at Scale" (#15)

888fb82
verified

emilys commited on Apr 29

Mistral 7B Arc Easy Contamination based on "Proving Test Set Contamination in Black Box Language Models" (#14)

4f71313
verified

AmeyaPrabhu commited on Apr 29

Added Contamination Evidence from GPT4 Tech Report using String matching on GPT-4 (#11)

f82db5d
verified

AmeyaPrabhu commited on Apr 29

GPT-3.5Turbo HumanEval Contamination based on "Generalization or Memorization: Data Contamination and Trustworthy Evaluation for Large Language Models" (#16)

6b722ae
verified

jupyter31 commited on Apr 29

Added Contamination Evidence on MMLU of ChatGPT/GPT4 from "Investigating data contamination in modern benchmarks for large language models" (#10)

f5daf9b
verified

AmeyaPrabhu commited on Apr 29

Add ignorecase to search options

473e687

OSainz commited on Apr 25

Added Contamination Info on Old Models: GPT3, FLAN, GLaM, PaLM, PaLM 2 (#13)

c4acbf6
verified

AmeyaPrabhu commited on Apr 25

Contamination results based on "Data Contamination Quiz" (#9)

36aaa79
verified

shahriargolchin commited on Apr 25

Fix arxiv links

7127ae8

OSainz commited on Apr 25

Code contamination in HumanEval and MBPP (#12)

ffb0d75
verified

AmeyaPrabhu commited on Apr 25

Update README.md

9852685
verified

Iker commited on Apr 23

Add model-based results for MedNLI, RadNLI for GPT-3.5 and GPT-4 (#8)

d57b460
verified

j-chim commited on Apr 23

Add data from "An Open-Source Data Contamination Report for Large Language Models" (#5)

619ed3b
verified

vishaal27 commited on Apr 23

Import data from LM Contamination Index (#7)

e1c863c
verified

OSainz commited on Apr 19

Fix format issues

9b28f49

OSainz commited on Apr 18

Add data from "Documenting Large Webtext Corpora: A Case Study on the Colossal Clean Crawled Corpus" (#6)

935e79b
verified

vishaal27 commited on Apr 18

update urls

f77074b

Iker commited on Apr 13

Increase tab font size

6738f41

Iker commited on Apr 13

Further refine the guidelines

49c00c2

Iker commited on Apr 13

Update markdown.py

49c092a
verified

OSainz commited on Mar 27

Get token from environment

76cf558

OSainz commited on Mar 25

Add reports from Time Travel In LLMs paper (#3)

5a41656
verified

OSainz commited on Mar 25

Use HF api to check repo existance

dee592a

OSainz commited on Mar 25

Fix super_glue replace

ab79de8

OSainz commited on Mar 25

Add PR links to previous commits

f35c65c

OSainz commited on Mar 25

Add data from WIMBD paper (#2)

eadd64a
verified

OSainz commited on Mar 24

Small changes

fd6f269

OSainz commited on Mar 22

theme changes

540407e

OSainz commited on Mar 12

Style + gitignore

5945c23

OSainz commited on Mar 12

Text fixes

11def42

Iker commited on Mar 12

Initital commit

eba8a37

Iker commited on Mar 12

initial commit

1751f3a
verified

Iker commited on Mar 12