Spaces:
Sleeping
Sleeping
title: Zero-Shot Interface | |
name: huggingface/Sahajtomar/German_Zeroshot | |
description: > | |
Bei dieser Aufgabe handelt es sich um eine Textklassifizierungsaufgabe. Das heißt, das Modell | |
bekommt einen Textinhalt vorgelegt und muss aus einer Liste vordefinierter Labels entscheiden, | |
welches dieser Labels den Inhalt des Textes am besten beschreibt. Der Krux bei der ganzen Sache ist, | |
dass das Modell keine Spezialisierung für die Labels erfahren hat und sozusagen beim ersten Mal die | |
richtige Auswahl treffen muss; daher zero shot, denn es hat nur einen Versuch. Erreicht wird dies, in | |
dem ein vortrainiertes Modell auf einen Datensatz für Natural Language Inference (dt. natürlichsprachliche | |
Inferenz oder Rückschluss auf natürliche Sprache) spezialisiert wird. Bei dieser Aufgabe bekommt | |
das Modell zwei Texte vorgelegt und muss lernen, in welchem Verhältnis die beiden Texte zueinanderstehen. | |
Folgende Klassen stehen dabei zur Auswahl: | |
<ul> | |
<li>entailment: Text A ist eine logische Schlussfolgerung von Text B</li> | |
<li>contradiction: Text A steht im Widerspruch zu Text B</li> | |
<li>neutral: es lassen sich keine Schlussfolgerungen dieser Art ziehen</li> | |
</ul> | |
</br></br> | |
Nehmen wir als Beispiel den Ausgangstext «Die Kinder lächeln und winken in die Kamera». Nach der Spezialisierung | |
sollte das Modell in der Lage sein zu sagen, dass die Aussage «Es sind Kinder anwesend.» eine logische | |
Schlussfolgerung des Ausgangstextes ist, während die Aussage «Die Kinder runzeln die Stirn.» im Widerspruch | |
zum Ausgangstext steht. | |
</br></br> | |
Es hat sich gezeigt, dass Modelle, die auf Natural Language Inference spezialisiert wurden, auch sehr gut darin sind, | |
Texten thematisch passende Labels zuzuordnen. Wenn wir wieder den Ausgangstext von vorhin nehmen, wäre das Modell in | |
der Lage zu sagen, dass von den möglichen Kandidatenlabels [Wirtschaft, Familie, Feier, Tragödie] Familie und Feier | |
diejenigen Labels sind, die den Inhalt des Textes am besten beschreiben.</br></br>Das hier verwendete Beispielmodell | |
wurde auf deutschsprachige Texte trainiert. | |
examples: | |
- | |
- > | |
COVID-19 (Akronym von englisch coronavirus disease 2019, deutsch Coronavirus-Krankheit-2019), in den | |
deutschsprachigen Ländern umgangssprachlich meist nur als „Corona“ oder „Covid“ bezeichnet, ist eine | |
meldepflichtige Infektionskrankheit mit einem breiten aber unspezifischen Symptomspektrum, die durch eine | |
Infektion (Ansteckung) mit dem Betacoronavirus SARS-CoV-2 verursacht wird. Das Virus wurde erstmals im | |
Dezember 2019 in Wuhan (Volksrepublik China) beschrieben. Es verbreitete sich sehr schnell weltweit und ist | |
Ursache der COVID-19-Pandemie. Bis 18. Oktober 2022 wurden weltweit rund 622 Millionen COVID-Infizierte registriert, | |
es wird aber in vielen Ländern eine hohe Dunkelziffer vermutet. Laut einer Schätzung der Weltgesundheitsorganisation | |
(WHO) gab es zwischen Anfang 2020 und Ende 2021 eine weltweite, durch COVID-19 verursachte Übersterblichkeit von | |
14,83 Millionen Toten. | |
- | |
- Wirtschaft | |
- Familie | |
- Politik | |
- Finanzen | |
- Medizin | |
- Gesundheit | |
- True | |