SetFit with sentence-transformers/paraphrase-multilingual-mpnet-base-v2

This is a SetFit model that can be used for Text Classification. This SetFit model uses sentence-transformers/paraphrase-multilingual-mpnet-base-v2 as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

Fine-tuning a Sentence Transformer with contrastive learning.
Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Type: SetFit
Sentence Transformer body: sentence-transformers/paraphrase-multilingual-mpnet-base-v2
Classification head: a LogisticRegression instance
Maximum Sequence Length: 128 tokens
Number of Classes: 3 classes

Model Sources

Repository: SetFit on GitHub
Paper: Efficient Few-Shot Learning Without Prompts
Blogpost: SetFit: Efficient Few-Shot Learning Without Prompts

Model Labels

Label	Examples
pos	"Xi appelle la nation à lutter pour l'unité\nLe 28 septembre, le président Xi Jinping a appelé la nation à renforcer sa confiance et à s'efforcer de rester unie dans ses efforts incessants pour construire une Chine forte et réaliser le rajeunissement national" '"C'est le réalisateur le plus courageux que j'aie jamais rencontré", déclare Irwin Winkler, qui produit les films de Scorsese depuis plus de trente ans. Scorsese est peut-être surtout connu pour ses histoires policières emblématiques inspirées de sa propre éducation italo-américaine à New York, mais c'est aussi l'homme qui a réalisé la meilleure adaptation hollywoodienne d'Edith Wharton, qui est passé du cadre moderne de La couleur de l'argent à La dernière tentation du Christ et qui a dirigé une comédie musicale de Liza Minnelli reprise près de 50 ans plus tard L'ÂGE DE L'INNOCENCE (1993)\nAlors qu'en 1993, Scorsese avait déjà réalisé un certain nombre de classiques new-yorkais, il se lance dans la réalisation d'un nouveau film L'ÂGE DE L'INNOCENCE (1993)\nAlors qu'en 1993, Scorsese avait déjà réalisé un certain nombre de classiques new-yorkais, il se lance dans la réalisation d'un nouveau film.\nEn 1993, Scorsese avait déjà réalisé un certain nombre de classiques new-yorkais, mais il est entré en territoire inconnu avec ce drame romantique de l'âge d'or basé sur un roman Étude à l'écran\nPour accueillir Killers of the Flower Moon à l'écran, une étude de l'œuvre non-Mob de Martin Scorsese.\nMARTIN SCORSESE N'A PAS peur de ce qu'il ne connaît pas. "C'est le réalisateur le plus courageux que j'aie jamais rencontré", déclare Irwin Winkler, qui produit les films de Scorsese depuis plus de trente ans SILENCE (2016)\nCe drame, qui suit des prêtres jésuites du XVIIe siècle au Japon, est peut-être le film le plus sous-estimé de Scorsese sur la foi, car il confronte les inconnus de la spiritualité. Le tournage à Taïwan s'est déroulé dans des conditions difficiles, le temps changeant sauvagement d'une heure à l'autre Scorsese a dit de Silence qu'il s'agissait d'un projet passionnel de plus de 25 ans.\n3. LE LOUP DE WALL STREET (2013)\nScorsese s'est demandé si cette épopée cinétique et droguée de Wall Street était le bon film à faire à l'époque, mais Winkler l'a encouragé Cela n'est pas plus évident que lorsqu'il s'agit des films de Scorsese qui n'ont pas été des succès populaires, un catalogue remarquable en soi Le tournage à Taïwan s'est déroulé dans des conditions difficiles, le temps changeant sauvagement d'une heure à l'autre. Scorsese a dit de Silence qu'il s'agissait d'un projet passionnel de plus de 25 ans LES TUEURS DE LA FLEUR DE LUNE (2023)\nLe film est adapté du livre de David Grann sur les meurtres centenaires d'Amérindiens Osage, mais Scorsese a considérablement élargi la perspective indigène. Il a travaillé avec Rodrigo Prieto, directeur de la photographie de ses quatre derniers films, en filmant sur les lieux de la violence et en choisissant des couleurs riches et naturalistes TAUREAU ENRAGÉ (1980)\nAu début du développement, ce brillant film de boxe avec Robert De Niro semblait voué à l'échec. Les dirigeants le détestaient. Scorsese manquait d'intérêt. Mais après une overdose qui l'a conduit à l'hôpital, le réalisateur s'est senti à nouveau, intensément connecté à cette étude de caractère viscérale Son éclat somptueux peut être attribué au célèbre souci du détail de Scorsese. "La perfection de l'époque", c'est ainsi que le coiffeur Alan D'Angerio, nommé aux Oscars, décrit le mantra de l'équipe de conception' "J'ai rêvé de ce jour\nCinq citoyens américains détenus depuis des années en Iran dans des conditions que les autorités américaines qualifient de brutales ont été libérés lundi et autorisés à quitter le pays par avion, à l'issue de mois de négociations secrètes, a déclaré le président Joe Biden.\nEn échange, l'Iran aura accès à 6 milliards de dollars de revenus pétroliers iraniens qui ont été gelés, et cinq citoyens iraniens emprisonnés aux États-Unis seront libérés"
obj	'L'Iran a diffusé des images des deux prisonniers qui sont rentrés en République islamique dans le cadre de l'échange, tandis que deux resteront aux États-Unis et qu'un cinquième ira dans un pays tiers Lorsque les Américains se sont arrêtés à Doha après leur libération d'Iran, trois d'entre eux - Namazi, Sharghi et Morad Tahbaz - sont apparus. Ils ont serré dans leurs bras l'ambassadeur américain au Qatar, Timmy Davis, et d'autres personnes L'Iran et les États-Unis ont une histoire d'échanges de prisonniers qui remonte à la prise de l'ambassade américaine en 1979 et à la crise des otages qui a suivi la révolution islamique Les Américains libérés par l'Iran rentrent chez eux\nWASHINGTON >> Des Américains détenus depuis des années en Iran sont rentrés chez eux mardi, embrassant en larmes leurs proches et déclarant "Liberté !" après avoir été libérés dans le cadre d'un accord politiquement risqué qui a vu le président Joe Biden accepter le déblocage de près de 6 milliards de dollars d'avoirs iraniens gelés "Nous n'avons pas connu un tel moment depuis plus de huit ans", a-t-il ajouté, en entourant de son bras son frère et son père Baquer, anciennement détenu, qui avait été libéré par l'Iran. "C'est incroyable.\nL'un des autres Américains libérés, Emad Sharghi, a reçu de sa sœur, Neda, un drapeau américain et un animal en peluche qu'elle avait offert à leur père il y a 30 ans, lorsqu'il avait subi un pontage, a indiqué un représentant de la famille Kafrani a été inculpé en 2021 pour exportation illégale de matériel de laboratoire vers l'Iran et blanchiment d'argent, mais son affaire n'a pas encore été jugée.\nSelon Nour News, Mehrdad Ansari, un Iranien condamné par les États-Unis à 63 mois de prison en 2021 pour avoir obtenu du matériel pouvant être utilisé dans des missiles, des armes électroniques, des armes nucléaires et d'autres équipements militaires, a également été libéré Les 5,9 milliards de dollars en espèces remis à l'Iran représentent l'argent que la Corée du Sud devait à l'Iran - mais qu'elle n'avait pas encore payé - pour du pétrole acheté avant que les États-Unis n'imposent des sanctions sur ce type de transactions en 2019 Il est presque certain que les tensions resteront vives entre les États-Unis et l'Iran, qui sont en conflit au sujet du programme nucléaire de Téhéran et d'autres questions. L'Iran affirme que son programme est pacifique, mais il enrichit aujourd'hui de l'uranium à un niveau plus proche que jamais de celui des armes "Aujourd'hui, cinq Américains innocents qui étaient emprisonnés en Iran rentrent enfin chez eux", a déclaré le président démocrate dans un communiqué publié au moment où l'avion transportant le groupe de Téhéran atterrissait à Doha, au Qatar, lundi Biden de nouvelles critiques de la part des républicains et d'autres personnes qui estiment que l'administration aide à stimuler l'économie iranienne à un moment où l'Iran représente une menace croissante pour les troupes américaines et les alliés du Moyen-Orient. Cela pourrait avoir des conséquences sur sa campagne de réélection Deux membres de la famille des Américains emprisonnés, Effie Namazi et Vida Tahbaz, qui étaient interdites de voyage en Iran, se trouvaient également dans l'avion.\nLes 5,9 milliards de dollars en espèces remis à l'Iran représentent l'argent que la Corée du Sud devait à l'Iran - mais qu'elle n'avait pas encore payé - pour du pétrole acheté avant que les États-Unis n'imposent des sanctions sur ce type de transactions en 2019' "Le ratio des prêts douteux des prêteurs philippins tombe à son niveau le plus bas depuis 4 mois\nLes prêts douteux détenus par les banques philippines ont diminué en glissement annuel à la fin du mois d'août, ramenant le ratio des prêts non performants (NPL) à son niveau le plus bas depuis quatre mois, malgré des coûts d'emprunt élevés" 'Les gouverneurs républicains du Texas et de Floride ont été critiqués pour avoir envoyé des migrants dans des villes perçues comme libérales, telles que New York et Sacramento. Mais M. Leeser, un démocrate, a déclaré que tous les migrants qui se trouvaient dans les bus d'El Paso se rendaient volontairement dans les villes de leur choix Le maire d'El Paso, au Texas, déclare que la ville est "au point de rupture" face à l'afflux de migrants à la frontière\n(Reuters) - L'afflux de migrants traversant la frontière américaine depuis le Mexique a poussé la ville d'El Paso, au Texas, à "un point de rupture", avec plus de 2 000 personnes par jour demandant l'asile, dépassant la capacité des refuges et mettant à rude épreuve les ressources, a déclaré son maire hier'
neg	'Steve Smith, directeur général de Care4Calais, a déclaré : "Aujourd'hui, Keir Starmer avait l'occasion d'injecter un peu de décence et de compassion dans le débat sur les réfugiés. Au lieu de cela, il a choisi de refléter les artifices et la rhétorique de division employés par les conservateurs "Nous avons besoin d'une plus grande tolérance à l'égard des divergences d'opinion dans notre politique, en particulier sur des questions sensibles telles que l'immigration Starmer critiqué par la gauche et la droite pour son plan visant à mettre fin à la crise des petits bateaux\nKeir Starmer a été attaqué par la gauche et la droite hier soir après avoir présenté des propositions visant à résoudre la crise des petits bateaux, dans le cadre de la première intervention majeure du parti travailliste sur la question' 'Trois membres du personnel de sécurité tués au J&K\nTrois officiers - deux de l'armée et un de la police du Jammu-et-Cachemire - ont été tués au cours d'une opération anti-militantisme dans le district d'Anantnag mercredi. Les forces de sécurité ont tué un militant supplémentaire au cours de l'opération lancée mardi à Rajouri, ce qui porte leur nombre à deux Malgré le mauvais temps et un terrain hostile, le second terroriste a été poursuivi et neutralisé mercredi matin après des tirs nourris tout au long de la nuit", a déclaré un porte-parole de l'armée basé au Jammu-et-Cachemire.\nIl a ajouté qu'une grande quantité de matériel de guerre avait été récupérée, y compris des médicaments portant des marques pakistanaises' 'Cette annonce, bien que non confirmée, est le premier signe de l'ampleur des enlèvements.\nOn sait que parmi les captifs se trouvent des soldats et des civils, dont des femmes, des enfants et des personnes âgées, pour la plupart des Israéliens, mais aussi des personnes d'autres nationalités Au moins 700 personnes auraient été tuées en Israël - un bilan stupéfiant que le pays n'avait pas connu depuis des décennies - et plus de 400 personnes auraient été tuées à Gaza En réponse, Israël a frappé plus de 800 cibles à Gaza jusqu'à présent, a déclaré l'armée israélienne, y compris des frappes aériennes qui ont rasé une grande partie de la ville de Beit Hanoun, dans le nord-est de l'enclave Plusieurs médias israéliens, citant des responsables des services de secours, ont déclaré qu'au moins 700 personnes avaient été tuées en Israël, dont 44 soldats. Le ministère de la santé de Gaza a déclaré que 413 personnes, dont 78 enfants et 41 femmes, ont été tuées dans le territoire Un responsable égyptien a déclaré qu'Israël avait demandé l'aide du Caire pour assurer la sécurité des otages. L'Égypte a également discuté avec les deux parties d'un éventuel cessez-le-feu, mais Israël n'était pas ouvert à une trêve "à ce stade", selon ce responsable, qui a demandé à ne pas être identifié car il n'était pas autorisé à informer les médias Une file d'attente s'est formée devant un poste de police du centre d'Israël pour fournir des échantillons d'ADN et d'autres moyens susceptibles d'aider à identifier des membres de la famille disparus L'Égypte a également discuté avec les deux parties d'un éventuel cessez-le-feu, mais Israël n'était pas ouvert à une trêve "à ce stade", selon ce responsable, qui a demandé à ne pas être identifié car il n'était pas autorisé à informer les médias Le Hezbollah a tiré des roquettes et des obus dimanche sur des positions israéliennes dans une zone contestée le long de la frontière, et Israël a riposté en utilisant des drones armés. L'armée israélienne a déclaré que la situation était calme après l'échange Israël a l'habitude de procéder à des échanges très déséquilibrés pour ramener les Israéliens captifs chez eux.\nUn responsable égyptien a déclaré qu'Israël avait demandé l'aide du Caire pour assurer la sécurité des otages Au cours des quatre dernières décennies, Israël a mené des campagnes militaires de grande envergure au Liban et à Gaza, qu'il a présentées comme des guerres, mais sans déclaration officielle Israël riposte au Hamas et le bilan s'alourdit\nLe gouvernement israélien a officiellement déclaré la guerre et donné le feu vert à des "mesures militaires significatives" en représailles à l'attaque surprise du Hamas Entre-temps, le Hamas et le Jihad islamique, plus petit groupe, ont affirmé avoir capturé plus de 130 personnes à l'intérieur d'Israël et les avoir emmenées à Gaza, déclarant qu'elles seraient échangées contre la libération de milliers de Palestiniens emprisonnés par Israël Le nombre élevé de morts et la lenteur de la réaction à l'assaut ont mis en évidence une défaillance majeure des services de renseignement et ébranlé l'idée longtemps répandue selon laquelle Israël a des yeux et des oreilles partout dans le petit territoire densément peuplé qu'il contrôle depuis des dizaines d'années La déclaration de guerre laissait présager une intensification des combats, et l'une des principales questions était de savoir si Israël lancerait un assaut terrestre dans la bande de Gaza, ce qui, par le passé, a entraîné une augmentation du nombre de victimes Dans le nord d'Israël, un bref échange de frappes avec le groupe militant libanais Hezbollah a ravivé les craintes que les combats ne se transforment en une guerre régionale plus large Israël a déclaré avoir fait intervenir des forces spéciales pour tenter de reprendre le contrôle de quatre sites israéliens aux combattants du Hamas, dont deux kibboutzim dans lesquels les militants avaient pénétré plus tôt dans leurs attaques'

Evaluation

Metrics

Label	0	1	2	Accuracy	Macro Avg	Weighted Avg
all	{'precision': 0.6018099547511312, 'recall': 0.5611814345991561, 'f1-score': 0.5807860262008734, 'support': 237}	{'precision': 0.5602409638554217, 'recall': 0.6262626262626263, 'f1-score': 0.591414944356121, 'support': 297}	{'precision': 0.7932692307692307, 'recall': 0.7268722466960352, 'f1-score': 0.7586206896551724, 'support': 227}	0.6360	{'precision': 0.6517733831252612, 'recall': 0.6381054358526059, 'f1-score': 0.6436072200707222, 'support': 761}	{'precision': 0.642697294251897, 'recall': 0.6360052562417872, 'f1-score': 0.6379808452498016, 'support': 761}

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mogaio/pr_ebsa_fr_tran_merged25_e1_beginning_offsets_10_v3")
# Run inference
preds = model("Adil Hussain
Adil Hussain est reconnaissant d'avoir reçu l'enseignement de l'acteur Naseeruddin Shah à l'époque où il fréquentait l'École nationale d'art dramatique")

Training Details

Training Set Metrics

Training set	Min	Median	Max
Word count	1	243.9997	2071

Label	Training Sample Count
neg	912
obj	1220
pos	908

Training Hyperparameters

batch_size: (8, 8)
num_epochs: (10, 10)
max_steps: -1
sampling_strategy: oversampling
num_iterations: 1
body_learning_rate: (2e-05, 1e-05)
head_learning_rate: 0.01
loss: CosineSimilarityLoss
distance_metric: cosine_distance
margin: 0.25
end_to_end: False
use_amp: False
warmup_proportion: 0.1
seed: 42
eval_max_steps: -1
load_best_model_at_end: True

Training Results

Epoch	Step	Training Loss	Validation Loss
0.0013	1	0.3526	-
0.0658	50	0.3825	-
0.1316	100	0.2039	-
0.1974	150	0.2579	-
0.2632	200	0.3062	-
0.3289	250	0.1744	-
0.3947	300	0.1571	-
0.4605	350	0.222	-
0.5263	400	0.2697	-
0.5921	450	0.2507	-
0.6579	500	0.311	-
0.7237	550	0.3169	-
0.7895	600	0.1766	-
0.8553	650	0.1756	-
0.9211	700	0.2497	-
0.9868	750	0.0889	-
1.0	760	-	0.2281
1.0526	800	0.1036	-
1.1184	850	0.3135	-
1.1842	900	0.1744	-
1.25	950	0.3287	-
1.3158	1000	0.1816	-
1.3816	1050	0.231	-
1.4474	1100	0.153	-
1.5132	1150	0.2131	-
1.5789	1200	0.1358	-
1.6447	1250	0.276	-
1.7105	1300	0.2646	-
1.7763	1350	0.0337	-
1.8421	1400	0.158	-
1.9079	1450	0.1123	-
1.9737	1500	0.0889	-
2.0	1520	-	0.2268
2.0395	1550	0.2369	-
2.1053	1600	0.196	-
2.1711	1650	0.2799	-
2.2368	1700	0.073	-
2.3026	1750	0.2392	-
2.3684	1800	0.1551	-
2.4342	1850	0.178	-
2.5	1900	0.1719	-
2.5658	1950	0.1203	-
2.6316	2000	0.1502	-
2.6974	2050	0.0963	-
2.7632	2100	0.1566	-
2.8289	2150	0.1273	-
2.8947	2200	0.264	-
2.9605	2250	0.0736	-
3.0	2280	-	0.2385
3.0263	2300	0.1577	-
3.0921	2350	0.1613	-
3.1579	2400	0.2313	-
3.2237	2450	0.1134	-
3.2895	2500	0.0593	-
3.3553	2550	0.0395	-
3.4211	2600	0.119	-
3.4868	2650	0.0152	-
3.5526	2700	0.019	-
3.6184	2750	0.1056	-
3.6842	2800	0.1355	-
3.75	2850	0.2262	-
3.8158	2900	0.102	-
3.8816	2950	0.2388	-
3.9474	3000	0.1755	-
4.0	3040	-	0.2576
4.0132	3050	0.0957	-
4.0789	3100	0.2034	-
4.1447	3150	0.0076	-
4.2105	3200	0.0431	-
4.2763	3250	0.2228	-
4.3421	3300	0.0124	-
4.4079	3350	0.2316	-
4.4737	3400	0.037	-
4.5395	3450	0.1812	-
4.6053	3500	0.2115	-
4.6711	3550	0.2534	-
4.7368	3600	0.1833	-
4.8026	3650	0.0135	-
4.8684	3700	0.1169	-
4.9342	3750	0.0093	-
5.0	3800	0.0728	0.2787
5.0658	3850	0.022	-
5.1316	3900	0.0586	-
5.1974	3950	0.002	-
5.2632	4000	0.1112	-
5.3289	4050	0.0902	-
5.3947	4100	0.0002	-
5.4605	4150	0.108	-
5.5263	4200	0.0158	-
5.5921	4250	0.0725	-
5.6579	4300	0.0014	-
5.7237	4350	0.2018	-
5.7895	4400	0.0023	-
5.8553	4450	0.002	-
5.9211	4500	0.213	-
5.9868	4550	0.0034	-
6.0	4560	-	0.2994
6.0526	4600	0.1203	-
6.1184	4650	0.1615	-
6.1842	4700	0.1968	-
6.25	4750	0.004	-
6.3158	4800	0.0018	-
6.3816	4850	0.048	-
6.4474	4900	0.0748	-
6.5132	4950	0.0007	-
6.5789	5000	0.0019	-
6.6447	5050	0.0015	-
6.7105	5100	0.0075	-
6.7763	5150	0.0012	-
6.8421	5200	0.0016	-
6.9079	5250	0.0009	-
6.9737	5300	0.0004	-
7.0	5320	-	0.2721
7.0395	5350	0.0142	-
7.1053	5400	0.0527	-
7.1711	5450	0.0019	-
7.2368	5500	0.0024	-
7.3026	5550	0.0002	-
7.3684	5600	0.0349	-
7.4342	5650	0.0008	-
7.5	5700	0.0008	-
7.5658	5750	0.0005	-
7.6316	5800	0.0002	-
7.6974	5850	0.0024	-
7.7632	5900	0.0017	-
7.8289	5950	0.0002	-
7.8947	6000	0.0028	-
7.9605	6050	0.0124	-
8.0	6080	-	0.3064
8.0263	6100	0.0038	-
8.0921	6150	0.064	-
8.1579	6200	0.0007	-
8.2237	6250	0.0022	-
8.2895	6300	0.0012	-
8.3553	6350	0.0103	-
8.4211	6400	0.0008	-
8.4868	6450	0.0058	-
8.5526	6500	0.0046	-
8.6184	6550	0.1061	-
8.6842	6600	0.0005	-
8.75	6650	0.1509	-
8.8158	6700	0.0027	-
8.8816	6750	0.0002	-
8.9474	6800	0.0006	-
9.0	6840	-	0.3014
9.0132	6850	0.0018	-
9.0789	6900	0.0006	-
9.1447	6950	0.0003	-
9.2105	7000	0.0007	-
9.2763	7050	0.0006	-
9.3421	7100	0.0003	-
9.4079	7150	0.1859	-
9.4737	7200	0.0009	-
9.5395	7250	0.12	-
9.6053	7300	0.0148	-
9.6711	7350	0.0002	-
9.7368	7400	0.0005	-
9.8026	7450	0.1027	-
9.8684	7500	0.0002	-
9.9342	7550	0.0004	-
10.0	7600	0.0003	0.3075

The bold row denotes the saved checkpoint.

Framework Versions

Python: 3.10.12
SetFit: 1.0.1
Sentence Transformers: 2.2.2
Transformers: 4.35.2
PyTorch: 2.1.0+cu121
Datasets: 2.16.1
Tokenizers: 0.15.0

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}

mogaio
/

pr_ebsa_fr_tran_merged25_e1_beginning_offsets_10_v3