Rubyando59 commited on
Commit
09ef70f
1 Parent(s): 24d6ee9

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +53 -930
README.md CHANGED
@@ -1,930 +1,75 @@
1
- ---
2
- base_model: OrdalieTech/Solon-embeddings-large-0.1
3
- datasets: []
4
- language: []
5
- library_name: sentence-transformers
6
- metrics:
7
- - cosine_accuracy@1
8
- - cosine_accuracy@3
9
- - cosine_accuracy@5
10
- - cosine_accuracy@10
11
- - cosine_precision@1
12
- - cosine_precision@3
13
- - cosine_precision@5
14
- - cosine_precision@10
15
- - cosine_recall@1
16
- - cosine_recall@3
17
- - cosine_recall@5
18
- - cosine_recall@10
19
- - cosine_ndcg@10
20
- - cosine_mrr@10
21
- - cosine_map@100
22
- - dot_accuracy@1
23
- - dot_accuracy@3
24
- - dot_accuracy@5
25
- - dot_accuracy@10
26
- - dot_precision@1
27
- - dot_precision@3
28
- - dot_precision@5
29
- - dot_precision@10
30
- - dot_recall@1
31
- - dot_recall@3
32
- - dot_recall@5
33
- - dot_recall@10
34
- - dot_ndcg@10
35
- - dot_mrr@10
36
- - dot_map@100
37
- pipeline_tag: sentence-similarity
38
- tags:
39
- - sentence-transformers
40
- - sentence-similarity
41
- - feature-extraction
42
- - generated_from_trainer
43
- - dataset_size:28864
44
- - loss:MultipleNegativesRankingLoss
45
- widget:
46
- - source_sentence: Dans le cadre d'une VEFA, quand les sommes perçues à titre de garantie
47
- locative sont-elles comptabilisées en produit ?
48
- sentences:
49
- - 'FAITS SIGNIFICATIFS DE LA PÉRIODE 11 1. MOUVEMENTS DE PÉRIMÈTRE EN 2020 Mouvements
50
- de périmètre réalisés par l''État Constitution d’un pôle financier public Le 30
51
- août 2018, l''État et la Caisse des Dépôts ont annoncé leur volonté de créer un
52
- grand pôle financier public visant à renforcer la cohésion des territoires et
53
- à lutter contre la fracture territoriale en métropole et dans les outremers à
54
- travers La Poste et la Caisse des Dépôts, opérateurs de proximité au service des
55
- citoyens. La mise en œuvre de ce projet a été finalisée par échanges et transferts
56
- de titres : • Le 4 mars 2020 : apport par l''État et la Caisse des Dépôts à La
57
- Poste, puis par celle-ci à La Banque Postale, de leurs participations respectives
58
- de 1,1% et de 40,9% au capital de CNP Assurances. Au terme de cette opération,
59
- le groupe La Poste détient 62,13% du capital de CNP Assurances et est consolidé
60
- par intégration globale par la Caisse des Dépôts. L’État détient quant à lui 34%
61
- du nouveau groupe La Poste. La réalisation de cette opération a généré les impacts
62
- suivants sur les comptes du groupe La Poste : –une augmentation de capitaux propres
63
- consolidés de 4 027 M€ correspondant à l’apport de 288.262.094 actions CNP Assurances
64
- valorisées au cours de bourse du 4 mars 2020 (13,97 euros) ; –le reclassement
65
- en résultat net des réserves de conversion en gain latents de CNP Assurances pour
66
- la quote-part du groupe, avant l’opération, générant un produit de 594 M€, classé
67
- sur la ligne « quote-part de résultat des autres sociétés mises en équivalence
68
- » du compte de résultat ; –la dépréciation de la valeur des titres précédemment
69
- mis en équivalence au regard du cours de bourse de l’action CNP Assurances au
70
- jour de l’opération soit 1 571 M€, montant représentant la différence entre la
71
- valeur des titres mis en équivalence (3 054 M€) et la valeur de bourse (1 933
72
- M€) ; –la constatation d’un badwill pour un montant de 4 578 M€ correspondant
73
- à la différence entre, d’une part la quote-part du groupe dans l’actif net de
74
- CNP Assurances valorisé à la juste valeur (déterminé dans la cadre de l’allocation
75
- du prix d’acquisition), soit 10 538 M€, et d’autre part la totalité des titres
76
- valorisés au cours de bourse du jour de l’opération soit 5 960 M€ ; • Le 30 septembre
77
- 2020 : rachat par la Caisse des Dépôts de la totalité de la participation détenue
78
- par La Banque Postale au capital de SFIL (soit 5%) et par l''État (soit 75%),
79
- à l’exception d’une action ordinaire conservée par l''État. La Caisse des Dépôts
80
- est ainsi devenu l’actionnaire de référence de SFIL. Les comptes des groupes La
81
- Poste et SFIL ont été enregistrés en intégration globale, en « actifs détenus
82
- en vue de la vente », dans les comptes combinés jusqu’au 4 mars 2020 et 30 septembre
83
- 2020 respectivement. Les comptes du groupe La Poste sont enregistrés en mise en
84
- équivalence à compter du 4 mars 2020. Réforme du ferroviaire - Création d’un groupe
85
- SNCF intégré Après deux années consacrées à sa préparation en 2018 et 2019, la
86
- réforme ferroviaire a été mise en œuvre en 2020.'
87
- - 'Conformément aux dispositions de la norme IFRS 1, Vivendi a choisi de constater
88
- au 1 er janvier 2004 les écarts actuariels non encore comptabilisés en contrepartie
89
- des capitaux propres consolidés. 1.3.10 Impôts différés Les différences existant
90
- à la date de clôture entre la valeur fiscale des actifs et passifs et leur valeur
91
- comptable au bilan c onstituent des différences temporelles. En application de
92
- la méthode bilantielle du report variable, ces différences temporelles donnent
93
- lieu à la comptabilisation :  d’actifs d’impôt différé, lorsque la valeur fiscale
94
- est supérieure à la valeur comptable (situation correspondant à une économi e
95
- future d’impôt attendue) ;  ou de passifs d’impôt différé, lorsque la valeur
96
- fiscale est inférieure à la valeur comptable (situation correspondant à une ta
97
- xation future attendue). Les actifs et passifs d’impôt différé sont déterminés
98
- sur la base des taux d’impôt dont l’application est attendue sur l’exerci ce au
99
- cours duquel l’actif sera réalisé ou le passif réglé, et sur la base des taux
100
- d’impôt (et réglementations fiscales) qui ont été adopt és ou quasi adoptés à
101
- la date de clôture. Ces estimations sont revues à la clôture de chaque exercice,
102
- en fonction de l’évolution éventuell e des taux d’impôt applicables. Des actifs
103
- d’impôt différé sont comptabilisés pour toutes différences temporelles déductibles,
104
- reports en avant de pertes fisca les et crédits d’impôt non utilisés, dans la
105
- mesure où il est probable qu’un bénéfice imposable sera disponible ou lorsqu’il
106
- existe un passif d’impôt exigible sur lequel ces différences temporelles déductibles,
107
- reports en avant de pertes fiscales et crédits d’impôt non utilisés pourron t
108
- être imputés, sauf quand l’actif d’impôt différé lié à la différence temporelle
109
- déductible est généré par la comptabilisation initiale d’un a ctif ou d’un passif
110
- dans une opération qui n’est pas un regroupement d’entreprises et qu i, à la date
111
- de l’opération, n’affecte ni le bénéfice compt able, ni le bénéfice imposable
112
- ou la perte fiscale. Pour les différences temporelles déductibles liées à des
113
- participations dans les filiales, coentreprises et entreprises associé es, des
114
- actifs d’impôt différé sont comptabilisés dans la mesure où il est pr obable que
115
- la différence temporelle s’inversera dans un avenir pr évisible et qu’il existera
116
- un bénéfice imposable sur lequel pourra s’imputer la différence temporelle.'
117
- - 'Capitaux propres « En complément des éléments, prévus dans le plan comptable
118
- général, et si les statuts de la SCPI le prévoient, les éléments suivants peuvent
119
- être imputés sur la prime d’émission : - les frais d’établissement - les commissions
120
- de souscription, - les frais d’acquisition des immeubles tels que les droits d’enregistre
121
- - ment, la TVA non récupérable pour les immeubles commerciaux et professionnels
122
- et les frais de notaire. » ii – rEglES DE COMPtABiliSAtiOn DES PrODUitS Et CHArgES
123
- Produits de l’activité immobilière : - les loyers sont enregistrés en produits
124
- sur la base des loyers courus et des termes du bail. - Dans le cas des ventes
125
- en l’état futur d’achèvement (VEFA), les sommes perçues à titre de garantie locative
126
- sont comptabilisées en produit dans la ScPi, lorsqu’un tel mécanisme est prévu
127
- dans le contrat liant la ScPi et le promoteur immobilier sur la période de garantie.
128
- corrélativement, le coût de la garantie payée par la ScPi, corres - pondant à
129
- une prime d’assurance est comptabilisé en charges sur la période de garantie :
130
- - soit pour son montant, s’il a pu être valorisé de manière explicite lors de
131
- l’acquisition et si le montant des loyers garantis correspond à la valeur locative
132
- de marché du bien immobilier ; - soit, dans tous les autres cas, pour le même
133
- montant que les loyers garantis. Les pré-loyers reçus par la SCPI en rémunération
134
- du financement d’un bien immobilier acquis en état futur d’achèvement pendant
135
- la période de construction sont inscrits en autres produits financiers. - les
136
- produits de l’activité immobilière incluent également les charges incombant normalement
137
- au propriétaire, mises contractuellement à la charge des locataires dont la refacturation
138
- aux locataires constitue un produit immobilier à porter au compte 7021 « charges
139
- immobilières facturées ». - les produits de l’activité immobilière incluent également
140
- les charges locatives refacturées et sont comptabilisées au compte 7025 « charges
141
- locatives refacturées ». - les produits de l’activité immobilière incluent également
142
- les pro - duits des participations contrôlées par la ScPi et comptabilisées en
143
- placements immobiliers.La SCPI Allianz Home FranceSCPI.com'
144
- - source_sentence: Quel outil est utilisé pour enregistrer les anomalies significatives
145
- dans la gestion des risques opérationnels ?
146
- sentences:
147
- - ' des conclusions des rapports établis par le contrôle périodique ou par des
148
- tiers (dont les régulateurs) ;  des incidents internes ou externes. Les cartographies
149
- de risques opérationnels sont présentées formellement, de manière annuelle, au
150
- Directeur des risques « Chief Risk Officer » afin de s’assurer de leur pertinence
151
- par rapport aux autres risques auxquels la banque fait face. Sur la base des cartographies
152
- réalisées par les métiers, les fonctions et Digital Business Services, les fonctions
153
- Assurance élaborent un plan de revues de second niveau des activités des différentes
154
- entités. Ce plan présente les activités de contrôle indépendant de 2nd niveau
155
- qui seront conduites au cours de l''année suivante. Le programme doit faire l''objet
156
- de révisions et de mises à jour continues, au fur et à mesure des changements
157
- de situation et ce, afin de garantir la pérennité de sa pertinence. Les anomalies
158
- significatives relevées dans les revues des équipes Assurance doivent être présentées
159
- au Risk Owner de l’entité concernée et sont enregistrées dans l’outil de gestion
160
- des risques opérationnels, Helios. Le dispositif de contrôle de premier niveau
161
- ainsi identifié fait l’objet d’une cotation en fonction d’une échelle de trois
162
- notes : - opérant (“ effective “) : conçu de manière efficace et fonctionne comme
163
- prévu, - à améliorer (“ needs improvement “) : la conception ou le fonctionnement
164
- du dispositif de contrôle présente des failles, il n’atténue que partiellement
165
- le risque, - inopérant (“ ineffective “) : la conception ou le fonctionnement
166
- du dispositif de contrôle présente des failles significatives, aucune mesure n''est
167
- prévue ou ne permettra de les résoudre, ou le contrôle est manquant. Les dispositifs
168
- de contrôles cotés « à améliorer » ou « inopérants », donnent lieu à la définition
169
- d’un plan d’actions correctrices destiné à rendre le contrôle « opérant ». L’élaboration
170
- et l’actualisation des cartographies de risques sont de la responsabilité première
171
- des opérationnels, propriétaires des risques, Risk Owners , à qui il revient d’identifier
172
- et d’évaluer les risques ainsi que les contrôles de premier niveau à effectuer.
173
- Ce travail est réalisé au fil de l’eau avec l’aide des Control Owners en fonction
174
- notamment : - des résultats des contrôles opérés par les opérationnels, - les
175
- résultats des missions de contrôle permanent réalisées par les équipes Assurance,
176
- - des recommandations des Risk Stewards , - des conclusions des rapports établis
177
- par le contrôle périodique ou par des tiers (dont les régulateurs), - des incidents
178
- internes ou externes. La fonction Operational & Resilience Risk organise des «
179
- RCA challenge session » annuelles ou des ateliers de revue des risques les plus
180
- élevés, en présence des Risk Stewards, des « Chief Control Officers », (CCO),
181
- des responsables des métiers ou fonctions et du Chief Risk Officer , afin de présenter
182
- les risques significatifs de chaque entité. Sur base des cartographies réalisées
183
- par les métiers, les fonctions et DBS, les équipes Assurance élaborent un plan
184
- de revues de second niveau des activités des différentes entités. Ce plan présente
185
- les activités de contrôle indépendant de 2nd niveau qui seront conduites au cours
186
- de l''année suivante. Le programme doit faire l''objet de révisions et de mises
187
- à jour continues, au fur et à mesure des changements de situation et ce, afin
188
- de garantir la pérennité de sa pertinence. Ce plan est élaboré selon une approche
189
- par les risques afin d’assurer une couverture régulière et adéquate des risques
190
- sur un cycle pouvant aller jusqu’à 3 ans maximum. L’enregistrement des résultats
191
- de ce plan de contrôle doit se faire au fur et à mesure de son exécution. Les
192
- équipes Assurance effectuent un suivi permanent de la progression par rapport
193
- au programme, et doivent signaler tout retard.'
194
- - '(La version française de ce communiqué de presse vous est communiquée uniquement
195
- à titre d’information. Seule la version anglaise est officielle) Airbus publie
196
- ses résultats pour 2023 ● 735 avions commerciaux livrés ● Chiffre d’affaires de
197
- 65,4 milliards d’euros ; EBIT ajusté à 5,8 milliards d’euros ● EBIT (reporté)
198
- à 4,6 milliards d’euros ; BPA (reporté) de 4,80 euros ● Flux de trésorerie disponible
199
- avant fusions et acquisitions et financements-clients de 4,4 milliards d’euros
200
- ; trésorerie nette à 10,7 milliards d’euros ● Les prévisions 2023 ont été atteintes
201
- ● Proposition de dividende : 1,80 euro par action ; dividende exceptionnel de
202
- 1,00 euro par action ● Publication des prévisions 2024 Amsterdam, 15 février 2024
203
- – Airbus SE (symbole boursier : AIR) a publié ses résultats consolidés pour 2023
204
- et ses prévisions pour l’exercice 2024. « En 2023, toutes nos activités ont enregistré
205
- d’importantes prises de commandes et nous avons tenu nos engagements. Il s’agit
206
- d’un résultat remarquable compte tenu de la complexité du contexte opérationnel
207
- », a déclaré Guillaume Faury, président exécutif d’Airbus. « Nous continuerons
208
- à investir dans notre dispositif industriel mondial tout en poursuivant notre
209
- transformation et notre décarbonation. Notre proposition de dividendes reflète
210
- les bons résultats financiers de 2023, nos perspectives de croissance pour 2024
211
- et la solidité de notre bilan. » Airbus a enregistré 2 319 commandes brutes d’avions
212
- commerciaux (2022 : 1 078 avions) et 2 094 commandes nettes après annulations
213
- (2022 : 820 avions). Le carnet de commandes atteignait 8 598 avions commerciaux
214
- à fin décembre 2023. Airbus Helicopters a enregistré 393 commandes nettes (2022
215
- : 362 unités), qui profitent à tous les programmes, avec un ratio commandes nettes/livraisons
216
- supérieur à 1 en valeur et en volume. Les prises de commandes d’Airbus Defence
217
- and Space ont augmenté de 15 % à 15,7 milliards d’euros (2022 : 13,7 milliards
218
- d’euros), ce qui représente un ratio commandes nettes/livraisons d’environ 1,4
219
- en valeur. Les commandes enregistrées au quatrième trimestre comprenaient 16 C295
220
- destinés à l’Espagne.'
221
- - Les informations relatives à ces accords ont été publiées dans les conditions
222
- prévues à l’article L. 22-10-30 du Code de commer ce. En application des dispositions
223
- de l’article L. 225-88 du Code de commerce, ces conventions ont été approuvées
224
- par l’Assemblée générale des actionnaires de Vivendi SE le 25 avril 2022. 23.3
225
- Convention réglementée entre Vi vendi SE et Lagardère SA Au 31 décembre 2022,
226
- Vivendi SE détient 57,66 % du capital de Lagardère SA (se reporter aux notes 2.1
227
- et 14). La demande d’autorisation de la prise de contrôle de Lagardère SA auprès
228
- de la Commission européenne a été déposée par Vivendi SE le 24 octobre 2022. L’agrément
229
- de l’ARCOM11 sur le changement d’actionnariat indirect des filiales de Lagardère
230
- éditrices de services de radiodiffusion a été par ailleurs sollicité par ces dernières
231
- à la suite du résultat de l’offre publique d’achat visant toutes les actions Lagardère
232
- SA que Vivendi SE ne détient pas, dont le dépôt auprès de l’Autorité des marchés
233
- financiers a été réalisé le 21 févri er 2022. Afin de préparer les notifications
234
- réglementaires requises, Viv endi SE et Lagardère SA sont convenues d’échanger
235
- certaines info rmations, aux termes d’un accord dit de clean team , de confidentialité
236
- et de coopération réciproque conclu le 20 décembre 2021. Un tiers indépendant
237
- a été mandaté par Lagardère SA et Vivendi SE, aux coûts exclusifs de cette dernière,
238
- pour assurer la mise en place et la gestion de la clean team de chaque partie
239
- qui peut recevoir les informations confidentielles de l’autre partie strictement
240
- nécessaires à la préparation des notifications réglementaires requises. Les échanges
241
- d’informations sont assurés par ce tiers indépendant sous l e contrôle des conseils
242
- juridiques externes des parties. M. Arnaud de Puyfontaine étant Président du Directoire
243
- de Vivendi SE et administrateur de Lagardère SA, le Conseil de surveilla nce de
244
- Vivendi SE, dans ses séances du 15 septembre et du 18 novembre 2021, a autorisé,
245
- après examen, la signature de cet accord de clean team , de confidentialité et
246
- de coopération, conformément aux dispositions de l’article L. 225-86 du Code de
247
- commerce. Cet accord permet aux parties de préparer les demandes d’autorisation
248
- susvisées, tout en limitant leurs échanges aux informatio ns strictement nécessaires,
249
- en conformité avec la règlementation applicable et les garanties appropriées.
250
- Les informations relatives à cet accord ont été publiées dans les conditions prévues
251
- à l’article L. 22-10-30 du Code de commerc e. En application des dispositions
252
- de l’article L.225-88 du Code de co mmerce, cette convention a été approuvée par
253
- l’Assemblée gén érale des actionnaires de Vivendi SE le 25 avril 2022. Le coût
254
- total de cet accord s’est élevé à 147 444 euros bruts en 2022 et sera soumis à
255
- l’approbation de l’Assemblée générale de s actionnaires de Vivendi SE qui se tiendra
256
- en 2023. 10 Le mandat de membre du Directoire de Viv endi SE de MM. Gilles Alix
257
- et Cédric de Bailliencourt est arrivé à échéance le 23 juin 2022. 11 L’ARCOM,
258
- Autorité de régulation de la communication audiovisuelle et numérique, su ccède
259
- au Conseil Supérieur de l’Audiovisuel (CSA) et à la Haute autorité pour la diffusion
260
- des œuvres et la protection des droits sur internet (HADOPI) à compter du 1er
261
- janvier 2022.
262
- - source_sentence: Quel montant a été payé par les fonds de couverture pour les prestations
263
- de retraite en 2022 ?
264
- sentences:
265
- - 'mercredi 8 mars 2023 Rapport financier et États financiers consolidés audités
266
- de l''exercice clos le 31 décembre 2022 Vivendi / 97 19.2.2 Analyse de la charge
267
- comptabilisée et montant des prestations payées Prestations de retraite Prestations
268
- complémentaires Total (en millions d''euros) 2022 2021 2022 2021 2022 2021 Coût
269
- des services rendus 23 27 - - 23 27 Coût des services passés (a) (8) (25) - -
270
- (8) (25) (Gains)/pertes sur liquidation - - - - - - Autres 1 1 - - 1 1 Incidence
271
- sur les charges administratives et commerciales 16 3 - - 16 3 Effet de désactualisation
272
- des passifs actuariels 13 11 2 2 15 13 Rendement attendu des actifs de couverture
273
- (9) (6) - - (9) (6) Incidence sur les autres charges et produits financiers 4
274
- 5 2 2 6 7 Charge de la période comptabilisée en résultat 20 8 2 2 22 10 a. En
275
- 2021, le coût des services passés était un produit net d’exploitation de 25 millions
276
- d’euros, qui comprenait : - une charge d’exploitation de 11 millions d’euros,
277
- qui correspondait à la prise en compte sur la période d’emploi restante des bénéficiaires
278
- du coût résiduel des régimes de retraite additif et différentiel à prestations
279
- définies de Vivendi SE, dont l’acq uisition des droits est désormais fermée en
280
- conséquence de la loi PACTE ; - un produit d’exploitation de 35 millions d’euros,
281
- qui comprenait notamment l’incidence (19 millions d’euros) des pertes de droi
282
- ts consécutive aux départs de bénéficiaires intervenus en 2021, notamment dans
283
- le cadre de la cession d’UMG, et l’incidence au tit re des exercices 2020 et 2021
284
- (9 millions d’euros) du plafonnement des droits cumulés au titre des nouveaux
285
- régimes de retraite additif et différentiel à prestations définies de Vivendi
286
- SE, mis en place dans le cadre de la loi PACTE. En 2022, le montant des prestations
287
- payées s’élevait à 62 millions d’euros au titre des retraites (31 millions d’euros
288
- en 2021) et à 8 millions d’euros au titre des prestations complémentaires (9 millions
289
- d’ euros en 2021). Dans ce montant, 44 millions d’euros sont payés par les fonds
290
- de couverture (12 millions d’euros en 2021), dont 31 millions d’euros au titre
291
- des régimes de retraite additifs et différentiel à prestations définies de Vivendi
292
- SE (5 millions d’euros en 2021).'
293
- - Le projet de cession des bâtiments du site du Technocentre à Guyancourt dont le
294
- classement en Actifs destinés à être cédés avait été opéré dans les états financiers
295
- au 30 juin 2022 pour une valeur nette comptable de 322 mil lions d’euros a été
296
- suspendu suite à l ’évolution défavorable des conditions de marché. Ces actifs
297
- ont donc été reclassés en Immobilisations Corporelles et un rattrapage d’amortissements
298
- a été comptabilisé au 31 décembre 2023 pour un total de (46) millions d’euros.
299
- Le reclassement de ces actifs destinés à être cédés et passifs liés apparaît en
300
- autres variations dans les annexes concernées. (en millions d’euros) 31 décembre
301
- 2023 Dont Horse 31 décembre 2022 Dont Horse Immobilisations incorporelles et goodwill
302
- 962 962 795 795 Immobilisations corporelles 2 295 2 290 2 537 2 166 Stocks 366
303
- 366 418 338 Trésorerie et équivalents de trésorerie 91 91 23 8 Autres 308 198
304
- 88 71 Total actifs destinés à être cédés 4 022 3 907 3 861 3 378 Total des passifs
305
- liés aux actifs destinés à être cédés (1 075) (1 075) (873) (841) Dont passifs
306
- financiers (37) (37) (129) (102)
307
- - Déchets HA-MAVL Les déchets HA-MAVL proviennent essentiellement du traitement
308
- des combustibles usés et dans une moindre mesure des déchets issus du démantèlement
309
- des centrales nucléaires (composants métalliques ayant séjourné dans le réacteur).La
310
- loi du 28 juin 2006 prévoit pour ces déchets un stockage réversible en couche
311
- géologique profonde. La provision constituée pour les déchets HA-MAVL représente
312
- la part la plus importante des provisions pour gestion à long terme des déchets
313
- radioactifs. Jusqu’en juin 2015, le montant brut et l’échéancier des dépenses
314
- prévisionnelles étaient basés sur un scénario industriel de stockage géologique
315
- établi à partir des conclusions rendues au premier semestre 2005 par un groupe
316
- de travail constitué sous l’égide de l'État et réunissant les administrations
317
- concernées, l’ANDRA et les producteurs de déchets (EDF, Orano, CEA). EDF avait
318
- effectué une déclinaison raisonnable des éléments issus de ce groupe de travail
319
- et a abouti à un coût de référence du stockage des déchets de l’ensemble des producteurs
320
- à 14,1 Md€ aux conditions économiques de 2003 (20,8 Md€ aux conditions économiques
321
- de 2011). En 2012, l’ANDRA a réalisé les études d’esquisse sur le projet de stockage
322
- géologique (Cigéo). Sur cette base, l’ANDRA a établi un dossier de chiffrage,
323
- qui a fait l’objet, conformément à la loi du 28 juin 2006, d’un processus de consultation,
324
- initié fin décembre 2014 par la Direction Générale de l’Énergie et du Climat (DGEC)
325
- auprès des producteurs de déchets. Dans ce cadre, EDF et les autres producteurs
326
- ont transmis en avril 2015 à la DGEC leurs observations ainsi qu’une évaluation
327
- conjointe du coût objectif du stockage Cigéo du fait de divergences d’approches.
328
- Le dossier intégrant ces éléments ainsi que l’avis de l’Autorité de Sûreté Nucléaire
329
- (ASN) a été soumis à la ministre de l’Ecologie, du Développement durable et de
330
- l’Énergie. L’arrêté du 15 janvier 2016 pris par le Ministère de l’Ecologie, du
331
- Développement durable et de l’Énergie fixe le coût objectif au projet de stockage
332
- Cigéo à 25 Md€ aux conditions économiques du 31 décembre 2011. Le coût arrêté
333
- constitue un objectif à atteindre par l’ANDRA, dans le respect des normes de sûreté
334
- fixées par l’ASN, et en s’appuyant sur une coopération étroite avec les exploitants
335
- d’installations nucléaires. En application de cet arrêté, il a été prévu que le
336
- coût du projet Cigéo serait régulièrement mis à jour et a minima aux étapes clés
337
- du développement du projet (autorisation de création, mise en service, fin de
338
- la « phase industrielle pilote », réexamens de sûreté), conformément à l’avis
339
- de l’Autorité de Sûreté Nucléaire. En avril 2016, l’ANDRA a transmis à l’ASN un
340
- dossier d’options de sûreté (DOS). La loi du 11 juillet 2016 a par ailleurs précisé
341
- la notion de réversibilité. Le 11 janvier 2018, l’ASN a rendu son avis sur le
342
- DOS estimant que le projet Cigéo a atteint globalement une maturité technologique
343
- satisfaisante à ce stade. À noter que dans cet avis, l’ASN demande que pour les
344
- déchets bitumineux, des filières alternatives à leur stockage en l'État à Cigéo
345
- soient étudiées.
346
- - source_sentence: Quel produit d'impôt a été inclus dans la charge d'impôt différé
347
- pour la France en 2022 ?
348
- sentences:
349
- - '100 Rapport financier 2020 – 2021 de l’APE Les dérivés de transaction sont principalement
350
- constitués des dérivés de transaction de matières premières souscrits par EDF
351
- Trading et se décomposent comme suit : 31.12.2019 31.12.2020 Unités de mesureNotionnels
352
- netsJuste valeurNotionnels netsJuste valeur Électricité Térawattheures - 17 824
353
- - 174 - 380 GazMillions de therms- 7 826 76 - 6 803 310 Produits pétroliers Milliers
354
- de barils 14 290 8 24 301 58 Charbon et fretMillions de tonnes2 - 12 1 - 7 CO2Milliers
355
- de tonnes- 41 604 - 128 3 355 - 55 Autres matières premières - - 75 - 8 Instruments
356
- dérivés de transaction liés aux matières premières- 35 155 693 20 680 - 66'
357
- - 'Page 5 / 32 Chiffres clés Les informations financières présentées dans ce document
358
- sont élaborées à partir des comptes consolidés au 31 décembre 2023. Les résultats
359
- exceptionnels du Groupe s’expliquent par une très bonne performance opérationnelle
360
- avec une hausse importante de 41 ,4 TWh de la production nucléaire en France dans
361
- un contexte de prix historiquement élevés. Cela fait suite à une année 2022 marquée
362
- par une baisse brutale de la production nucléaire en France relatif au phénomène
363
- de la corrosion sous contrainte et les mesures régulatoires exceptionnelles en
364
- vue de limiter la hausse des prix pour les consommateurs. Ces résultats permettent
365
- une réduction de la dette financière nette. (en millions d’euros) 2023 2022 Variation
366
- en valeur Variation en % Variation organique en % Chiffre d’affaires 139 715 143
367
- 476 (3 761) -2,6 -2,1 EBE 39 927 (4 986) 44 913 n.a n.a Résultat d’exploitation
368
- 13 174 (19 363) 32 537 n.a n.a Résultat avant impôts des sociétés intégrées 9
369
- 825 (22 916) 32 741 n.a n.a Résultat net part du Groupe 10 016 (17 940) 27 956
370
- n.a n.a Résultat net courant (1) 18 481 (12 662) 31 143 n.a n.a Résultat net courant
371
- ajusté de la rémunération des hybrides 17 851 (13 268) 31 119 n.a n.a Cash -flow
372
- Groupe (2) 9 288 (24 603) 33 891 n.a n.a Endettement financier net (3) 54 381
373
- 64 500 (10 119) -15,7 n.a n.a : non applicable (1) Le résultat net courant n’est
374
- pas défini par les normes IFRS et n’apparaît pas en lecture directe dans le compte
375
- de résultat consolidé du Groupe. Il correspond au résultat net hors éléments non
376
- récurrents, hors variations nettes de juste valeur sur instruments dérivés énergie
377
- et matières premières hors activités de trading et hors variations nettes de juste
378
- valeur de titres de dettes et de capitaux propres nets d’impôts (voir section
379
- « Résultat net courant »). (2) Le cash- flow Groupe ne constitue pas un agrégat
380
- défini par les normes I FRS comme élément de mesure de la performance financière
381
- et ne peut pas être compar é aux indicateurs ainsi dénommés par d’autres entreprises.
382
- Il est égal au cash- flow généré par les opérations après cessions d’actifs, impôt
383
- sur le résultat payé, frais financiers nets décaissés, dotations nettes sur actifs
384
- dédiés, dividendes versés en numéraire (voir section 4) (3) L’endettement financier
385
- net n’est pas défini par les normes comptables et n’apparaît pas en lecture directe
386
- dans le bilan consolidé du Groupe (v oir section 4).'
387
- - Sur le plan fiscal, cette distribution est traitée comme une cession de titres.
388
- L’impôt afférent à la distribution de 59,87 % du capital d’UMG s’est élevé à 775
389
- millions d’euros, enregistr é dans le compte de résultat sur la ligne « Résultat
390
- net des activités cédées » conformément à la norme IFRS 5. Enfin, la différence
391
- entre la valeur fiscale de la participation résiduelle de 10,03 % dans le capital
392
- d’UMG et sa valeur de mi se en équivalence dans les comptes consolidés a conduit
393
- à comptabiliser un passif d’impôt différé de 119 millions d’euros, conforméme
394
- nt à la norme IAS 12, par la contrepartie du « Résultat net des activités cédées
395
- ». Sur l’exercice 2021, l’impôt afférent aux opérations relatives à UMG s’est
396
- élevé à un montant total de 1 063 millions d’euros, essentiellement au titre des
397
- plus-values réalisées par Vivend i, dont 895 millions d’euros enregistrés dans
398
- le « Résultat net de s activités cédées », 8 millions enregistrés dans le « Résultat
399
- des activités poursuivies » et 160 millions d’euros enregistrés en diminuti on
400
- des capitaux propres attribuables aux actionnaires de Vivendi. 7.3 Impôt sur les
401
- résultats et impôt payé par zone géographique Impôt sur les résultats Exercices
402
- clos le 31 décembre (en millions d'euros) 2022 2021 (Charge)/produit d'impôt Courant
403
- France (31) (5) Reste de l'Europe (32) (33) Afrique (41) (28) États-Unis (31)
404
- (30) Reste du monde (26) (21) (161) (117) Différé France (a) 31 (108) Reste de
405
- l'Europe 14 2 Afrique (2) 1 États-Unis 12 14 Reste du monde 7 2 62 (89) Impôt
406
- sur les résultats (99) (206) a. Inclus un produit de 41 millions d’euros en 2022,
407
- contre une charge de 94 millions d’euros en 2021 correspondant à la variation
408
- de l’actif d’impôt différé afférent à l’économie d’impôt liée au régime de l’intégration
409
- fiscale de Vivendi en France.
410
- - source_sentence: Pourquoi le montant total distribué en dividende peut-il varier
411
- d'une année à l'autre ?
412
- sentences:
413
- - Les impôts différés sont calculés en appliquant le dernier taux d’impôt voté à
414
- la date de clôture et applicable à la période de renversement de ces différences.
415
- Au sein d’une même entité fiscale (société juridique, établissement ou groupe
416
- d’entités redevable de l’impôt auprès de l’a dministration fiscale), les impôts
417
- différés actifs et passifs sont présentés de manière compensée, dès lors que celle
418
- -ci a le droit de compenser ses actifs et passifs d’impôts exigibles. Les actifs
419
- nets d’impôts différés sont reconnus en fonction de leur probabilité de réalisation
420
- future. Les entreprises associées et les coentreprises donnent lieu à comptabilisation
421
- d’un impôt différé passif de distribution pour les différences entre la valeur
422
- comptable et la valeur fiscale des titres. Les crédits d’impôt d ont l’utilisation
423
- est conditionnée par la réalisation d’un bénéfice fiscal sont comptabilisés en
424
- réduction de la charge d’impôt sur les résultats. Les crédits d’impôt dont la
425
- récupération n’est pas subordonnée à la réalisation d’un bénéfice fiscal figurent
426
- en réduction de la nature de charge à laquelle ils se rapportent. Pour évaluer
427
- les provisions pour positions fiscales incertaines, le Groupe utilise une méthode
428
- d’évaluation individuelle basée en général sur le montant le plus probable. Ces
429
- provisions son t classées sur des lignes dédiées dans la situation financière
430
- consolidée, afin de se conformer à leurs caractéristiques qualitatives. 2-J. Goodwill
431
- Les participations ne donnant pas le contrôle ( usuellement dénommées « intérêts
432
- minoritaires ») sont évaluées so it à la juste valeur (méthode dite du goodwill
433
- complet), soit à leur quote -part dans la juste valeur des actifs acquis et passifs
434
- repris (méthode dite du goodwill partiel). À ce jour Renault n’a enregistré que
435
- des goodwill évalués selon la méthode dite du goodwill partiel. L’option entre
436
- ces deux méthodes d’évaluation est exercée par le Groupe au cas par cas. Les goodwill
437
- font l’objet d’un test de dépréciation au minimum une fois par an, et dès qu’il
438
- existe un indice de perte de valeur. Après leur comptabi lisation initiale, les
439
- goodwill sont donc évalués à leur coût diminué du cumul des pertes de valeur éventuelles.
440
- Les goodwill relatifs à des entreprises associées et coentreprises sont inclus
441
- dans la valeur de ces participations à l’actif de la situation financière consolidée.
442
- En cas de perte de valeur, celle -ci est comptabilisée et intégr��e au compte de
443
- - 'Le 15 janvier 2016, la DGEC a rendu publique la synthèse du rapport de cet audit.
444
- L’Administration a indiqué que, bien que l’estimation du coût du démantèlement
445
- de réacteurs nucléaires reste un exercice délicat, compte tenu du retour d’expérience
446
- relativement limité, des perspectives d’évolution des techniques et de l’éloignement
447
- des dépenses dans le temps, l’audit confortait globalement l’estimation faite
448
- par EDF du coût du démantèlement de son parc nucléaire en exploitation. L’Administration
449
- a également formulé à EDF un certain nombre de recommandations suite à cet audit.
450
- En 2016, EDF a effectué une révision du devis de démantèlement afin de prendre
451
- en compte, d’une part, les recommandations de l’audit, qui lui avaient été adressées,
452
- et d’autre part, le retour d’expérience des opérations de démantèlement des réacteurs
453
- de première génération (en particulier Chooz A). Le travail de révision du devis
454
- a consisté en la mise en œuvre d’une démarche analytique détaillée, identifiant
455
- l’ensemble des coûts d’ingénierie, de travaux, d’exploitation et de traitement
456
- des déchets liés au démantèlement futur des réacteurs en cours de fonctionnement.
457
- Il permet d’aboutir à un chiffrage reposant sur des chroniques détaillées de démantèlement
458
- des centrales. La démarche adoptée a permis d’approfondir l’évaluation des coûts
459
- propres aux têtes de série, estimés pour chaque palier à partir de coefficients
460
- de transposition appliqués au coût de référence de la tête de série 900 MW, ainsi
461
- que les effets de série et de mutualisation, ces coûts et effets étant en effet
462
- inhérents à la taille et à la configuration du parc. Les natures des principaux
463
- effets de mutualisation et de série retenus dans les chiffrages du devis sont
464
- explicitées ci-dessous. Les effets de série (effet sur les sites suivants le site
465
- tête de série d’un même palier) sont principalement de deux natures différentes
466
- : • un premier effet provient du fait que sur un parc de même technologie, une
467
- large part des études ne doit pas être refaite à chaque fois ; • un second effet
468
- provient du fait que, sur un parc de même technologie, les robots et les outillages
469
- peuvent être très largement réutilisés d’un chantier à l’autre. Les effets de
470
- mutualisation (effets entre les différentes tranches présentes sur un même site
471
- qu’elles soient en exploitation ou en démantèlement) sont quant à eux de différentes
472
- natures : • certains sont liés au partage de bâtiments et d’équipements communs
473
- entre plusieurs réacteurs sur un même site, qu’il n’y a donc pas à démanteler
474
- deux fois. Ainsi, structurellement, le démantèlement d’une paire de réacteurs
475
- sur un même site coûte moins cher que le démantèlement de deux réacteurs isolés
476
- sur deux sites différents. En France, à la différence des autres'
477
- - Le Groupe Bolloré a précisé dans cette lettre qu’un tel franchissement de seuil
478
- n’aurait au demeurant rien d’inéluctable dès lo rs que les sociétés du Groupe
479
- Bolloré conservent la possibilité, notamment pour éviter sa survenance, de vendre
480
- des actions Vivendi ; elle s pourraient également participer à l’opération de
481
- réduction de capital en apportant leurs titres à l’offre de rachat qui serait
482
- mise en œuv re par Vivendi. Leur décision à cet égard n’est pas prise, elle le
483
- sera le moment venu. 17.3 Distribution d’un dividende ordina ire en numéraire
484
- aux actionnaires Dans le cadre de l’arrêté des comptes de l’exercice 2022 et de
485
- l’affectation du résultat de l’exercice, le Directoire de Vivend i, dans sa réunion
486
- du 6 mars 2023, a décidé de proposer aux actionnaires de mettre en paiement un
487
- dividende ordinaire en numéraire de 0,25 euro pa r action représentant un montant
488
- total distribué de 256 millions d’euros. Cette proposition a été portée à la connaissance
489
- du Conseil de surveillance du 8 mars 2023 qui l’a approuvée, et sera soumise à
490
- l’approbation de l’Assemblée générale des actionnaires du 24 avril 2023. Le 28
491
- avril 2022, au titre de l’exercice 2021, un dividende ordinaire de 0,25 euro par
492
- action a été versé (après détachement du coupon le 26 avril 2022), représentant
493
- un montant total distribué de 261 millions d’euros.
494
- model-index:
495
- - name: SentenceTransformer based on OrdalieTech/Solon-embeddings-large-0.1
496
- results:
497
- - task:
498
- type: information-retrieval
499
- name: Information Retrieval
500
- dataset:
501
- name: Unknown
502
- type: unknown
503
- metrics:
504
- - type: cosine_accuracy@1
505
- value: 0.5856079404466501
506
- name: Cosine Accuracy@1
507
- - type: cosine_accuracy@3
508
- value: 0.8163771712158809
509
- name: Cosine Accuracy@3
510
- - type: cosine_accuracy@5
511
- value: 0.8775847808105872
512
- name: Cosine Accuracy@5
513
- - type: cosine_accuracy@10
514
- value: 0.9454094292803971
515
- name: Cosine Accuracy@10
516
- - type: cosine_precision@1
517
- value: 0.5856079404466501
518
- name: Cosine Precision@1
519
- - type: cosine_precision@3
520
- value: 0.272125723738627
521
- name: Cosine Precision@3
522
- - type: cosine_precision@5
523
- value: 0.17551695616211743
524
- name: Cosine Precision@5
525
- - type: cosine_precision@10
526
- value: 0.09454094292803969
527
- name: Cosine Precision@10
528
- - type: cosine_recall@1
529
- value: 0.5856079404466501
530
- name: Cosine Recall@1
531
- - type: cosine_recall@3
532
- value: 0.8163771712158809
533
- name: Cosine Recall@3
534
- - type: cosine_recall@5
535
- value: 0.8775847808105872
536
- name: Cosine Recall@5
537
- - type: cosine_recall@10
538
- value: 0.9454094292803971
539
- name: Cosine Recall@10
540
- - type: cosine_ndcg@10
541
- value: 0.7693717436163442
542
- name: Cosine Ndcg@10
543
- - type: cosine_mrr@10
544
- value: 0.7125103391232432
545
- name: Cosine Mrr@10
546
- - type: cosine_map@100
547
- value: 0.7157854780098822
548
- name: Cosine Map@100
549
- - type: dot_accuracy@1
550
- value: 0.5856079404466501
551
- name: Dot Accuracy@1
552
- - type: dot_accuracy@3
553
- value: 0.8163771712158809
554
- name: Dot Accuracy@3
555
- - type: dot_accuracy@5
556
- value: 0.8775847808105872
557
- name: Dot Accuracy@5
558
- - type: dot_accuracy@10
559
- value: 0.9454094292803971
560
- name: Dot Accuracy@10
561
- - type: dot_precision@1
562
- value: 0.5856079404466501
563
- name: Dot Precision@1
564
- - type: dot_precision@3
565
- value: 0.272125723738627
566
- name: Dot Precision@3
567
- - type: dot_precision@5
568
- value: 0.17551695616211743
569
- name: Dot Precision@5
570
- - type: dot_precision@10
571
- value: 0.09454094292803969
572
- name: Dot Precision@10
573
- - type: dot_recall@1
574
- value: 0.5856079404466501
575
- name: Dot Recall@1
576
- - type: dot_recall@3
577
- value: 0.8163771712158809
578
- name: Dot Recall@3
579
- - type: dot_recall@5
580
- value: 0.8775847808105872
581
- name: Dot Recall@5
582
- - type: dot_recall@10
583
- value: 0.9454094292803971
584
- name: Dot Recall@10
585
- - type: dot_ndcg@10
586
- value: 0.7693717436163442
587
- name: Dot Ndcg@10
588
- - type: dot_mrr@10
589
- value: 0.7125103391232432
590
- name: Dot Mrr@10
591
- - type: dot_map@100
592
- value: 0.7157854780098822
593
- name: Dot Map@100
594
- ---
595
 
596
- # SentenceTransformer based on OrdalieTech/Solon-embeddings-large-0.1
597
 
598
- This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [OrdalieTech/Solon-embeddings-large-0.1](https://huggingface.co/OrdalieTech/Solon-embeddings-large-0.1). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
599
 
600
- ## Model Details
601
 
602
- ### Model Description
603
- - **Model Type:** Sentence Transformer
604
- - **Base model:** [OrdalieTech/Solon-embeddings-large-0.1](https://huggingface.co/OrdalieTech/Solon-embeddings-large-0.1) <!-- at revision 9f6465f6ea2f6d10c6294bc15d84edf87d47cdef -->
 
 
 
605
  - **Maximum Sequence Length:** 512 tokens
606
- - **Output Dimensionality:** 1024 tokens
607
  - **Similarity Function:** Cosine Similarity
608
- <!-- - **Training Dataset:** Unknown -->
609
- <!-- - **Language:** Unknown -->
610
- <!-- - **License:** Unknown -->
611
-
612
- ### Model Sources
613
-
614
- - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
615
- - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
616
- - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
617
 
618
- ### Full Model Architecture
619
-
620
- ```
621
- SentenceTransformer(
622
- (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
623
- (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
624
- (2): Normalize()
625
- )
626
- ```
627
 
628
- ## Usage
629
 
630
- ### Direct Usage (Sentence Transformers)
631
-
632
- First install the Sentence Transformers library:
633
-
634
- ```bash
635
- pip install -U sentence-transformers
636
- ```
637
-
638
- Then you can load this model and run inference.
639
  ```python
640
  from sentence_transformers import SentenceTransformer
641
 
642
  # Download from the 🤗 Hub
643
  model = SentenceTransformer("sujet-ai/Marsilia-Embeddings-FR-Large")
 
644
  # Run inference
645
  sentences = [
646
- "Pourquoi le montant total distribué en dividende peut-il varier d'une année à l'autre ?",
647
- 'Le Groupe Bolloré a précisé dans cette lettre qu’un tel franchissement de seuil n’aurait au demeurant rien d’inéluctable dès lo rs que les sociétés du Groupe Bolloré conservent la possibilité, notamment pour éviter sa survenance, de vendre des actions Vivendi ; elle s pourraient également participer à l’opération de réduction de capital en apportant leurs titres à l’offre de rachat qui serait mise en œuv re par Vivendi. Leur décision à cet égard n’est pas prise, elle le sera le moment venu. 17.3 Distribution d’un dividende ordina ire en numéraire aux actionnaires Dans le cadre de l’arrêté des comptes de l’exercice 2022 et de l’affectation du résultat de l’exercice, le Directoire de Vivend i, dans sa réunion du 6 mars 2023, a décidé de proposer aux actionnaires de mettre en paiement un dividende ordinaire en numéraire de 0,25 euro pa r action représentant un montant total distribué de 256 millions d’euros. Cette proposition a été portée à la connaissance du Conseil de surveillance du 8 mars 2023 qui l’a approuvée, et sera soumise à l’approbation de l’Assemblée générale des actionnaires du 24 avril 2023. Le 28 avril 2022, au titre de l’exercice 2021, un dividende ordinaire de 0,25 euro par action a été versé (après détachement du coupon le 26 avril 2022), représentant un montant total distribué de 261 millions d’euros.',
648
- 'Les impôts différés sont calculés en appliquant le dernier taux d’impôt voté à la date de clôture et applicable à la période de renversement de ces différences. Au sein d’une même entité fiscale (société juridique, établissement ou groupe d’entités redevable de l’impôt auprès de l’a dministration fiscale), les impôts différés actifs et passifs sont présentés de manière compensée, dès lors que celle -ci a le droit de compenser ses actifs et passifs d’impôts exigibles. Les actifs nets d’impôts différés sont reconnus en fonction de leur probabilité de réalisation future. Les entreprises associées et les coentreprises donnent lieu à comptabilisation d’un impôt différé passif de distribution pour les différences entre la valeur comptable et la valeur fiscale des titres. Les crédits d’impôt d ont l’utilisation est conditionnée par la réalisation d’un bénéfice fiscal sont comptabilisés en réduction de la charge d’impôt sur les résultats. Les crédits d’impôt dont la récupération n’est pas subordonnée à la réalisation d’un bénéfice fiscal figurent en réduction de la nature de charge à laquelle ils se rapportent. Pour évaluer les provisions pour positions fiscales incertaines, le Groupe utilise une méthode d’évaluation individuelle basée en général sur le montant le plus probable. Ces provisions son t classées sur des lignes dédiées dans la situation financière consolidée, afin de se conformer à leurs caractéristiques qualitatives. 2-J. Goodwill Les participations ne donnant pas le contrôle ( usuellement dénommées « intérêts minoritaires ») sont évaluées so it à la juste valeur (méthode dite du goodwill complet), soit à leur quote -part dans la juste valeur des actifs acquis et passifs repris (méthode dite du goodwill partiel). À ce jour Renault n’a enregistré que des goodwill évalués selon la méthode dite du goodwill partiel. L’option entre ces deux méthodes d’évaluation est exercée par le Groupe au cas par cas. Les goodwill font l’objet d’un test de dépréciation au minimum une fois par an, et dès qu’il existe un indice de perte de valeur. Après leur comptabi lisation initiale, les goodwill sont donc évalués à leur coût diminué du cumul des pertes de valeur éventuelles. Les goodwill relatifs à des entreprises associées et coentreprises sont inclus dans la valeur de ces participations à l’actif de la situation financière consolidée. En cas de perte de valeur, celle -ci est comptabilisée et intégrée au compte de',
649
  ]
650
  embeddings = model.encode(sentences)
651
  print(embeddings.shape)
652
- # [3, 1024]
653
 
654
  # Get the similarity scores for the embeddings
655
  similarities = model.similarity(embeddings, embeddings)
656
  print(similarities.shape)
657
- # [3, 3]
658
  ```
659
 
660
- <!--
661
- ### Direct Usage (Transformers)
662
-
663
- <details><summary>Click to see the direct usage in Transformers</summary>
664
-
665
- </details>
666
- -->
667
-
668
- <!--
669
- ### Downstream Usage (Sentence Transformers)
670
-
671
- You can finetune this model on your own dataset.
672
-
673
- <details><summary>Click to expand</summary>
674
-
675
- </details>
676
- -->
677
-
678
- <!--
679
- ### Out-of-Scope Use
680
-
681
- *List how the model may foreseeably be misused and address what users ought not to do with the model.*
682
- -->
683
-
684
- ## Evaluation
685
-
686
- ### Metrics
687
-
688
- #### Information Retrieval
689
 
690
- * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
691
 
692
- | Metric | Value |
693
- |:--------------------|:-----------|
694
- | cosine_accuracy@1 | 0.5856 |
695
- | cosine_accuracy@3 | 0.8164 |
696
- | cosine_accuracy@5 | 0.8776 |
697
- | cosine_accuracy@10 | 0.9454 |
698
- | cosine_precision@1 | 0.5856 |
699
- | cosine_precision@3 | 0.2721 |
700
- | cosine_precision@5 | 0.1755 |
701
- | cosine_precision@10 | 0.0945 |
702
- | cosine_recall@1 | 0.5856 |
703
- | cosine_recall@3 | 0.8164 |
704
- | cosine_recall@5 | 0.8776 |
705
- | cosine_recall@10 | 0.9454 |
706
- | cosine_ndcg@10 | 0.7694 |
707
- | cosine_mrr@10 | 0.7125 |
708
- | **cosine_map@100** | **0.7158** |
709
- | dot_accuracy@1 | 0.5856 |
710
- | dot_accuracy@3 | 0.8164 |
711
- | dot_accuracy@5 | 0.8776 |
712
- | dot_accuracy@10 | 0.9454 |
713
- | dot_precision@1 | 0.5856 |
714
- | dot_precision@3 | 0.2721 |
715
- | dot_precision@5 | 0.1755 |
716
- | dot_precision@10 | 0.0945 |
717
- | dot_recall@1 | 0.5856 |
718
- | dot_recall@3 | 0.8164 |
719
- | dot_recall@5 | 0.8776 |
720
- | dot_recall@10 | 0.9454 |
721
- | dot_ndcg@10 | 0.7694 |
722
- | dot_mrr@10 | 0.7125 |
723
- | dot_map@100 | 0.7158 |
724
 
725
- <!--
726
- ## Bias, Risks and Limitations
727
 
728
- *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
729
- -->
730
 
731
- <!--
732
- ### Recommendations
733
-
734
- *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
735
- -->
736
-
737
- ## Training Details
738
-
739
- ### Training Dataset
740
-
741
- #### Unnamed Dataset
742
-
743
-
744
- * Size: 28,864 training samples
745
- * Columns: <code>sentence_0</code> and <code>sentence_1</code>
746
- * Approximate statistics based on the first 1000 samples:
747
- | | sentence_0 | sentence_1 |
748
- |:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
749
- | type | string | string |
750
- | details | <ul><li>min: 14 tokens</li><li>mean: 27.25 tokens</li><li>max: 57 tokens</li></ul> | <ul><li>min: 34 tokens</li><li>mean: 428.69 tokens</li><li>max: 512 tokens</li></ul> |
751
- * Samples:
752
- | sentence_0 | sentence_1 |
753
- |:-------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
754
- | <code>Quel est le coefficient d'occupation pour le court et moyen-courrier en 2023, et quelle est la variation par rapport à 2022 ?</code> | <code>KLM Quatrième trimestre Annuel Total activité reseaux passage 2023 2022 variation 2023 2022 variation Passagers transportés (milliers) 7 7 1 1 6 3 3 7 22 % 3 0 3 3 2 2 5 8 3 8 17 % Passager kilomètre transporté (m de PKT) 2 2 9 4 6 2 1 2 3 6 8 % 9 2 6 5 2 8 2 2 8 9 13 % Siège kilomètre offert (m de SKO) 2 6 7 2 2 2 4 9 6 8 7 % 1 0 6 3 3 6 9 8 6 6 0 8 % Coefficient d’occupation (%) 86 % 85 % 1pt 87 % 83 % 4pt Long-courrier Passagers transportés (milliers) 2 3 8 1 2 2 9 4 4 % 9 6 5 9 8 6 2 6 12 % Passager kilomètre transporté (m de PKT) 1 8 4 9 1 1 7 7 9 3 4 % 7 4 8 8 5 6 6 9 3 9 12 % Siège kilomètre offert (m de SKO) 2 1 2 5 4 2 0 5 5 5 3 % 8 4 9 4 0 7 9 3 8 6 7 % Coefficient d’occupation (%) 87 % 87 % –pt 88 % 84 % 4pt Court et Moyen-courrier Passagers transportés (milliers) 5 3 3 0 4 0 4 3 32 % 2 0 6 7 3 1 7 2 1 2 20 % Passager kilomètre transporté (m de PKT) 4 4 5 6 3 4 4 3 29 % 1 7 7 6 6 1 5 3 5 0 16 % Siège kilomètre offert (m de SKO) 5 4 6 8 4 4 1 3 24 % 2 1 3 9 6 1 9 2 7 4 11 % Coefficient d’occupation (%) 81 % 78 % 3pt 83 % 80 % 3pt Activité Cargo Tonne kilomètre transportée (m de TKT) 862 828 4 % 3 2 4 4 3 3 3 0 (3 %) Tonne kilomètre offerte (m de TKO) 1 5 2 6 1 4 5 3 5 % 6 0 8 7 5 7 6 2 6 % Coefficient d’occupation (%) 56 % 57 % –pt 53 % 58 % (4)pt 24</code> |
755
- | <code>Quelles obligations peuvent justifier la constitution de provisions pour risques et charges ?</code> | <code>70 Rapport financier 2020 – 2021 de l’APE NOTE 17 PROVISIONS COURANTES ET NON COURANTES Principes comptables Les provisions sont comptabilisées lorsque les trois conditions suivantes sont simultanément remplies : • il existe une obligation actuelle (juridique ou implicite) vis-à-vis d’un tiers résultant d’un événement passé, antérieur à la date de clôture ; • il est probable qu’une sortie de ressources représentative d’avantages économiques sera nécessaire pour éteindre l’obligation ; • le coût de l’obligation peut être estimé de manière fiable. L’évaluation des provisions est faite sur la base des coûts attendus pour éteindre l’obligation. Les estimations sont déterminées à partir de données de gestion issues des systèmes d’information, d’hypothèses, éventuellement complétées par l’expérience de transactions similaires, et, dans certains cas, sur la base de rapports d’experts indépendants ou de devis de prestataires de chaque entité du périmètre de combinaison. Ces différentes hypothèses sont revues, par chaque entité, à l’occasion de chaque arrêté comptable. Les passifs éventuels, correspondant à une obligation qui n’est ni probable ni certaine à la date d’arrêté des comptes, ou à une obligation probable pour laquelle la sortie de ressources ne l’est pas, ne sont pas comptabilisés. Ils font l’objet d’une information en annexe. Les provisions pour démantèlement et reconstitution des sites Elles sont destinées à couvrir la valeur actuelle des coûts de remise en état des sites qui supportent ou ont supporté des ouvrages. Leur montant reflète la meilleure estimation des coûts futurs déterminés, en fonction des exigences réglementaires actuelles ou en cours d’adoption, de l'État des connaissances techniques ainsi que de l’expérience acquise. Elles sont constituées initialement en contrepartie d’un actif corporel qui est amorti sur la durée d’exploitation prévisible du site concerné. Les provisions sont actualisées en prenant en compte la date effective d’engagement des coûts. Le taux d’actualisation reflète les conditions d’un taux sans risque attaché à des obligations de même maturité, majoré de l’effet des risques spécifiques attachés au passif concerné. Dans tous les cas, l’effet des révisions d’estimations (calendrier de démantèlement, estimation des coûts à engager, etc.) conduit à modifier la valeur de l’actif, l’impact dans le montant de l’amortissement étant pris de manière prospective. Enfin, la valeur de l’actif ainsi modifié fait l’objet d’un test de perte de valeur. Les dotations et reprises de provision relèvent du résultat opérationnel. La charge de désactualisation figure en charges financières. Enfin, la valeur de l’actif fait l’objet d’un test de perte de valeur. Autres provisions Des provisions pour risques et charges sont constituées en vue de couvrir les obligations légales, juridiques ou implicites résultant d’événements passés pour lesquelles les entités de la combinaison prévoient qu’une sortie de ressources sera nécessaire. Tous les risques sont régulièrement examinés. Lorsqu’elles sont utilisées, les provisions sont reprises au compte de résultat et viennent en contrepartie des charges correspondantes.</code> |
756
- | <code>Quelle est la contribution des activités arrêtées au résultat net total ?</code> | <code>132 - 3 - 99 - 1 234 - 30 - 0 - 356 694 685 - - - 1 372 Résultat des activités arrêtées ou en cours de cession- - - - 180 - 7 - - 5 - 24 - 380 - - 212 Résultat net de l'ensemble combiné- 1 221 132 - 64 - 693 - 2 579 57 - 3 580 96 - 739 627 1 079 4 - 1 - 6 881 Part groupe- 1 221 132 - 64 - 707 - 2 232 57 - 3 164 96 - 739 627 1 072 4 - 1 - 6 138 Part intérêts minoritaires - - 0 - 1 14 - 347 - - 416 - - - 0 7 - - - 742</code> |
757
- * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
758
- ```json
759
- {
760
- "scale": 20.0,
761
- "similarity_fct": "cos_sim"
762
- }
763
- ```
764
 
765
  ### Training Hyperparameters
766
- #### Non-Default Hyperparameters
767
-
768
- - `eval_strategy`: steps
769
- - `per_device_train_batch_size`: 32
770
- - `per_device_eval_batch_size`: 32
771
- - `gradient_accumulation_steps`: 16
772
- - `num_train_epochs`: 20
773
- - `bf16`: True
774
- - `tf32`: True
775
- - `batch_sampler`: no_duplicates
776
- - `multi_dataset_batch_sampler`: round_robin
777
-
778
- #### All Hyperparameters
779
- <details><summary>Click to expand</summary>
780
-
781
- - `overwrite_output_dir`: False
782
- - `do_predict`: False
783
- - `eval_strategy`: steps
784
- - `prediction_loss_only`: True
785
- - `per_device_train_batch_size`: 32
786
- - `per_device_eval_batch_size`: 32
787
- - `per_gpu_train_batch_size`: None
788
- - `per_gpu_eval_batch_size`: None
789
- - `gradient_accumulation_steps`: 16
790
- - `eval_accumulation_steps`: None
791
- - `learning_rate`: 5e-05
792
- - `weight_decay`: 0.0
793
- - `adam_beta1`: 0.9
794
- - `adam_beta2`: 0.999
795
- - `adam_epsilon`: 1e-08
796
- - `max_grad_norm`: 1
797
- - `num_train_epochs`: 20
798
- - `max_steps`: -1
799
- - `lr_scheduler_type`: linear
800
- - `lr_scheduler_kwargs`: {}
801
- - `warmup_ratio`: 0.0
802
- - `warmup_steps`: 0
803
- - `log_level`: passive
804
- - `log_level_replica`: warning
805
- - `log_on_each_node`: True
806
- - `logging_nan_inf_filter`: True
807
- - `save_safetensors`: True
808
- - `save_on_each_node`: False
809
- - `save_only_model`: False
810
- - `restore_callback_states_from_checkpoint`: False
811
- - `no_cuda`: False
812
- - `use_cpu`: False
813
- - `use_mps_device`: False
814
- - `seed`: 42
815
- - `data_seed`: None
816
- - `jit_mode_eval`: False
817
- - `use_ipex`: False
818
- - `bf16`: True
819
- - `fp16`: False
820
- - `fp16_opt_level`: O1
821
- - `half_precision_backend`: auto
822
- - `bf16_full_eval`: False
823
- - `fp16_full_eval`: False
824
- - `tf32`: True
825
- - `local_rank`: 0
826
- - `ddp_backend`: None
827
- - `tpu_num_cores`: None
828
- - `tpu_metrics_debug`: False
829
- - `debug`: []
830
- - `dataloader_drop_last`: False
831
- - `dataloader_num_workers`: 0
832
- - `dataloader_prefetch_factor`: None
833
- - `past_index`: -1
834
- - `disable_tqdm`: False
835
- - `remove_unused_columns`: True
836
- - `label_names`: None
837
- - `load_best_model_at_end`: False
838
- - `ignore_data_skip`: False
839
- - `fsdp`: []
840
- - `fsdp_min_num_params`: 0
841
- - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
842
- - `fsdp_transformer_layer_cls_to_wrap`: None
843
- - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
844
- - `deepspeed`: None
845
- - `label_smoothing_factor`: 0.0
846
- - `optim`: adamw_torch
847
- - `optim_args`: None
848
- - `adafactor`: False
849
- - `group_by_length`: False
850
- - `length_column_name`: length
851
- - `ddp_find_unused_parameters`: None
852
- - `ddp_bucket_cap_mb`: None
853
- - `ddp_broadcast_buffers`: False
854
- - `dataloader_pin_memory`: True
855
- - `dataloader_persistent_workers`: False
856
- - `skip_memory_metrics`: True
857
- - `use_legacy_prediction_loop`: False
858
- - `push_to_hub`: False
859
- - `resume_from_checkpoint`: None
860
- - `hub_model_id`: None
861
- - `hub_strategy`: every_save
862
- - `hub_private_repo`: False
863
- - `hub_always_push`: False
864
- - `gradient_checkpointing`: False
865
- - `gradient_checkpointing_kwargs`: None
866
- - `include_inputs_for_metrics`: False
867
- - `eval_do_concat_batches`: True
868
- - `fp16_backend`: auto
869
- - `push_to_hub_model_id`: None
870
- - `push_to_hub_organization`: None
871
- - `mp_parameters`:
872
- - `auto_find_batch_size`: False
873
- - `full_determinism`: False
874
- - `torchdynamo`: None
875
- - `ray_scope`: last
876
- - `ddp_timeout`: 1800
877
- - `torch_compile`: False
878
- - `torch_compile_backend`: None
879
- - `torch_compile_mode`: None
880
- - `dispatch_batches`: None
881
- - `split_batches`: None
882
- - `include_tokens_per_second`: False
883
- - `include_num_input_tokens_seen`: False
884
- - `neftune_noise_alpha`: None
885
- - `optim_target_modules`: None
886
- - `batch_eval_metrics`: False
887
- - `eval_on_start`: False
888
- - `batch_sampler`: no_duplicates
889
- - `multi_dataset_batch_sampler`: round_robin
890
-
891
- </details>
892
-
893
- ### Training Logs
894
- | Epoch | Step | cosine_map@100 |
895
- |:------:|:----:|:--------------:|
896
- | 0.1774 | 10 | 0.5951 |
897
- | 0.3548 | 20 | 0.6117 |
898
- | 0.5322 | 30 | 0.6312 |
899
- | 0.7095 | 40 | 0.6493 |
900
- | 0.8869 | 50 | 0.6639 |
901
- | 0.9933 | 56 | 0.6686 |
902
- | 1.0643 | 60 | 0.6739 |
903
- | 1.2417 | 70 | 0.6840 |
904
- | 1.4191 | 80 | 0.6881 |
905
- | 1.5965 | 90 | 0.6900 |
906
- | 1.7738 | 100 | 0.6910 |
907
- | 1.9512 | 110 | 0.6960 |
908
- | 1.9867 | 112 | 0.6985 |
909
- | 2.1286 | 120 | 0.7020 |
910
- | 2.3060 | 130 | 0.7056 |
911
- | 2.4834 | 140 | 0.6988 |
912
- | 2.6608 | 150 | 0.7051 |
913
- | 2.8381 | 160 | 0.6994 |
914
- | 2.9978 | 169 | 0.6999 |
915
- | 3.0155 | 170 | 0.7004 |
916
- | 3.1929 | 180 | 0.7058 |
917
- | 3.3703 | 190 | 0.7030 |
918
- | 3.5477 | 200 | 0.7042 |
919
- | 3.7251 | 210 | 0.6989 |
920
- | 3.9024 | 220 | 0.6970 |
921
- | 3.9911 | 225 | 0.6960 |
922
- | 4.0798 | 230 | 0.6968 |
923
- | 4.2572 | 240 | 0.7067 |
924
- | 4.4346 | 250 | 0.7158 |
925
 
 
 
 
 
 
 
 
 
 
 
 
 
 
926
 
927
  ### Framework Versions
 
928
  - Python: 3.10.13
929
  - Sentence Transformers: 3.0.1
930
  - Transformers: 4.42.3
@@ -933,49 +78,27 @@ You can finetune this model on your own dataset.
933
  - Datasets: 2.20.0
934
  - Tokenizers: 0.19.1
935
 
936
- ## Citation
937
 
938
- ### BibTeX
939
 
940
- #### Sentence Transformers
941
- ```bibtex
942
- @inproceedings{reimers-2019-sentence-bert,
943
- title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
944
- author = "Reimers, Nils and Gurevych, Iryna",
945
- booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
946
- month = "11",
947
- year = "2019",
948
- publisher = "Association for Computational Linguistics",
949
- url = "https://arxiv.org/abs/1908.10084",
950
- }
951
- ```
952
 
953
- #### MultipleNegativesRankingLoss
954
- ```bibtex
955
- @misc{henderson2017efficient,
956
- title={Efficient Natural Language Response Suggestion for Smart Reply},
957
- author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
958
- year={2017},
959
- eprint={1705.00652},
960
- archivePrefix={arXiv},
961
- primaryClass={cs.CL}
962
- }
963
- ```
964
-
965
- <!--
966
- ## Glossary
967
 
968
- *Clearly define terms in order to be accessible across audiences.*
969
- -->
970
 
971
- <!--
972
- ## Model Card Authors
973
 
974
- *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
975
- -->
 
 
 
 
 
 
976
 
977
- <!--
978
- ## Model Card Contact
979
 
980
- *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
981
- -->
 
1
+ # Model Card: sujet-ai/Marsilia-Embeddings-FR-Large 🚀
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
2
 
3
+ ## Introduction 🌟
4
 
5
+ Marsilia-Embeddings-FR-Large is a state-of-the-art French language embedding model specifically designed for financial domain tasks. This model serves as a proof of concept, demonstrating the critical importance of fine-tuning embedding models for specific tasks in Retrieval-Augmented Generation (RAG) applications.
6
 
7
+ By focusing on the financial domain, Marsilia-Embeddings-FR-Large achieves performance that surpasses even closed-source models like OpenAI's embeddings, while offering a more cost-effective solution. This showcases how targeted fine-tuning can dramatically enhance the capabilities of open-source models, making them competitive with or even superior to proprietary alternatives in specialized domains.
8
 
9
+ ## Model Details 📊
10
+
11
+ - **Model Name:** Marsilia-Embeddings-FR-Large
12
+ - **Model Type:** Sentence Embedding Model
13
+ - **Language:** French 🇫🇷
14
+ - **Base Model:** [OrdalieTech/Solon-embeddings-large-0.1](https://huggingface.co/OrdalieTech/Solon-embeddings-large-0.1)
15
  - **Maximum Sequence Length:** 512 tokens
16
+ - **Output Dimensionality:** 1024
17
  - **Similarity Function:** Cosine Similarity
 
 
 
 
 
 
 
 
 
18
 
19
+ ## Usage 💻
 
 
 
 
 
 
 
 
20
 
21
+ To use this model with the Sentence Transformers library:
22
 
 
 
 
 
 
 
 
 
 
23
  ```python
24
  from sentence_transformers import SentenceTransformer
25
 
26
  # Download from the 🤗 Hub
27
  model = SentenceTransformer("sujet-ai/Marsilia-Embeddings-FR-Large")
28
+
29
  # Run inference
30
  sentences = [
31
+ 'Quelles mesures à caractère non strictement comptable sont mentionnées dans le rapport financier de Vivendi ?',
32
+ "mercredi 8 mars 2023 Rapport financier et États financiers consolidés audités de l'exercice clos le 31 décembre 2022 Vivendi / 6 I- Rapport financier de l'exercice 2022 Notes préliminaires : Le 6 mars 2023, le présent rapport financier et les états financiers consolidés audités de l'exercice clos le 31 décembre 2022 ont été arrêtés par le Directoire. Après avis du Comité d'audit qui s'est réuni le 6 mars 2023, le Conseil de surveillance du 8 mars 2023 a exa miné le rapport financier et les états financiers consolidés audités de l'exercice clos le 31 décembre 2022, tels qu'arrêtés par le Directoire du 6 mars 2023. Les états financiers consolidés de l'exercice clos le 31 décembre 2022 sont audités et certifiés sans réserve par les Commissai res aux comptes. Leur rapport sur la certification des états financiers consolidés est présenté en préambule des états financiers.",
 
33
  ]
34
  embeddings = model.encode(sentences)
35
  print(embeddings.shape)
36
+ # [2, 1024]
37
 
38
  # Get the similarity scores for the embeddings
39
  similarities = model.similarity(embeddings, embeddings)
40
  print(similarities.shape)
 
41
  ```
42
 
43
+ ## Intended Use 🎯
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
44
 
45
+ This model is designed for generating sentence embeddings for French text, particularly in the financial domain. It can be used for various natural language processing tasks such as semantic search, clustering, and information retrieval.
46
 
47
+ ## Training Data 📚
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
48
 
49
+ The model was fine-tuned on the [sujet-ai/Sujet-Financial-RAG-FR-Dataset](https://huggingface.co/datasets/sujet-ai/Sujet-Financial-RAG-FR-Dataset). This dataset consists of question-context pairs in French, focusing on financial topics.
 
50
 
51
+ - **Training Set Size:** 28,864 samples
 
52
 
53
+ ## Training Procedure 🛠️
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
54
 
55
  ### Training Hyperparameters
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
56
 
57
+ - **Loss Function:** MultipleNegativesRankingLoss
58
+ - Scale: 20.0
59
+ - Similarity Function: Cosine Similarity
60
+ - **Evaluation Strategy:** Steps
61
+ - **Per Device Train Batch Size:** 32
62
+ - **Gradient Accumulation Steps:** 16
63
+ - **Per Device Eval Batch Size:** 16
64
+ - **TF32:** True
65
+ - **BF16:** True
66
+ - **Number of Train Epochs:** 5
67
+ - **Batch Sampler:** no_duplicates
68
+ - **Multi Dataset Batch Sampler:** round_robin
69
+ - **Scheduler:** warmupcosine
70
 
71
  ### Framework Versions
72
+
73
  - Python: 3.10.13
74
  - Sentence Transformers: 3.0.1
75
  - Transformers: 4.42.3
 
78
  - Datasets: 2.20.0
79
  - Tokenizers: 0.19.1
80
 
81
+ ## Evaluation 📈
82
 
83
+ The model was evaluated using the `InformationRetrievalEvaluator` on the test split of the sujet-ai/Sujet-Financial-RAG-FR-Dataset. Specific evaluation metrics are not provided in the given information.
84
 
85
+ ## Limitations ⚠️
 
 
 
 
 
 
 
 
 
 
 
86
 
87
+ The model is specifically trained on French financial texts and may not perform optimally on other domains or languages. Users should be aware of potential biases present in the training data.
 
 
 
 
 
 
 
 
 
 
 
 
 
88
 
89
+ ## Citation 📄
 
90
 
91
+ If you use this model in your research, please cite:
 
92
 
93
+ ```bibtex
94
+ @software{Marsilia-Embeddings-FR-Large,
95
+ author = {Sujet AI and Allaa Boutaleb and Hamed Rahimi},
96
+ title = {Marsilia-Embeddings-FR-Large: A fine-tuned French embedding model for financial texts},
97
+ year = {2024},
98
+ url = {https://huggingface.co/sujet-ai/Marsilia-Embeddings-FR-Large}
99
+ }
100
+ ```
101
 
102
+ ## Contact Information 📧
 
103
 
104
+ For questions, feedback, or collaborations, please reach out to us on [LinkedIn](https://www.linkedin.com/company/sujet-ai/) or visit our website [https://sujet.ai](https://sujet.ai).