BramVanroy's picture
Update README.md
c1634ad
metadata
datasets:
  - BramVanroy/hebban-reviews
language:
  - nl
license: mit
metrics:
  - accuracy
  - f1
  - precision
  - qwk
  - recall
model-index:
  - name: xlm-roberta-base-hebban-reviews
    results:
      - dataset:
          config: filtered_sentiment
          name: BramVanroy/hebban-reviews - filtered_sentiment - 2.0.0
          revision: 2.0.0
          split: test
          type: BramVanroy/hebban-reviews
        metrics:
          - name: Test accuracy
            type: accuracy
            value: 0.8094674556213017
          - name: Test f1
            type: f1
            value: 0.812677483587223
          - name: Test precision
            type: precision
            value: 0.8173602585519025
          - name: Test qwk
            type: qwk
            value: 0.7369243423166991
          - name: Test recall
            type: recall
            value: 0.8094674556213017
        task:
          name: sentiment analysis
          type: text-classification
tags:
  - sentiment-analysis
  - dutch
  - text
widget:
  - text: Wauw, wat een leuk boek! Ik heb me er er goed mee vermaakt.
  - text: >-
      Nee, deze vond ik niet goed. De auteur doet zijn best om je als lezer mee
      te trekken in het verhaal maar mij overtuigt het alleszins niet.
  - text: >-
      Ik vind het niet slecht maar de schrijfstijl trekt me ook niet echt aan.
      Het wordt een beetje saai vanaf het vijfde hoofdstuk

xlm-roberta-base-hebban-reviews

Dataset

  • dataset_name: BramVanroy/hebban-reviews
  • dataset_config: filtered_sentiment
  • dataset_revision: 2.0.0
  • labelcolumn: review_sentiment
  • textcolumn: review_text_without_quotes

Training

  • optim: adamw_hf
  • learning_rate: 5e-05
  • per_device_train_batch_size: 64
  • per_device_eval_batch_size: 64
  • gradient_accumulation_steps: 1
  • max_steps: 5001
  • save_steps: 500
  • metric_for_best_model: qwk

Best checkedpoint based on validation

  • best_metric: 0.741533273748008
  • best_model_checkpoint: trained/hebban-reviews/xlm-roberta-base/checkpoint-2000

Test results of best checkpoint

  • accuracy: 0.8094674556213017
  • f1: 0.812677483587223
  • precision: 0.8173602585519025
  • qwk: 0.7369243423166991
  • recall: 0.8094674556213017

Confusion matrix

cfm

Normalized confusion matrix

norm cfm

Environment

  • cuda_capabilities: 8.0; 8.0
  • cuda_device_count: 2
  • cuda_devices: NVIDIA A100-SXM4-80GB; NVIDIA A100-SXM4-80GB
  • finetuner_commit: 66294c815326c93682003119534cb72009f558c2
  • platform: Linux-4.18.0-305.49.1.el8_4.x86_64-x86_64-with-glibc2.28
  • python_version: 3.9.5
  • toch_version: 1.10.0
  • transformers_version: 4.21.0