File size: 3,077 Bytes
94c274b
 
 
 
 
 
 
 
 
 
c8cc451
94c274b
 
 
 
 
 
 
c8cc451
 
 
94c274b
 
c8cc451
 
94c274b
c8cc451
94c274b
 
 
 
 
 
 
 
 
 
 
c8cc451
 
 
 
 
 
 
 
 
 
 
 
 
94c274b
c8cc451
94c274b
c8cc451
 
 
 
 
 
 
 
94c274b
 
 
 
0d11952
94c274b
 
 
 
0d11952
94c274b
 
0d11952
 
 
 
 
c8cc451
 
94c274b
c8cc451
0d11952
c8cc451
0d11952
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
---
language:
- ar
metrics:
- Accuracy
library_name: transformers
pipeline_tag: text2text-generation
tags:
- t5
- text2text-generation
- text2text
- Classification and Generation
- Classification
- Generation
- ArabicT5
- Text Classification
- Text2Text Generation
widget:
- example_title: الرياضة
- text: |
    عصام عبدالفتاح: الاتحاد لا يستحق ركلة جزاء أمام النصر
---

# # ArabicT5 Model for Arabic News Classification and Generation 
  - In this model focus on classifying and generating news Arabic.

# # The number in the generated text represents the category of the news, as shown below:
  category_mapping = {
  
      'Political':1,
      'Economy':2,
      'Health':3,
      'Sport':4,
      'Culture':5,
      'Technology':6,
      'Art':7,
      'Accidents':8
  }
  
# # Training parameters

|                       |              |
| :-------------------: | :-----------:|
|  Training batch size  |     `8`      |
| Evaluation batch size |     `8`      |
|     Learning rate     |    `1e-4`    |
|    Max length input   |     `64`     |
|   Max length target   |    `200`     |
|     Number workers    |     `4`      |
|         Epoch         |     `5`      |
|                       |              |

# # Results

|                         |               |
| :---------------------: | :-----------: | 
|    Training Loss        |    `3.20`     |   
| Classification Accuracy |   `95.7%`    | 
|   Generation Accuracy   |   `88.87%`    |
|                         |               |

# # Example usage
```python

from transformers import T5ForConditionalGeneration, T5Tokenizer, pipeline

model_name = "Hezam/ArabicT5-49GB-small-classification-generation"
model = T5ForConditionalGeneration.from_pretrained(model_name)
tokenizer = T5Tokenizer.from_pretrained(model_name)
generation_pipeline = pipeline("text2text-generation",model=model,tokenizer=tokenizer)

text = " خسارة مدوية لليفربول امام تولوز وفوز كبير لبيتيس"

output= generation_pipeline(text,
                    num_beams=10,
                    max_length=200,
                    top_p=0.9,
                    repetition_penalty = 3.0,
                    no_repeat_ngram_size = 3)[0]["generated_text"]

output

```
category: 4 article: كتبت لبني عبد الله خسر فريق ليفربول بقياده البرتغالي جوسفالدو فيريرا نظيره تولوز بهدف نظيف ضمن منافسات الجوله ال عمر مسابقه الدوري الانجليزي الممتاز بهدفين مقابل هدف المباراه جمعتهما اليوم الاحد استاد
```bash
category: 4 article: كتبت لبني عبد الله خسر فريق ليفربول بقياده البرتغالي جوسفالدو فيريرا نظيره تولوز بهدف نظيف ضمن منافسات الجوله ال عمر مسابقه الدوري الانجليزي الممتاز بهدفين مقابل هدف المباراه جمعتهما اليوم الاحد استاد```