Update README.md
Browse files
README.md
CHANGED
@@ -3,14 +3,12 @@ language:
|
|
3 |
- ar
|
4 |
metrics:
|
5 |
- Accuracy
|
6 |
-
- F1_score
|
7 |
-
- BLEU
|
8 |
library_name: transformers
|
9 |
pipeline_tag: text2text-generation
|
10 |
tags:
|
11 |
- t5
|
12 |
- text2text-generation
|
13 |
-
-
|
14 |
- Classification and Generation
|
15 |
- Classification
|
16 |
- Generation
|
@@ -18,15 +16,15 @@ tags:
|
|
18 |
- Text Classification
|
19 |
- Text2Text Generation
|
20 |
widget:
|
21 |
-
- example_title:
|
22 |
-
- text:
|
23 |
-
|
24 |
---
|
25 |
|
26 |
-
# ArabicT5
|
27 |
-
-
|
28 |
|
29 |
-
# The number in the generated text represents the category of the news, as shown below:
|
30 |
category_mapping = {
|
31 |
|
32 |
'Political':1,
|
@@ -38,25 +36,52 @@ widget:
|
|
38 |
'Art':7,
|
39 |
'Accidents':8
|
40 |
}
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
41 |
|
|
|
42 |
|
43 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
44 |
```python
|
45 |
|
46 |
from transformers import T5ForConditionalGeneration, T5Tokenizer, pipeline
|
47 |
|
48 |
-
model_name="Hezam/ArabicT5-news-classification-generation
|
49 |
model = T5ForConditionalGeneration.from_pretrained(model_name)
|
50 |
tokenizer = T5Tokenizer.from_pretrained(model_name)
|
51 |
generation_pipeline = pipeline("text2text-generation",model=model,tokenizer=tokenizer)
|
52 |
|
53 |
-
text = "
|
54 |
|
55 |
output= generation_pipeline(text,
|
56 |
-
|
57 |
-
|
58 |
-
|
59 |
-
|
60 |
-
|
|
|
|
|
61 |
|
62 |
-
|
|
|
|
|
|
|
|
|
|
3 |
- ar
|
4 |
metrics:
|
5 |
- Accuracy
|
|
|
|
|
6 |
library_name: transformers
|
7 |
pipeline_tag: text2text-generation
|
8 |
tags:
|
9 |
- t5
|
10 |
- text2text-generation
|
11 |
+
- text2text
|
12 |
- Classification and Generation
|
13 |
- Classification
|
14 |
- Generation
|
|
|
16 |
- Text Classification
|
17 |
- Text2Text Generation
|
18 |
widget:
|
19 |
+
- example_title: الرياضة
|
20 |
+
- text: |
|
21 |
+
عصام عبدالفتاح: الاتحاد لا يستحق ركلة جزاء أمام النصر
|
22 |
---
|
23 |
|
24 |
+
# # ArabicT5 Model for Arabic News Classification and Generation
|
25 |
+
- In this model focus on classifying and generating news Arabic.
|
26 |
|
27 |
+
# # The number in the generated text represents the category of the news, as shown below:
|
28 |
category_mapping = {
|
29 |
|
30 |
'Political':1,
|
|
|
36 |
'Art':7,
|
37 |
'Accidents':8
|
38 |
}
|
39 |
+
|
40 |
+
# # Training parameters
|
41 |
+
|
42 |
+
| | |
|
43 |
+
| :-------------------: | :-----------:|
|
44 |
+
| Training batch size | `8` |
|
45 |
+
| Evaluation batch size | `8` |
|
46 |
+
| Learning rate | `1e-4` |
|
47 |
+
| Max length input | `64` |
|
48 |
+
| Max length target | `200` |
|
49 |
+
| Number workers | `4` |
|
50 |
+
| Epoch | `5` |
|
51 |
+
| | |
|
52 |
|
53 |
+
# # Results
|
54 |
|
55 |
+
| | |
|
56 |
+
| :---------------------: | :-----------: |
|
57 |
+
| Training Loss | `3.20` |
|
58 |
+
| Classification Accuracy | `95.7%` |
|
59 |
+
| Generation Accuracy | `88.87%` |
|
60 |
+
| | |
|
61 |
+
|
62 |
+
# # Example usage
|
63 |
```python
|
64 |
|
65 |
from transformers import T5ForConditionalGeneration, T5Tokenizer, pipeline
|
66 |
|
67 |
+
model_name="Hezam/ArabicT5-news-classification-generation"
|
68 |
model = T5ForConditionalGeneration.from_pretrained(model_name)
|
69 |
tokenizer = T5Tokenizer.from_pretrained(model_name)
|
70 |
generation_pipeline = pipeline("text2text-generation",model=model,tokenizer=tokenizer)
|
71 |
|
72 |
+
text = "عصام عبدالفتاح: الاتحاد لا يستحق ركلة جزاء أمام النصر"
|
73 |
|
74 |
output= generation_pipeline(text,
|
75 |
+
num_beams=4,
|
76 |
+
max_length=512,
|
77 |
+
top_p=0.9,
|
78 |
+
repetition_penalty = 3.0,
|
79 |
+
no_repeat_ngram_size = 3)[0]["generated_text"]
|
80 |
+
|
81 |
+
output
|
82 |
|
83 |
+
```
|
84 |
+
4 كتب حسام الحاج قال عصام عبدالفتاح المدير الفني لفريق الاتحاد السكندري فريقه يستحق ركله جزاء في المباراه التي تجمع الفريقين اليوم السبت باستاد القاهره الدولي ضمن منافسات الجوله ال عمر مسابقه الدوري المصري الممتاز وقال عصام عبدالفتاح خلال مداخله هاتفيه لبرنامج بوكس تو بوكس يقدمه الاعلامي محمد شبانه قناه اون تايم سبورتس مباراه الاهلي والزمالك انتهت بالتعادل الايجابي بهدف لكل فريق واضاف المدرب العام للفريق الاول لكره القدم بالنادي الاهلي الفريق حقق فوزا كبيرا نظيره النصر بهدفين مقابل هدف المبار
|
85 |
+
```bash
|
86 |
+
4 كتب حسام الحاج قال عصام عبدالفتاح المدير الفني لفريق الاتحاد السكندري فريقه يستحق ركله جزاء في المباراه التي تجمع الفريقين اليوم السبت باستاد القاهره الدولي ضمن منافسات الجوله ال عمر مسابقه الدوري المصري الممتاز وقال عصام عبدالفتاح خلال مداخله هاتفيه لبرنامج بوكس تو بوكس يقدمه الاعلامي محمد شبانه قناه اون تايم سبورتس مباراه الاهلي والزمالك انتهت بالتعادل الايجابي بهدف لكل فريق واضاف المدرب العام للفريق الاول لكره القدم بالنادي الاهلي الفريق حقق فوزا كبيرا نظيره النصر بهدفين مقابل هدف المبار
|
87 |
+
```
|