Hezam commited on
Commit
c8cc451
1 Parent(s): f04ee31

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +43 -18
README.md CHANGED
@@ -3,14 +3,12 @@ language:
3
  - ar
4
  metrics:
5
  - Accuracy
6
- - F1_score
7
- - BLEU
8
  library_name: transformers
9
  pipeline_tag: text2text-generation
10
  tags:
11
  - t5
12
  - text2text-generation
13
- - seq2seq
14
  - Classification and Generation
15
  - Classification
16
  - Generation
@@ -18,15 +16,15 @@ tags:
18
  - Text Classification
19
  - Text2Text Generation
20
  widget:
21
- - example_title: "الرياضة"
22
- - text: >
23
- خسارة مدوية لليفربول امام تولوز وفوز كبير لبيتيس
24
  ---
25
 
26
- # ArabicT5: Classification and Generation of Arabic News
27
- - The model is under trial
28
 
29
- # The number in the generated text represents the category of the news, as shown below:
30
  category_mapping = {
31
 
32
  'Political':1,
@@ -38,25 +36,52 @@ widget:
38
  'Art':7,
39
  'Accidents':8
40
  }
 
 
 
 
 
 
 
 
 
 
 
 
 
41
 
 
42
 
43
- # Example usage
 
 
 
 
 
 
 
44
  ```python
45
 
46
  from transformers import T5ForConditionalGeneration, T5Tokenizer, pipeline
47
 
48
- model_name="Hezam/ArabicT5-news-classification-generation-45GB-base"
49
  model = T5ForConditionalGeneration.from_pretrained(model_name)
50
  tokenizer = T5Tokenizer.from_pretrained(model_name)
51
  generation_pipeline = pipeline("text2text-generation",model=model,tokenizer=tokenizer)
52
 
53
- text = " خسارة مدوية لليفربول امام تولوز وفوز كبير لبيتيس"
54
 
55
  output= generation_pipeline(text,
56
- num_beams=10,
57
- max_length=512,
58
- top_p=0.9,
59
- repetition_penalty = 3.0,
60
- no_repeat_ngram_size = 3)[0]["generated_text"]
 
 
61
 
62
- print(output)
 
 
 
 
 
3
  - ar
4
  metrics:
5
  - Accuracy
 
 
6
  library_name: transformers
7
  pipeline_tag: text2text-generation
8
  tags:
9
  - t5
10
  - text2text-generation
11
+ - text2text
12
  - Classification and Generation
13
  - Classification
14
  - Generation
 
16
  - Text Classification
17
  - Text2Text Generation
18
  widget:
19
+ - example_title: الرياضة
20
+ - text: |
21
+ عصام عبدالفتاح: الاتحاد لا يستحق ركلة جزاء أمام النصر
22
  ---
23
 
24
+ # # ArabicT5 Model for Arabic News Classification and Generation
25
+ - In this model focus on classifying and generating news Arabic.
26
 
27
+ # # The number in the generated text represents the category of the news, as shown below:
28
  category_mapping = {
29
 
30
  'Political':1,
 
36
  'Art':7,
37
  'Accidents':8
38
  }
39
+
40
+ # # Training parameters
41
+
42
+ | | |
43
+ | :-------------------: | :-----------:|
44
+ | Training batch size | `8` |
45
+ | Evaluation batch size | `8` |
46
+ | Learning rate | `1e-4` |
47
+ | Max length input | `64` |
48
+ | Max length target | `200` |
49
+ | Number workers | `4` |
50
+ | Epoch | `5` |
51
+ | | |
52
 
53
+ # # Results
54
 
55
+ | | |
56
+ | :---------------------: | :-----------: |
57
+ | Training Loss | `3.20` |
58
+ | Classification Accuracy | `95.7%` |
59
+ | Generation Accuracy | `88.87%` |
60
+ | | |
61
+
62
+ # # Example usage
63
  ```python
64
 
65
  from transformers import T5ForConditionalGeneration, T5Tokenizer, pipeline
66
 
67
+ model_name="Hezam/ArabicT5-news-classification-generation"
68
  model = T5ForConditionalGeneration.from_pretrained(model_name)
69
  tokenizer = T5Tokenizer.from_pretrained(model_name)
70
  generation_pipeline = pipeline("text2text-generation",model=model,tokenizer=tokenizer)
71
 
72
+ text = "عصام عبدالفتاح: الاتحاد لا يستحق ركلة جزاء أمام النصر"
73
 
74
  output= generation_pipeline(text,
75
+ num_beams=4,
76
+ max_length=512,
77
+ top_p=0.9,
78
+ repetition_penalty = 3.0,
79
+ no_repeat_ngram_size = 3)[0]["generated_text"]
80
+
81
+ output
82
 
83
+ ```
84
+ 4 كتب حسام الحاج قال عصام عبدالفتاح المدير الفني لفريق الاتحاد السكندري فريقه يستحق ركله جزاء في المباراه التي تجمع الفريقين اليوم السبت باستاد القاهره الدولي ضمن منافسات الجوله ال عمر مسابقه الدوري المصري الممتاز وقال عصام عبدالفتاح خلال مداخله هاتفيه لبرنامج بوكس تو بوكس يقدمه الاعلامي محمد شبانه قناه اون تايم سبورتس مباراه الاهلي والزمالك انتهت بالتعادل الايجابي بهدف لكل فريق واضاف المدرب العام للفريق الاول لكره القدم بالنادي الاهلي الفريق حقق فوزا كبيرا نظيره النصر بهدفين مقابل هدف المبار
85
+ ```bash
86
+ 4 كتب حسام الحاج قال عصام عبدالفتاح المدير الفني لفريق الاتحاد السكندري فريقه يستحق ركله جزاء في المباراه التي تجمع الفريقين اليوم السبت باستاد القاهره الدولي ضمن منافسات الجوله ال عمر مسابقه الدوري المصري الممتاز وقال عصام عبدالفتاح خلال مداخله هاتفيه لبرنامج بوكس تو بوكس يقدمه الاعلامي محمد شبانه قناه اون تايم سبورتس مباراه الاهلي والزمالك انتهت بالتعادل الايجابي بهدف لكل فريق واضاف المدرب العام للفريق الاول لكره القدم بالنادي الاهلي الفريق حقق فوزا كبيرا نظيره النصر بهدفين مقابل هدف المبار
87
+ ```