File size: 1,755 Bytes
dd9b3ed
 
 
 
 
 
 
 
 
 
 
 
b4fdbc0
 
 
 
 
 
 
 
 
 
 
 
 
dd9b3ed
 
b4fdbc0
 
 
 
 
 
 
 
 
dd9b3ed
 
 
 
 
 
 
 
87ce977
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
import gradio as gr
from gec_model import GecBERTModel

title = "Vietnamese Capitalization and Punctuation recovering"
description = "Auto capitalize and punctuations for plain, lowercase Vietnamese text."
article = "Coming soon"

examples = [
  ["viBERT", "theo đó thủ tướng dự kiến tiếp bộ trưởng nông nghiệp mỹ tom wilsack bộ trưởng thương mại mỹ gina raimondo bộ trưởng tài chính janet yellen gặp gỡ thượng nghị sĩ patrick leahy và một số nghị sĩ mỹ khác"],
  ["viBERT", "những gói cước năm g mobifone sẽ mang đến cho bạn những trải nghiệm mới lạ trên cả tuyệt vời so với mạng bốn g thì tốc độ truy cập mạng năm g mobifone được nhận định là siêu đỉnh với mức truy cập nhanh gấp 10 lần"],
]

model_kwargs = {
    "max_len": 64,
    "min_len": 3,
    "iterations": 3,
    "min_error_probability": 0.2,
    "lowercase_tokens": False,
    "log": False,
    "confidence": 0,
    "split_chunk": True,
    "chunk_size": 48,
    "overlap_size": 16,
    "min_words_cut": 8
}
model_dict = {
    "viBERT": GecBERTModel(
        vocab_path="vocabulary",
        model_paths='dragonSwing/vibert-capu',
        **model_kwargs
    ),
    "XLM-RoBERTa-base": GecBERTModel(
        vocab_path="vocabulary",
        model_paths='dragonSwing/xlm-roberta-capu',
        **model_kwargs
    ),
}

def fn(model_choice, input):
    if model_choice in model_dict:
        return model_dict[model_choice](input)[0]
    else:
        return "Unsupported model"

gr.Interface(fn, [gr.inputs.Dropdown(list(model_dict.keys())), gr.inputs.Textbox(lines=5)], "text", examples=examples, title=title, description=description, article=article).launch()