{ | |
"additional_special_tokens": [ | |
"<|startoftranscript|>", | |
"<|en|>", | |
"<|zh|>", | |
"<|de|>", | |
"<|es|>", | |
"<|ru|>", | |
"<|ko|>", | |
"<|fr|>", | |
"<|ja|>", | |
"<|pt|>", | |
"<|tr|>", | |
"<|pl|>", | |
"<|ca|>", | |
"<|nl|>", | |
"<|ar|>", | |
"<|sv|>", | |
"<|it|>", | |
"<|id|>", | |
"<|hi|>", | |
"<|fi|>", | |
"<|vi|>", | |
"<|iw|>", | |
"<|uk|>", | |
"<|el|>", | |
"<|ms|>", | |
"<|cs|>", | |
"<|ro|>", | |
"<|da|>", | |
"<|hu|>", | |
"<|ta|>", | |
"<|no|>", | |
"<|th|>", | |
"<|ur|>", | |
"<|hr|>", | |
"<|bg|>", | |
"<|lt|>", | |
"<|la|>", | |
"<|mi|>", | |
"<|ml|>", | |
"<|cy|>", | |
"<|sk|>", | |
"<|te|>", | |
"<|fa|>", | |
"<|lv|>", | |
"<|bn|>", | |
"<|sr|>", | |
"<|az|>", | |
"<|sl|>", | |
"<|kn|>", | |
"<|et|>", | |
"<|mk|>", | |
"<|br|>", | |
"<|eu|>", | |
"<|is|>", | |
"<|hy|>", | |
"<|ne|>", | |
"<|mn|>", | |
"<|bs|>", | |
"<|kk|>", | |
"<|sq|>", | |
"<|sw|>", | |
"<|gl|>", | |
"<|mr|>", | |
"<|pa|>", | |
"<|si|>", | |
"<|km|>", | |
"<|sn|>", | |
"<|yo|>", | |
"<|so|>", | |
"<|af|>", | |
"<|oc|>", | |
"<|ka|>", | |
"<|be|>", | |
"<|tg|>", | |
"<|sd|>", | |
"<|gu|>", | |
"<|am|>", | |
"<|yi|>", | |
"<|lo|>", | |
"<|uz|>", | |
"<|fo|>", | |
"<|ht|>", | |
"<|ps|>", | |
"<|tk|>", | |
"<|nn|>", | |
"<|mt|>", | |
"<|sa|>", | |
"<|lb|>", | |
"<|my|>", | |
"<|bo|>", | |
"<|tl|>", | |
"<|mg|>", | |
"<|as|>", | |
"<|tt|>", | |
"<|haw|>", | |
"<|ln|>", | |
"<|ha|>", | |
"<|ba|>", | |
"<|jw|>", | |
"<|su|>", | |
"<|translate|>", | |
"<|transcribe|>", | |
"<|startoflm|>", | |
"<|startofprev|>", | |
"<|nocaptions|>", | |
"<|notimestamps|>" | |
], | |
"bos_token": { | |
"content": "<|endoftext|>", | |
"lstrip": false, | |
"normalized": true, | |
"rstrip": false, | |
"single_word": false | |
}, | |
"eos_token": { | |
"content": "<|endoftext|>", | |
"lstrip": false, | |
"normalized": false, | |
"rstrip": false, | |
"single_word": false | |
}, | |
"pad_token": { | |
"content": "<|endoftext|>", | |
"lstrip": false, | |
"normalized": false, | |
"rstrip": false, | |
"single_word": false | |
}, | |
"unk_token": { | |
"content": "<|endoftext|>", | |
"lstrip": false, | |
"normalized": false, | |
"rstrip": false, | |
"single_word": false | |
} | |
} | |