glm-roberta-large-finetune / tokenizer_config.json

Training in progress, epoch 1

4cd4737 almost 2 years ago

1.43 kB

	{
	"add_prefix_space": false,
	"additional_special_tokens": [
	"<\|startofpiece\|>",
	"<\|endofpiece\|>"
	],
	"bos_token": {
	"__type": "AddedToken",
	"content": "<s>",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false
	},
	"cls_token": {
	"__type": "AddedToken",
	"content": "<s>",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false
	},
	"eos_token": {
	"__type": "AddedToken",
	"content": "</s>",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false
	},
	"errors": "replace",
	"mask_token": {
	"__type": "AddedToken",
	"content": "[MASK]",
	"lstrip": true,
	"normalized": true,
	"rstrip": false,
	"single_word": false
	},
	"name_or_path": "BAAI/glm-roberta-large",
	"pad_token": {
	"__type": "AddedToken",
	"content": "</s>",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false
	},
	"sep_token": {
	"__type": "AddedToken",
	"content": "</s>",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false
	},
	"special_tokens_map_file": null,
	"tokenizer_class": "GLMRobertaTokenizer",
	"unk_token": {
	"__type": "AddedToken",
	"content": "<unk>",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false
	},
	"use_fast": false
	}