한국어 token을 vocab을 추가했다고 Github에 적어주셨는데 기존 llama-3.2 vocab size가 똑같더라구요. 혹시 Vocab 추가 후에 128k 개수에 맞춰서 자르신걸까요?
블라썸 초기버전은 한국어 token을 vocab에 추가하였지만 최근에는 추가하지 않고 있습니다. 이 모델도 meta-llama/Llama-3.2-3B-Instruct 와 동일한 vocab을 사용합니다.
· Sign up or log in to comment