日本語のSentence Embedding用モデル
以下のモデルから転移学習を実施。
https://huggingface.co/ken11/albert-base-japanese-v1-with-japanese-tokenizer
学習データには以下を使用。
https://huggingface.co/datasets/tzmtwtr/tw-posts-ja
モチベーション
ベクトル検索のために小規模言語モデルが必要になった。
AWS Lambdaで動かせるようにしたい。
- Downloads last month
- 23
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social
visibility and check back later, or deploy to Inference Endpoints (dedicated)
instead.