Edit model card

SetFit with mini1013/master_domain

This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

  1. Fine-tuning a Sentence Transformer with contrastive learning.
  2. Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Sources

Model Labels

Label Examples
6.0
  • '듬뿍담은 안동식 순살 찜닭 밀키트 711g 주식회사 프레시지'
  • '우렁쌈장 (2인분) 밀키트 쿠킹박스 우렁살 2개 추가(100g) 농업회사법인 주식회사 아임셰프'
  • '홍수계 매콤 당면듬뿍 순살 찜닭 850g 2인분 냉동 밀키트 셀린'
1.0
  • '[마이셰프] 찹스테이크(1인)(프리미엄박스) 주식회사 마이셰프'
  • '소문난 청정원 호밍스 마포식 돼지양념구이 210g 정원이샵 홈파티음식 캠핑요리 맥주안주 야식 간편식 홈캉스 풍미업 모에모에큥 에스더블유디자인'
  • '심쿡 슈페리어 연어 스테이크 455g 밀키트 쿠킹박스 인영이네'
5.0
  • '골든벨통상골든벨 심영순쇠고기국간장250ml 주식회사 에스에스지닷컴'
  • 'CJ 튀김가루 1kg 1개 주식회사 에스에스지닷컴'
  • '(치즈박스)쉐프가 만든 캠핑 와인안주세트(고기 포함 안됨 X) 캘리포니아 키친 실속형(-2500)_11/20 월요일 캘리포니아키친(california kitchen)'
4.0
  • '소고기 버섯 잡채 (2인분) 주식회사 프레시지'
  • '야식메뉴 청정원 호밍스 춘천식 치즈닭갈비 220g 저녁반찬 자취요리 규비에스코퍼레이션'
  • '하림 궁중 국물 닭떡볶이 700g 밀키트 바이라이프'
0.0
  • '올바르고반듯한 떡볶이 원조시장 떡볶이 (냉동), 575g, 1개 하누코지'
  • '두끼 즉석떡볶이 560G 아이스박스 포장/선택 인터드림'
  • '두끼 매콤 고소 로제떡볶이 3팩 450g 주식회사 다른'
3.0
  • '[강원팜] 홈스랑 곤드레감자밥 쉽게만들기6인분 강원팜'
  • '마이셰프 즉석밥 일상정원 명란 솥밥 (냉동), 233g, 1개 하누코지'
  • '여름철 보양식 전복죽 200g 1팩 더블제이doubleJ'
7.0
  • '우정옥 여주 한우 특곰탕 1kg(2인분) 한우사골곰탕 도가니탕 1000g(약 2인분) 주식회사 우정옥'
  • '25년 전통 수복 얼큰 감자탕 [기본팩] 캠핑요리 밀키트 우거지 리얼감자탕 알뜰팩(라면사리X / 야채X) 수복얼큰감자탕'
  • '인천 정통 맛집 장금수 스페셜 부대전골 부대찌개 2-3인분 술안주 캠핑 집들이 밀키트 더렌'
2.0
  • '1분완성 개별포장 매콤 알싸 비빔 막국수 막국수 1팩 (주)데이지웰푸드'
  • '동원 면발의신 얼큰칼국수 268g 엄마손맛 육수 쉬운요리 감칠맛 자취 풍미 레시피 소스 인영'
  • '샐러드미인 쉐프엠 미트파스타 230g 주식회사 엠디에스코리아'

Evaluation

Metrics

Label Metric
all 0.9173

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_fd8")
# Run inference
preds = model("[CJ](신세계 의정부점) 비비고 누룽지닭다리삼계탕 550g  주식회사 에스에스지닷컴")

Training Details

Training Set Metrics

Training set Min Median Max
Word count 3 9.3575 20
Label Training Sample Count
0.0 50
1.0 50
2.0 50
3.0 50
4.0 50
5.0 50
6.0 50
7.0 50

Training Hyperparameters

  • batch_size: (512, 512)
  • num_epochs: (20, 20)
  • max_steps: -1
  • sampling_strategy: oversampling
  • num_iterations: 40
  • body_learning_rate: (2e-05, 2e-05)
  • head_learning_rate: 2e-05
  • loss: CosineSimilarityLoss
  • distance_metric: cosine_distance
  • margin: 0.25
  • end_to_end: False
  • use_amp: False
  • warmup_proportion: 0.1
  • seed: 42
  • eval_max_steps: -1
  • load_best_model_at_end: False

Training Results

Epoch Step Training Loss Validation Loss
0.0159 1 0.4347 -
0.7937 50 0.2865 -
1.5873 100 0.0903 -
2.3810 150 0.0636 -
3.1746 200 0.0401 -
3.9683 250 0.003 -
4.7619 300 0.0016 -
5.5556 350 0.0017 -
6.3492 400 0.0025 -
7.1429 450 0.0007 -
7.9365 500 0.0001 -
8.7302 550 0.0001 -
9.5238 600 0.0002 -
10.3175 650 0.0001 -
11.1111 700 0.0008 -
11.9048 750 0.0001 -
12.6984 800 0.0001 -
13.4921 850 0.0 -
14.2857 900 0.0001 -
15.0794 950 0.0 -
15.8730 1000 0.0 -
16.6667 1050 0.0 -
17.4603 1100 0.0 -
18.2540 1150 0.0 -
19.0476 1200 0.0 -
19.8413 1250 0.0 -

Framework Versions

  • Python: 3.10.12
  • SetFit: 1.1.0.dev0
  • Sentence Transformers: 3.1.1
  • Transformers: 4.46.1
  • PyTorch: 2.4.0+cu121
  • Datasets: 2.20.0
  • Tokenizers: 0.20.0

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
Downloads last month
1,033
Safetensors
Model size
111M params
Tensor type
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Model tree for mini1013/master_cate_fd8

Base model

klue/roberta-base
Finetuned
(92)
this model

Evaluation results