Edit model card

SetFit with mini1013/master_domain

This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

  1. Fine-tuning a Sentence Transformer with contrastive learning.
  2. Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Sources

Model Labels

Label Examples
10
  • '다이슨 슈퍼소닉 여행용 헤어 드라이기 휴대용 가죽 케이스 보관함 가방 브라운 아저씨'
  • '[체리니]레인보우잭 클리퍼잭 바리깡 잭 바리깡 덧날 체리니'
  • '바비온 BOB65 강아지이발기 전용 이발기날 이발기 바리깡 세라믹 이발기날 교체용날 주식회사 바비온'
13
  • '홈스킨이노베이션즈 실큰 쥬얼 IPL 레이저 제모기 공육이삼(0623)'
  • '유어피스 바디쉐이버 YP-BR01(샴페인핑크) 소담마켓'
  • '필립스코리아 샤티넬 모근제거기 화이트 + 라임 그린 BRE224/00 최상현'
11
  • '하이맥스토끼바리깡 CL-300 전문가용이발기 핑크 오.케이상사'
  • '하이맥스 CL-303K 토끼바리깡/장미바리깡/미용실바리깡 한일인터내셔널'
  • '베라스 남자이발기 프로바리깡 전문가용 방수이발기 바리깡 미용실바리깡 유아이발기 셀프 투블럭 아기바리깡 셀프바리깡 미용실바리깡 토끼바리깡 유아바리깡 방수바리깡 VC-1000S 이코리코'
8
  • '[애드온] 애드온 전동 손톱깎이 네일트리머 SV425 (주) 교보문고'
  • '전동 아기 신생아 손톱깎이 네일트리머 손톱트리머 BNT-2 블루 (주)휴비딕'
  • '세신드릴 블랙스완 무선 네일드릴 35,000rpm 주식회사 코즈랩'
3
  • '에어라파 무선 방수 스마트 두피마사지기 HS3440 다인지앤비'
  • '두피 마사지기 관리기 저준위레이저 모두온 SH-LC2 블루 (주)메디위'
  • '[텐마인즈] 브레오 두피 마사지기 SCALP2 헤어 스칼프 전동 안마기 관리기 각질케어 [465] 그레이_1개(15000원) (주) 열심히커뮤니케이션즈'
5
  • '[소식알림받고 리뷰작성 3만적립금]다이슨 에어스트레이트 스트레이트너 (블루/코퍼) 다이슨코리아 유한회사'
  • '[포토리뷰 1만원 적립]다이슨 에어스트레이트 스트레이트너 (니켈/코퍼) 다이슨코리아 유한회사'
  • '다이슨 코랄 헤어 스트레이트너(코퍼/니켈) / 정품 / L 레드/니켈(기프트) 주식회사 리안'
12
  • 'BRAUN 시리즈X M1100 세진세라믹'
  • 'BRAUN 시리즈7 71-N1200S 뉴데이즈마켓'
  • '필립스 SkinIQ 5000시리즈 S5588/17 - 포시즌 밸류앤포'
16
  • 'JMW BLDC 헤어 드라이어 부스터 SDU3A01A 코스트코 드라이기 에이앤지컴퍼니'
  • '테팔 헤어스트레이트너 리스앤컬 투인원 HS4210K0 (주)인앤인코스메틱'
  • '벨레르 그루 8in1 전력전압 자동조절 전 세계 최초 해외 사용 가능 에어 스타일러 헤어 드라이기 주식회사 나우홈'
4
  • '플러스에어 공식판매처 헤어드라이기 H3 베이직 그린 주식회사 디깅미인터내셔널'
  • '예스뷰티 ZOA-1530 이순한'
  • '차이슨 헤어 초경량 가벼운드라이기 여행용 휴대용 3m 1.8m스탠다드 밀크 단일노즐 영통종합유통'
17
  • '예스뷰티 헤어롤 YB-9200 롤20개 사용온도센서 바이오메드'
  • '예스뷰티 휴대용 헤어롤 YB-104 프리볼트/헤어롤/휴대용헤어롤/구르프/셋팅기/휴대용셋팅기/여행용셋팅기/여행용헤어롤/예스뷰티헤어롤 YB-104 (프리볼트) 윌로펌프서비스(김포)'
  • '[예스뷰티]YB-9120 전기헤어롤 12P 태민사'
6
  • 'BRAUN 70S 셜크'
  • '[BRAUN] 브라운 전기면도기 시리즈9&8 파워충전케이스 (9484 PC) 9484pc power case [PC15] 주식회사 이엘피스(E-엘피스)'
  • '파나소닉 람대쉬 전기면도기 세척기전용 (WES4L03) 세정액 (주)레그노'
15
  • 'LG 프라엘 인텐시브 멀티케어 BLP1 복합 갈바닉 고주파 마사지기 쿨링 미세전류 수분 보습 탄력 케어 인텐시브 멀티케어[P709] 주식회사블루원'
  • '피코스텍 메디큐브 에이지알 유쎄라 딥 샷 (거치대포함) 김희선 마사지기 하이곰 마켓'
  • 'LG프라엘 더마쎄라 BLQ1 + 카트리지 BARQ1 2종 세트 (주)엘앤텍'
0
  • 'FHIKOREA 마르세이유 MW_01 블랙 아래서위로'
  • '바비리스 수블림 컬링 아이론 C332K 우씨(WooSEA)'
  • '바비리스 C332K 모라상사'
14
  • '필립스 NT3650/16 동의 선우에이치앤비(SUNWOO H&B)'
  • '이즈미 생활방수 코털제거기 NB-12B 핵심 날 망 일본 제조 (주)라이징테크'
  • '필립스 NT-3160 필립스 NT-3160 렉슬리코리아'
2
  • '[MISO] 미소 AR-148PP 눈썹정리기/눈썹바리깡/눈썹이발기 AR-148PP 메티에'
  • '파나소닉 셀프 제모기 트리머 면도기 ER-GM40 눈썹 바리깡 (주)미도시'
  • '쥬베라 히팅뷰러 속눈썹 고데기 JV-305 핑크 팔팔상회'
1
  • '페이스팩토리 속눈썹 고데기 USB 충전 온열 히팅 뷰러 드라이기 고대기 속눈썹고데기 리뉴얼 주식회사 큐비스트'
  • '오아 쁘띠 컬링 v2 속눈썹 고데기 USB 충전식 온도조절 온열 히팅뷰러 ★혜택가★ 쁘띠컬링 J0001 오아 주식회사'
  • '쥬베라 속눈썹 고데기 온열 히팅 뷰러 탄젤로 주식회사 쥬베라'
7
  • '라피타 3in1 아이돌 히팅래쉬펌. 온열괄사 (주)제이온케어'
  • '오아 포텐컬링 속눈썹 고데기 usb 충전식 온도조절 온열 히팅뷰러 포텐컬링 J0007 오아 주식회사'
  • '크리스탈클라우드 충전식 눈썹 속눈썹 고데기 13g 1개 에이치케이코퍼레이션(주)'
9
  • '보다나 글램컬 에어 힛 브러쉬 코스트코 씨이마켓(CEMARKET)'
  • '비달사순 에어브러쉬 헤어 롤 빗 에어 스타일러 VSAS80PIK (CU상품권) 주식회사 디에이지'
  • '[Panasonic] 빗 드라이기 EH-KA11 [파나소닉 공식인증] (주)컴퓨존'

Evaluation

Metrics

Label Metric
all 0.7129

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_el15")
# Run inference
preds = model("조아스 전기 이발기 JC-4773  홍운SnC")

Training Details

Training Set Metrics

Training set Min Median Max
Word count 4 8.8868 24
Label Training Sample Count
0 50
1 3
2 50
3 50
4 50
5 50
6 50
7 3
8 50
9 50
10 50
11 50
12 50
13 50
14 50
15 50
16 39
17 50

Training Hyperparameters

  • batch_size: (512, 512)
  • num_epochs: (20, 20)
  • max_steps: -1
  • sampling_strategy: oversampling
  • num_iterations: 40
  • body_learning_rate: (2e-05, 2e-05)
  • head_learning_rate: 2e-05
  • loss: CosineSimilarityLoss
  • distance_metric: cosine_distance
  • margin: 0.25
  • end_to_end: False
  • use_amp: False
  • warmup_proportion: 0.1
  • seed: 42
  • eval_max_steps: -1
  • load_best_model_at_end: False

Training Results

Epoch Step Training Loss Validation Loss
0.008 1 0.4972 -
0.4 50 0.3579 -
0.8 100 0.2105 -
1.2 150 0.0948 -
1.6 200 0.0803 -
2.0 250 0.0848 -
2.4 300 0.0253 -
2.8 350 0.0278 -
3.2 400 0.023 -
3.6 450 0.0113 -
4.0 500 0.0098 -
4.4 550 0.006 -
4.8 600 0.01 -
5.2 650 0.0044 -
5.6 700 0.0069 -
6.0 750 0.0117 -
6.4 800 0.004 -
6.8 850 0.0004 -
7.2 900 0.0023 -
7.6 950 0.0023 -
8.0 1000 0.0004 -
8.4 1050 0.0024 -
8.8 1100 0.0003 -
9.2 1150 0.001 -
9.6 1200 0.0003 -
10.0 1250 0.0004 -
10.4 1300 0.0002 -
10.8 1350 0.0003 -
11.2 1400 0.0028 -
11.6 1450 0.0002 -
12.0 1500 0.0002 -
12.4 1550 0.0002 -
12.8 1600 0.0002 -
13.2 1650 0.0002 -
13.6 1700 0.0002 -
14.0 1750 0.0001 -
14.4 1800 0.0002 -
14.8 1850 0.0002 -
15.2 1900 0.0012 -
15.6 1950 0.0001 -
16.0 2000 0.0003 -
16.4 2050 0.0001 -
16.8 2100 0.0001 -
17.2 2150 0.0001 -
17.6 2200 0.0005 -
18.0 2250 0.0001 -
18.4 2300 0.0005 -
18.8 2350 0.0001 -
19.2 2400 0.0008 -
19.6 2450 0.0001 -
20.0 2500 0.0001 -

Framework Versions

  • Python: 3.10.12
  • SetFit: 1.1.0.dev0
  • Sentence Transformers: 3.1.1
  • Transformers: 4.46.1
  • PyTorch: 2.4.0+cu121
  • Datasets: 2.20.0
  • Tokenizers: 0.20.0

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
Downloads last month
1,289
Safetensors
Model size
111M params
Tensor type
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Model tree for mini1013/master_cate_el15

Base model

klue/roberta-base
Finetuned
(92)
this model

Evaluation results