Edit model card

kmeans_20

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("Trubnik1967/kmeans_20")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 20
  • Number of training documents: 29572
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
0 ткань - нитка - хлопок - шов - сшить 3714 0_ткань_нитка_хлопок_шов
1 покупатель - покупать - доставка - продавец - заказывать 4041 1_покупатель_покупать_доставка_продавец
2 доставка - покупатель - заказ - заказать - продавец 1189 2_доставка_покупатель_заказ_заказать
3 увы - товар - вообще - получить - ещё 209 3_увы_товар_вообще_получить
4 неприйти - пропустить - ожидать - доставить - отправить 938 4_неприйти_пропустить_ожидать_доставить
5 деньга - товар - вернуть - вернуться - прийти 172 5_деньга_товар_вернуть_вернуться
6 заказ - доставить - выслать - посылка - arriverd 110 6_заказ_доставить_выслать_посылка
7 товар - неаккуратный - ненадлежащий - неточный - изделие 201 7_товар_неаккуратный_ненадлежащий_неточный
8 вообще - прийти - приехать - дойти - отправить 129 8_вообще_прийти_приехать_дойти
9 размерный - размер - маловатый - объём - больший 1496 9_размерный_размер_маловатый_объём
10 купить - заказывать - доставка - магазин - отправить 3138 10_купить_заказывать_доставка_магазин
11 покупатель - заказывать - ожидание - уговаривать - отказаться 3134 11_покупатель_заказывать_ожидание_уговаривать
12 невернуть - деньга - вернуть - заказ - прийти 71 12_невернуть_деньга_вернуть_заказ
13 брюки - шорты - юбка - штаны - блузка 2429 13_брюки_шорты_юбка_штаны
14 невернуть - деньга - возвратить - возвращать - отправлять 213 14_невернуть_деньга_возвратить_возвращать
15 выкинуть - разочарование - жалеть - вместо - помойка 50 15_выкинуть_разочарование_жалеть_вместо
16 плохо - плохой - всё - маленький - 23 16_плохо_плохой_всё_маленький
17 деньга - денежный - потратить - возвратить - тратить 1914 17_деньга_денежный_потратить_возвратить
18 свитер - сшить - пришить - блузка - носить 3554 18_свитер_сшить_пришить_блузка
19 цвет - розовый - бледный - тряпка - толстовка 2847 19_цвет_розовый_бледный_тряпка

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 100
  • n_gram_range: (1, 1)
  • nr_topics: 20
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: True
  • zeroshot_min_similarity: 0.7
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.25.2
  • HDBSCAN: 0.8.33
  • UMAP: 0.5.5
  • Pandas: 1.5.3
  • Scikit-Learn: 1.2.2
  • Sentence-transformers: 2.5.1
  • Transformers: 4.38.2
  • Numba: 0.58.1
  • Plotly: 5.15.0
  • Python: 3.10.12
Downloads last month
5
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.