kmeans_20
This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
Usage
To use this model, please install BERTopic:
pip install -U bertopic
You can use the model as follows:
from bertopic import BERTopic
topic_model = BERTopic.load("Trubnik1967/kmeans_20")
topic_model.get_topic_info()
Topic overview
- Number of topics: 20
- Number of training documents: 29572
Click here for an overview of all topics.
Topic ID | Topic Keywords | Topic Frequency | Label |
---|---|---|---|
0 | ткань - нитка - хлопок - шов - сшить | 3714 | 0_ткань_нитка_хлопок_шов |
1 | покупатель - покупать - доставка - продавец - заказывать | 4041 | 1_покупатель_покупать_доставка_продавец |
2 | доставка - покупатель - заказ - заказать - продавец | 1189 | 2_доставка_покупатель_заказ_заказать |
3 | увы - товар - вообще - получить - ещё | 209 | 3_увы_товар_вообще_получить |
4 | неприйти - пропустить - ожидать - доставить - отправить | 938 | 4_неприйти_пропустить_ожидать_доставить |
5 | деньга - товар - вернуть - вернуться - прийти | 172 | 5_деньга_товар_вернуть_вернуться |
6 | заказ - доставить - выслать - посылка - arriverd | 110 | 6_заказ_доставить_выслать_посылка |
7 | товар - неаккуратный - ненадлежащий - неточный - изделие | 201 | 7_товар_неаккуратный_ненадлежащий_неточный |
8 | вообще - прийти - приехать - дойти - отправить | 129 | 8_вообще_прийти_приехать_дойти |
9 | размерный - размер - маловатый - объём - больший | 1496 | 9_размерный_размер_маловатый_объём |
10 | купить - заказывать - доставка - магазин - отправить | 3138 | 10_купить_заказывать_доставка_магазин |
11 | покупатель - заказывать - ожидание - уговаривать - отказаться | 3134 | 11_покупатель_заказывать_ожидание_уговаривать |
12 | невернуть - деньга - вернуть - заказ - прийти | 71 | 12_невернуть_деньга_вернуть_заказ |
13 | брюки - шорты - юбка - штаны - блузка | 2429 | 13_брюки_шорты_юбка_штаны |
14 | невернуть - деньга - возвратить - возвращать - отправлять | 213 | 14_невернуть_деньга_возвратить_возвращать |
15 | выкинуть - разочарование - жалеть - вместо - помойка | 50 | 15_выкинуть_разочарование_жалеть_вместо |
16 | плохо - плохой - всё - маленький - | 23 | 16_плохо_плохой_всё_маленький |
17 | деньга - денежный - потратить - возвратить - тратить | 1914 | 17_деньга_денежный_потратить_возвратить |
18 | свитер - сшить - пришить - блузка - носить | 3554 | 18_свитер_сшить_пришить_блузка |
19 | цвет - розовый - бледный - тряпка - толстовка | 2847 | 19_цвет_розовый_бледный_тряпка |
Training hyperparameters
- calculate_probabilities: True
- language: None
- low_memory: False
- min_topic_size: 100
- n_gram_range: (1, 1)
- nr_topics: 20
- seed_topic_list: None
- top_n_words: 10
- verbose: True
- zeroshot_min_similarity: 0.7
- zeroshot_topic_list: None
Framework versions
- Numpy: 1.25.2
- HDBSCAN: 0.8.33
- UMAP: 0.5.5
- Pandas: 1.5.3
- Scikit-Learn: 1.2.2
- Sentence-transformers: 2.5.1
- Transformers: 4.38.2
- Numba: 0.58.1
- Plotly: 5.15.0
- Python: 3.10.12
- Downloads last month
- 5
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social
visibility and check back later, or deploy to Inference Endpoints (dedicated)
instead.