myrkur's picture
Update README.md
4dc8e24 verified
|
raw
history blame
10.4 kB
metadata
language:
  - fa
library_name: sentence-transformers
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:96546
  - loss:SoftmaxLoss
base_model: HooshvareLab/bert-base-parsbert-uncased
datasets:
  - Gholamreza/pquad
widget:
  - source_sentence: اسب‌های سنگین با اندامی عضلانی را چه می‌نامند؟
    sentences:
      - >-
        بیتلز با فروش تخمینی ۶۰۰ میلیون نسخه از کارهایشان در سراسر جهان پرفروش
        ترین هنرمند موسیقی در تمام دوران‌هاست. این گروه در سال ۱۹۸۸ به تالار
        مشاهیر راک اند رول وارد شد و هر چهار عضو اصلی نیز بین سالهای ۱۹۹۴ تا
        ۲۰۱۵ به صورت جداگانه به تالار وارد شدند. این گروه هفت جایزه گرمی، چهار
        جایزه بریت، یک جایزه اسکار (جایزه اسکار بهترین موسیقی فیلم برای فیلم
        بگذار باشد (۱۹۷۰)) و پانزده جایزه آیور نوولو دریافت کرد. مجله تایم
        آنها را در میان ۱۰۰ شخصیت برجسته قرن بیستم و رولینگ استون آنها را در
        لیست ۱۰۰ هنرمند برتر خود در رتبه اول قرار داد.
      - >-
        اسب‌های سنگین با اندامی عضلانی را به عنوان «اسب‌های خونسرد» می‌شناسند.
        آن‌ها را به دلیل توان ماهیچه‌ای و خوی آرام و صبورشان پرورش می‌دهند.
        مردم با کمک آن‌ها بارهای سنگین را جابجا می‌کردند. گاهی به این اسب‌های
        «غول‌های نجیب» هم گفته می‌شود. از جمله اسب‌های باری می‌توان به نژاد
        بلژیکی و کلایدزدیل اشاره کرد. برخی از این اسب‌ها مانند پرچرون سبک‌تر و
        چابک ترند و درکشیدن بار یا شخم زدن زمین در اقلیم خشک به کار می‌آیند.
        دیگران مانند شایر آرام‌تر و نیرومندترند و برای شخم زدن خاک‌های رسی
        کاربرد دارند. برخی اسبچهها هم در دستهٔ خونسردها جای می‌گیرند.
      - >-
        بدنهٔ اسکلتی یا خرپا (Truss) در هواپیماهای اولیه تا جنگ جهانی اول بسیار
        استفاده می‌شد. هم‌اکنون در هواپیماهای دست‌ساز و نیز هواپیماهای مدل از
        این نوع بدنه استفاده زیادی می‌شود چرا که ساده، سبک و مقاوم بوده و با
        تیرک‌های چوبی قابل ساخت هستند. در این نوع بدنه اغلب نیروها و تنش‌های
        وارده توسط سازه اصلی تحمل شده و از پوسته برای ایجاد شکل آیرودینامیکی به
        سازه استفاده می‌شود. سازهٔ اصلی از تیرک‌های طولی، تیرک‌های مورب، قاب‌های
        عرضی و کابل‌های نگهدارنده تشکیل شده‌است. برادران رایت که اولین
        هواپیماهای قابل کنترل را ساختند از این حالت در ساختار بدنهٔ
        هواپیماهایشان استفاده می‌کردند.
pipeline_tag: sentence-similarity
license: apache-2.0

SentenceTransformer based on HooshvareLab/bert-base-parsbert-uncased

This is a sentence-transformers model finetuned from HooshvareLab/bert-base-parsbert-uncased. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: HooshvareLab/bert-base-parsbert-uncased
  • Maximum Sequence Length: 512 tokens
  • Output Dimensionality: 768 tokens
  • Similarity Function: Cosine Similarity

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("myrkur/sentence-transformer-parsbert-fa")
# Run inference
sentences = [
    'پرتغالی، در وطن اصلی خود، پرتغال، تقریباً توسط ۱۰ میلیون نفر جمعیت صحبت می\u200cشود. پرتغالی همچنین به عنوان زبان رسمی برزیل، بیش از ۲۰۰ میلیون نفر در آن کشور و همچنین کشورهای همسایه، در شرق پاراگوئه و در شمال اروگوئه، سخنگو دارد، که کمی بیش از نیمی از جمعیت آمریکای جنوبی را تشکیل می\u200cدهند؛ بنابراین پرتغالی پرسخنگوترین زبان رسمی رومی در یک کشور واحد است. این زبان در شش کشور آفریقایی زبان رسمی است (آنگولا، دماغه سبز، گینه بیسائو، موزامبیک، گینه استوایی و سائوتومه و پرنسیپ) و توسط ۳۰ میلیون نفر از ساکنان آن قاره به عنوان زبان نخست گویش می\u200cشود. در آسیا، پرتغالی با سایر زبان\u200cها در تیمور شرقی و ماکائو رسمی است، در حالی که بیشتر پرتغالی\u200cزبانان در آسیا - حدود ۴۰۰٫۰۰۰ نفر - به دلیل بازگشت مهاجرت ژاپنی\u200cهای برزیل ساکن ژاپن هستند. در آمریکای شمالی ۱٫۰۰۰٫۰۰۰ نفر به پرتغالی به عنوان زبان نخست خود صحبت می\u200cکنند. پرتغالی در اقیانوسیه به دلیل شمار سخنگویانش در تیمور شرقی، پس از فرانسوی، دومین زبان رومی است که بیش از همه گویش می\u200cشود. نزدیکترین خویشاوند آن، گالیسی، دارای وضعیت رسمی در جامعه خودمختار گالیسیا در اسپانیا، همراه با اسپانیایی است.',
    'در حدود اواخر کدام قرن پیش از میلاد سکاهای کوچ\u200cنشین در مرزهای شرقی اشکانیان پیشروی کردند؟',
    'عباس جدیدی که بود؟',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Training Logs

Epoch Step Training Loss loss
0.0265 20 0.7506 -
0.0530 40 0.6701 -
0.0530 20 0.5843 -
0.1060 40 0.4591 -
0.1591 60 0.3316 -
0.2121 80 0.2856 -
0.2651 100 0.2599 -
0.3181 120 0.2478 -
0.3712 140 0.214 -
0.4242 160 0.1996 -
0.4772 180 0.1929 -
0.5302 200 0.193 0.1766
0.5833 220 0.1798 -
0.6363 240 0.1794 -
0.6893 260 0.1735 -
0.7423 280 0.1713 -
0.7954 300 0.1547 -
0.8484 320 0.1545 -
0.9014 340 0.1577 -
0.9544 360 0.1575 -
1.0075 380 0.1431 -
1.0605 400 0.1498 0.1489
1.1135 420 0.1327 -
1.1665 440 0.1223 -
1.2196 460 0.1154 -
1.2726 480 0.1059 -
1.3256 500 0.1068 -
1.3786 520 0.0959 -
1.4316 540 0.0884 -
1.4847 560 0.0896 -
1.5377 580 0.0899 -
1.5907 600 0.0814 0.1445
1.6437 620 0.0877 -
1.6968 640 0.0816 -
1.7498 660 0.0846 -
1.8028 680 0.0783 -
1.8558 700 0.0787 -
1.9089 720 0.0874 -
1.9619 740 0.0883 -
  • The bold row denotes the saved checkpoint.