soramikaduki's picture
Update README.md
31680e9 verified
---
base_model:
- soramikaduki/Antler-RP-ja-westlake-chatvector
- soramikaduki/Starling-RP-ja-westlake-chatvector
library_name: transformers
tags:
- mergekit
- merge
- not-for-all-audiences
license: apache-2.0
language:
- ja
---
# StarAntler-RP-WestLake-chatvector
This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
このモデルはChatVector手法を用いてNSFW手法を強化したモデル2つをマージさせたモデルです。
まず、1つ目のモデルはChatVector手法を使用して、Aratrakoさん制作の[Aratako/Antler-7B-RP](https://huggingface.co/Aratako/Antler-7B-RP)を[senseable/WestLake-7B-v2](https://huggingface.co/senseable/WestLake-7B-v2)を用いてNSFW能力を強化しています。
2つ目のモデルも同様にAratrakoさん制作の[Japanese-Starling-ChatV-7B-RP ](https://huggingface.co/Aratako/Japanese-Starling-ChatV-7B-RP)を[senseable/WestLake-7B-v2](https://huggingface.co/senseable/WestLake-7B-v2)を用いてNSFW能力を強化しています。
これら2つのモデルを同等の重みでマージしたモデルです。マージの詳細は以下の通りです。
## Merge Details
### Merge Method
This model was merged using the [DARE](https://arxiv.org/abs/2311.03099) [TIES](https://arxiv.org/abs/2306.01708) merge method using [soramikaduki/Antler-RP-ja-westlake-chatvector](https://huggingface.co/soramikaduki/Antler-RP-ja-westlake-chatvector) as a base.
### Models Merged
The following models were included in the merge:
* [soramikaduki/Starling-RP-ja-westlake-chatvector](https://huggingface.co/soramikaduki/Starling-RP-ja-westlake-chatvector)
### Configuration
The following YAML configuration was used to produce this model:
```yaml
models:
- model: soramikaduki/Antler-RP-ja-westlake-chatvector
parameters:
density: 0.5
weight:
- filter: mlp
value: 0.5
- value: 0.5
# No parameters necessary for base model
- model: soramikaduki/Starling-RP-ja-westlake-chatvector
parameters:
density: 0.5
weight:
- filter: mlp
value: 0.5
- value: 0.5
merge_method: dare_ties
base_model: soramikaduki/Antler-RP-ja-westlake-chatvector
parameters:
int8_mask: true
dtype: bfloat16
tokenizer_source: union
custom_methods:
model.embed_tokens:
method: tokenizer_permutation
parameters:
weight:
soramikaduki/Antler-RP-ja-westlake-chatvector: 0.5
soramikaduki/Starling-RP-ja-westlake-chatvector: 0.5
lm_head:
method: tokenizer_permutation
parameters:
weight:
soramikaduki/Antler-RP-ja-westlake-chatvector: 0.5
soramikaduki/Starling-RP-ja-westlake-chatvector: 0.5
```
### Performance
<table>
<tr>
<th>Model</th>
<th>StarAntler-RP-WestLake-chatvector (This model)</th>
</tr>
<tr>
<td>Parameters</td>
<td>7B(Mistral)</td>
</tr>
<tr>
<td>ELYZAtasks100<br>average score</td>
<td>3.16</td>
</tr>
</table>
Scores on "<a href="https://huggingface.co/datasets/elyza/ELYZA-tasks-100">ELYZA-tasks-100</a>"
このスコアはinstruction-tuningを行った日本語モデルのベンチマーク「ELYZA-tasks-100」を使い、gpt-4-0125-previewにより評価させたものです。