Not-For-All-Audiences

Model card Files Files and versions Community

File size: 3,275 Bytes

---
base_model:
- soramikaduki/Antler-RP-ja-westlake-chatvector
- soramikaduki/Starling-RP-ja-westlake-chatvector
library_name: transformers
tags:
- mergekit
- merge
- not-for-all-audiences
license: apache-2.0
language:
- ja
---
# StarAntler-RP-WestLake-chatvector 
This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).

このモデルはChatVector手法を用いてNSFW手法を強化したモデル2つをマージさせたモデルです。
まず、1つ目のモデルはChatVector手法を使用して、Aratrakoさん制作の[Aratako/Antler-7B-RP](https://huggingface.co/Aratako/Antler-7B-RP)を[senseable/WestLake-7B-v2](https://huggingface.co/senseable/WestLake-7B-v2)を用いてNSFW能力を強化しています。
2つ目のモデルも同様にAratrakoさん制作の[Japanese-Starling-ChatV-7B-RP ](https://huggingface.co/Aratako/Japanese-Starling-ChatV-7B-RP)を[senseable/WestLake-7B-v2](https://huggingface.co/senseable/WestLake-7B-v2)を用いてNSFW能力を強化しています。
これら2つのモデルを同等の重みでマージしたモデルです。マージの詳細は以下の通りです。

## Merge Details
### Merge Method

This model was merged using the [DARE](https://arxiv.org/abs/2311.03099) [TIES](https://arxiv.org/abs/2306.01708) merge method using [soramikaduki/Antler-RP-ja-westlake-chatvector](https://huggingface.co/soramikaduki/Antler-RP-ja-westlake-chatvector) as a base.

### Models Merged

The following models were included in the merge:
* [soramikaduki/Starling-RP-ja-westlake-chatvector](https://huggingface.co/soramikaduki/Starling-RP-ja-westlake-chatvector)

### Configuration

The following YAML configuration was used to produce this model:

```yaml
models:
  - model: soramikaduki/Antler-RP-ja-westlake-chatvector
    parameters:
      density: 0.5
      weight:
          - filter: mlp
            value: 0.5 
          - value: 0.5
    # No parameters necessary for base model
  - model: soramikaduki/Starling-RP-ja-westlake-chatvector
    parameters:
      density: 0.5
      weight:
          - filter: mlp
            value: 0.5 
          - value: 0.5
merge_method: dare_ties
base_model: soramikaduki/Antler-RP-ja-westlake-chatvector
parameters:
  int8_mask: true
dtype: bfloat16
tokenizer_source: union
custom_methods:
 model.embed_tokens:
   method: tokenizer_permutation
   parameters:
     weight:
       soramikaduki/Antler-RP-ja-westlake-chatvector: 0.5
       soramikaduki/Starling-RP-ja-westlake-chatvector: 0.5
 lm_head:
   method: tokenizer_permutation
   parameters:
     weight:
       soramikaduki/Antler-RP-ja-westlake-chatvector: 0.5
       soramikaduki/Starling-RP-ja-westlake-chatvector: 0.5
```

### Performance

<table>
 <tr>
   <th>Model</th>
   <th>StarAntler-RP-WestLake-chatvector (This model)</th>
 </tr>
 <tr>
   <td>Parameters</td>
   <td>7B(Mistral)</td>
 </tr>
 <tr>
   <td>ELYZAtasks100<br>average score</td>
   <td>3.67</td>
 </tr>
</table>

Scores on "<a href="https://huggingface.co/datasets/elyza/ELYZA-tasks-100">ELYZA-tasks-100</a>"

このスコアはinstruction-tuningを行った日本語モデルのベンチマーク「ELYZA-tasks-100」を使い、gpt-4-turbo-2024-04-09により評価させたものです。