soramikaduki
/

StarAntler-RP-WestLake-chatvector

Text Generation

Not-For-All-Audiences

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

StarAntler-RP-WestLake-chatvector / README.md

soramikaduki's picture

Update README.md

31680e9 verified 7 months ago

|

history blame contribute delete

3.27 kB

	---
	base_model:
	- soramikaduki/Antler-RP-ja-westlake-chatvector
	- soramikaduki/Starling-RP-ja-westlake-chatvector
	library_name: transformers
	tags:
	- mergekit
	- merge
	- not-for-all-audiences
	license: apache-2.0
	language:
	- ja
	---
	# StarAntler-RP-WestLake-chatvector
	This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).

	このモデルはChatVector手法を用いてNSFW手法を強化したモデル2つをマージさせたモデルです。
	まず、1つ目のモデルはChatVector手法を使用して、Aratrakoさん制作の[Aratako/Antler-7B-RP](https://huggingface.co/Aratako/Antler-7B-RP)を[senseable/WestLake-7B-v2](https://huggingface.co/senseable/WestLake-7B-v2)を用いてNSFW能力を強化しています。
	2つ目のモデルも同様にAratrakoさん制作の[Japanese-Starling-ChatV-7B-RP ](https://huggingface.co/Aratako/Japanese-Starling-ChatV-7B-RP)を[senseable/WestLake-7B-v2](https://huggingface.co/senseable/WestLake-7B-v2)を用いてNSFW能力を強化しています。
	これら2つのモデルを同等の重みでマージしたモデルです。マージの詳細は以下の通りです。

	## Merge Details
	### Merge Method

	This model was merged using the [DARE](https://arxiv.org/abs/2311.03099) [TIES](https://arxiv.org/abs/2306.01708) merge method using [soramikaduki/Antler-RP-ja-westlake-chatvector](https://huggingface.co/soramikaduki/Antler-RP-ja-westlake-chatvector) as a base.

	### Models Merged

	The following models were included in the merge:
	* [soramikaduki/Starling-RP-ja-westlake-chatvector](https://huggingface.co/soramikaduki/Starling-RP-ja-westlake-chatvector)

	### Configuration

	The following YAML configuration was used to produce this model:

	```yaml
	models:
	- model: soramikaduki/Antler-RP-ja-westlake-chatvector
	parameters:
	density: 0.5
	weight:
	- filter: mlp
	value: 0.5
	- value: 0.5
	# No parameters necessary for base model
	- model: soramikaduki/Starling-RP-ja-westlake-chatvector
	parameters:
	density: 0.5
	weight:
	- filter: mlp
	value: 0.5
	- value: 0.5
	merge_method: dare_ties
	base_model: soramikaduki/Antler-RP-ja-westlake-chatvector
	parameters:
	int8_mask: true
	dtype: bfloat16
	tokenizer_source: union
	custom_methods:
	model.embed_tokens:
	method: tokenizer_permutation
	parameters:
	weight:
	soramikaduki/Antler-RP-ja-westlake-chatvector: 0.5
	soramikaduki/Starling-RP-ja-westlake-chatvector: 0.5
	lm_head:
	method: tokenizer_permutation
	parameters:
	weight:
	soramikaduki/Antler-RP-ja-westlake-chatvector: 0.5
	soramikaduki/Starling-RP-ja-westlake-chatvector: 0.5
	```

	### Performance

	<table>
	<tr>
	<th>Model</th>
	<th>StarAntler-RP-WestLake-chatvector (This model)</th>
	</tr>
	<tr>
	<td>Parameters</td>
	<td>7B(Mistral)</td>
	</tr>
	<tr>
	<td>ELYZAtasks100<br>average score</td>
	<td>3.16</td>
	</tr>
	</table>

	Scores on "<a href="https://huggingface.co/datasets/elyza/ELYZA-tasks-100">ELYZA-tasks-100</a>"

	このスコアはinstruction-tuningを行った日本語モデルのベンチマーク「ELYZA-tasks-100」を使い、gpt-4-0125-previewにより評価させたものです。