bobtk commited on
Commit
c091064
1 Parent(s): 2e69fba

800cefa5d174bbe0f7654a0294759872f7f855e613a5603ee00958c219b0e083

Browse files
README.md ADDED
@@ -0,0 +1,145 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - en
4
+ - ja
5
+ library_name: transformers
6
+ license: other
7
+ license_name: llm-jp-3-172b-beta1-tou
8
+ license_link: LICENSE
9
+ pipeline_tag: text-generation
10
+ tags:
11
+ - mlx
12
+ extra_gated_prompt: "### 「LLM-jp-3 172B beta1」利用規約\nこの利用規約(以下「本規約」といいます)は、大学共同利用機関法人\
13
+ \ 情報・システム研究機構 国立情報学研究所(以下「提供者」といいます)による開発の成果物として公開する大規模言語モデル「LLM-jp-3 172B beta1」(以下「本プログラム」といいます)の利用に関する条件を定めるものです。本プログラムの利用者(以下「利用者」といいます)は、本規約に同意した上で本プログラムを利用するものとします。\n\
14
+ - 第1条(利用許諾)\n 1. 本プログラムの利用者は、本規約とは別に定める方法により本プログラムの利用を申請し、提供者から個別の許諾を得るものとします。\n\
15
+ \ 2. 利用者は、本規約に従い、本プログラムを商用または非商用目的を問わず利用することができます。なお、利用の範囲には、本プログラムの改変、複製および再配布ならびに本プログラム又は本プログラムを改変し作成した大規模言語モデル(以下「改変物」といいます)を用いたサービスの実施を含むものとします。ただし、利用者は、本プログラム又は改変物の再配布時のライセンスまたは本プログラムもしくは改変物を用いたサービスの利用規約に本規約を含む必要があります。また、利用者が改変物を再配布する際、利用者が改変したことを明記する必要があります。\n\
16
+ \ 3. 本規約に違反した利用者は、本プログラムを利用することはできません。\n\n- 第2条(責任)\n 1. 利用者は、本プログラムは現状有姿で提供され、提供者は、明示または黙示を問わず、本プログラムに関し、その正確性、完全性、最新性、および品質など、いかなる保証も行わず、利用者が本プログラムを利用したこと、利用できなかったことにより生じた一切の損害について責任を負わないことを、予め承諾するものとします。\n\
17
+ \ 2. 利用者は、利用者による本プログラムの利用により、または、利用者が本利用規約に違反したことにより提供者が損害を被った場合、当該損害を賠償するものとします。\n\
18
+ \ 3. 利用者は、自己の責任と判断において利用するものとし、本プログラムの利用に関して、第三者との間で生じた紛争について、自らの責任と負担で対応し、提供者に一切の迷惑を掛けないものとします。利用者は本プログラムの利用によって生じた損害について自己の責任で対処するものとします。\n\
19
+ \n- 第3条(禁止行為)\n 利用者は本プログラムを利用して以下の行為を行わないものとします。\n (1)\t提供者もしくは第三者の知的財産権を侵害する行為、または侵害するおそれのある行為\n\
20
+ \ (2)\t提供者もしくは第三者の財産、プライバシーもしくは肖像権を侵害する行為、または侵害するおそれのある行為\n (3)\t提供者もしくは第三者を差別もしくは誹謗中傷・侮辱し、他者への差別を助長し、または名誉もしくは信用を毀損する行為\n\
21
+ \ (4)\t提供者もしくは第三者への迷惑行為、または迷惑になる恐れのある行為\n (5)\t許可されていない法律業務に従事したり、有資格の専門家以外からの法律アドバイスを提供したりする行為\n\
22
+ \ (6)\t有資格の専門家以外からの財務アドバイスを提供する行為\n (7)\t健康への助言や治療方法の提示などを含む医療行為\n (8)\t\
23
+ その他法令に基づく許可等が必要な行為\n\n- 第4条(制約事項)\n 1. 利用者は、本プログラムを用いた処理の結果物(以下「処理結果」という)には、虚偽や偏り、他人の権利を侵害する内容、または利用者の想定する有効性や有用性を満たさない内容が含まれている場合があることを承諾し、不正確・不適切な処理結果により、自ら又は第三者の損害や権利侵害の発生、倫理的懸念が起こり得るという前提に立ち本プログラムを利用するものとします。利用者は、処理結果の正誤や適法性、倫理的妥当性を自ら確認の上、利用するものとします。利用者が処理結果を含め本プログラムを用いたことにより、利用者自身又は第三者の権利侵害を発生させた場合、提供者はその損害に対して一切の責��を負わないものとし、利用者は提供者に対し一切の迷惑を掛けないものとします。\n\
24
+ \ 2. 利用者は処理結果について、それぞれの国や地域において法令などの規制を順守した上で利用するものとします。\n 3. 利用者は、処理結果を第3条(禁止事項)に記載の行為に利用しないものとします。\n\
25
+ \n- 第5条(権利帰属等)\n 1. 利用者は、本利用規約で明示で定めるものを除き本プログラムに関する一切の権利を取得することはありません。\n \
26
+ \ 2. 利用者は、本プログラム改変物の作成によって新たに発生した権利を取得しますが、改変物の利用に当たっては本利用規約に従って利用するものとします。\n \
27
+ \ 3. 提供者は処理結果について、権利主張を行わないものとします。\n\n- 第6条(輸出取引)\n 利用者は、本プログラムおよび処理結果の利用に関連して外国為替及び外国貿易法(これに関連する政省令を含む)または米国輸出管理法令で規定する許可が必要な輸出を行うときは、利用者自らが所定の許可を取得するものとします。\n\
28
+ \n- 第7条(管轄裁判所)\n 本利用規約に関し生じた紛争については、東京地方裁判所をもって第一審の専属的合意管轄裁判所とします。\n\n- 第8条(準拠法)\n\
29
+ \ 本利用規約は日本法に準拠します。\n\n- 第9条(その他の規定)\n 本規約は、本プログラムの利用者と提供者との間の利用に関する全ての事項を定めるものであり、本規約に定めのない事項については、関係法令に従うものとします。\n\
30
+ \n- 第10条(言語)\n 本規約は日本語を正本とします。本規約の英訳版は、参考のために作成されたものであり、何らの法的拘束力もないものとします。\n\n\
31
+ 以上\n### LLM-jp-3 172B beta1 Terms of Use\nThis Terms of Use (hereinafter referred\
32
+ \ to as \"TOU\") sets forth the conditions for the use of the large-scale language\
33
+ \ model LLM-jp-3 172B beta1 (hereinafter referred to as \"the Program\") that is\
34
+ \ made public as a result of the development by the Research and Development Center\
35
+ \ for Large Language Models at the National Institute of Informatics (hereinafter\
36
+ \ referred to as \"the Provider\"). Users of the Program (hereinafter referred to\
37
+ \ as \"Users\") shall use the Program upon agreeing to the TOU.\n- Article 1 (License\
38
+ \ to Use)\n 1. Users of the Program must apply for the use of the Program by\
39
+ \ a method separately specified in addition to the TOU and obtain individual permission\
40
+ \ from the Provider.\n 2. Users of the Program may use the Program for commercial\
41
+ \ or non-commercial purposes in accordance with the TOU. The word “use” includes,\
42
+ \ but not limited to, the modification, duplication, and redistribution of the Program,\
43
+ \ as well as the implementation of services using the Program and/or the large-scale\
44
+ \ language model created by modifying the Program (hereinafter referred to as \"\
45
+ Modified Works\"); provided that Users must incorporate the TOU into the license\
46
+ \ terms for redistribution of the Program or Modified Works, or into the terms of\
47
+ \ use for services using the Program or Modified Works. In addition, when redistributing\
48
+ \ Modified Works, Users must clearly state that they have made the modifications.\n\
49
+ \ 3. Users who violate the TOU are not allowed to use the Program.\n\n- Article\
50
+ \ 2 (Responsibility)\n 1. Users agree in advance that the Program is provided\
51
+ \ “AS IS”, and the Provider makes no warranties, express or implied, regarding the\
52
+ \ Program, including, but not limited to, its accuracy, completeness, up-to-dateness,\
53
+ \ and quality, and that the Provider shall not be liable for any damages arising\
54
+ \ from the use or inability to use the Program.\n 2. Users shall compensate for\
55
+ \ any and all damages suffered by the Provider as a result of the use of the Program\
56
+ \ and/or the Users' violation of the TOU.\n 3. Users shall use the Program at\
57
+ \ their own responsibility and discretion, and shall handle any disputes arising\
58
+ \ with third parties in relation to the use of the Program at their own responsibility\
59
+ \ and expense, and shall indemnify, defend and hold harmless the Provider against\
60
+ \ all damages and losses without causing any inconvenience to the Provider. Users\
61
+ \ shall deal with any damages caused by the use of the Program at their own responsibility.\n\
62
+ \n- Article 3 (Prohibited Actions)\nUsers shall not engage in the following actions\
63
+ \ when using the Program.\n (1)\tActions that will or may infringe on the intellectual\
64
+ \ property rights of the Provider or third parties;\n (2)\tActions that will\
65
+ \ or may infringe on the property, privacy, or portrait rights of the Provider or\
66
+ \ third parties; \n (3)\tActions that discriminate against, defame, insult, or\
67
+ \ slander the Provider or third parties, promote discrimination against others,\
68
+ \ or damage the reputation or credibility of others;\n (4) Actions that will\
69
+ \ or may cause inconvenience or harm to the Provider or third parties;\n (5)\t\
70
+ Actions that engage in unauthorized legal services and/or provide legal advice from\
71
+ \ anyone other than a qualified professional;\n (6)\tActions that provide financial\
72
+ \ advice from anyone other than a qualified professional;\n (7)\tMedical actions,\
73
+ \ including providing health advice or suggesting treatment methods; and\n (8)\t\
74
+ Other actions that require permissions or other forms of authorization under laws\
75
+ \ and regulations.\n\n- Article 4 (Restrictions)\n 1. Users acknowledge that\
76
+ \ the results of processing using the Program (hereinafter referred to as \"Processing\
77
+ \ Results\") may contain falsehoods, biases, content that infringes on the rights\
78
+ \ of others, or content that does not meet the effectiveness or usefulness expected\
79
+ \ by Users, and agree to use the Program on the premise that inaccurate or inappropriate\
80
+ \ Processing Results may cause damage or infringement of rights to Users or third\
81
+ \ parties and/or ethical concerns. Users shall use the Processing Results after\
82
+ \ confirming their accuracy, legality, and ethical validity themselves. If the use\
83
+ \ of the Program, including the Processing Results, by Users cause infringement\
84
+ \ of the rights of the Users themselves or third parties, the Provider shall not\
85
+ \ be responsible for any damages, and the Users shall indemnify, defend and hold\
86
+ \ harmless the Provider against all damages and losses without causing any inconvenience\
87
+ \ to the Provider.\n 2. Users shall use the Processing Results in compliance\
88
+ \ with the regulations such as laws and regulations in each country and region.\n\
89
+ \ 3. Users shall not use the Processing Results for the actions listed in Article\
90
+ \ 3 (Prohibited Actions).\n\n- Article 5 (Ownership of Rights)\n 1. Except as\
91
+ \ expressly provided in the TOU, Users shall not acquire any rights in relation\
92
+ \ to the Program.\n 2. Users will acquire rights newly arising from the creation\
93
+ \ of Modified Works of the Program, but Users shall use Modified Works in accordance\
94
+ \ with the TOU.\n 3. The Provider shall not assert any rights to the Processing\
95
+ \ Results.\n\n- Article 6 (Export Transaction)\n Users shall obtain the necessary\
96
+ \ permissions themselves when exporting the Program and the Processing Results in\
97
+ \ relation to their use, where such export requires permissions under the Foreign\
98
+ \ Exchange and Foreign Trade Act (including related cabinet order and ministerial\
99
+ \ order) or U.S. export control laws and regulations.\n\n- Article 7 (Jurisdiction)\n\
100
+ \ The Tokyo District Court shall have exclusive jurisdiction in the court of\
101
+ \ the first instance over any disputes arising out of or in connection with the\
102
+ \ TOU.\n\n- Article 8 (Governing Law)\n The TOU is governed by and construed\
103
+ \ in accordance with the laws of Japan.\n\n- Article 9 (Other Provisions)\n The\
104
+ \ TOU sets forth the entire agreement as to all matters concerning the use of the\
105
+ \ Program between the Users and the Provider, and matters not provided for in the\
106
+ \ TOU shall be governed by the relevant laws and regulations. \n\n- Article 10 (Governing\
107
+ \ Language)\n The governing language of the TOU shall be Japanese. The English\
108
+ \ translation hereof is made for reference purpose only and shall have no effect."
109
+ extra_gated_fields:
110
+ Name: text
111
+ Affiliation: text
112
+ I want to use this model for: text
113
+ programming_language:
114
+ - C
115
+ - C++
116
+ - C#
117
+ - Go
118
+ - Java
119
+ - JavaScript
120
+ - Lua
121
+ - PHP
122
+ - Python
123
+ - Ruby
124
+ - Rust
125
+ - Scala
126
+ - TypeScript
127
+ inference: false
128
+ ---
129
+
130
+ # mlx-community/llm-jp-3-172b-beta1-instruct-4bit
131
+
132
+ The Model [mlx-community/llm-jp-3-172b-beta1-instruct-4bit](https://huggingface.co/mlx-community/llm-jp-3-172b-beta1-instruct-4bit) was converted to MLX format from [llm-jp/llm-jp-3-172b-beta1-instruct](https://huggingface.co/llm-jp/llm-jp-3-172b-beta1-instruct) using mlx-lm version **0.18.1**.
133
+
134
+ ## Use with mlx
135
+
136
+ ```bash
137
+ pip install mlx-lm
138
+ ```
139
+
140
+ ```python
141
+ from mlx_lm import load, generate
142
+
143
+ model, tokenizer = load("mlx-community/llm-jp-3-172b-beta1-instruct-4bit")
144
+ response = generate(model, tokenizer, prompt="hello", verbose=True)
145
+ ```
config.json ADDED
@@ -0,0 +1,32 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "LlamaForCausalLM"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": 1,
8
+ "eos_token_id": 2,
9
+ "hidden_act": "silu",
10
+ "hidden_size": 12288,
11
+ "initializer_range": 0.02,
12
+ "intermediate_size": 38464,
13
+ "max_position_embeddings": 4096,
14
+ "mlp_bias": false,
15
+ "model_type": "llama",
16
+ "num_attention_heads": 96,
17
+ "num_hidden_layers": 96,
18
+ "num_key_value_heads": 16,
19
+ "pretraining_tp": 1,
20
+ "quantization": {
21
+ "group_size": 64,
22
+ "bits": 4
23
+ },
24
+ "rms_norm_eps": 1e-05,
25
+ "rope_scaling": null,
26
+ "rope_theta": 10000,
27
+ "tie_word_embeddings": false,
28
+ "torch_dtype": "bfloat16",
29
+ "transformers_version": "4.40.1",
30
+ "use_cache": true,
31
+ "vocab_size": 99840
32
+ }
model-00019-of-00019.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:dfca13cf5a4a0d0b86e57a769fd9ca2c2edc11ad06eb887570fc80d27f1a8bb8
3
+ size 1572693958
model.safetensors.index.json ADDED
The diff for this file is too large to render. See raw diff
 
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<CLS|LLM-jp>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<MASK|LLM-jp>",
25
+ "lstrip": false,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<PAD|LLM-jp>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "<SEP|LLM-jp>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json ADDED
@@ -0,0 +1,84 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "add_bos_token": true,
3
+ "add_eos_token": false,
4
+ "added_tokens_decoder": {
5
+ "0": {
6
+ "content": "<unk>",
7
+ "lstrip": false,
8
+ "normalized": false,
9
+ "rstrip": false,
10
+ "single_word": false,
11
+ "special": true
12
+ },
13
+ "1": {
14
+ "content": "<s>",
15
+ "lstrip": false,
16
+ "normalized": false,
17
+ "rstrip": false,
18
+ "single_word": false,
19
+ "special": true
20
+ },
21
+ "2": {
22
+ "content": "</s>",
23
+ "lstrip": false,
24
+ "normalized": false,
25
+ "rstrip": false,
26
+ "single_word": false,
27
+ "special": true
28
+ },
29
+ "3": {
30
+ "content": "<MASK|LLM-jp>",
31
+ "lstrip": false,
32
+ "normalized": false,
33
+ "rstrip": false,
34
+ "single_word": false,
35
+ "special": true
36
+ },
37
+ "4": {
38
+ "content": "<PAD|LLM-jp>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false,
43
+ "special": true
44
+ },
45
+ "5": {
46
+ "content": "<CLS|LLM-jp>",
47
+ "lstrip": false,
48
+ "normalized": false,
49
+ "rstrip": false,
50
+ "single_word": false,
51
+ "special": true
52
+ },
53
+ "6": {
54
+ "content": "<SEP|LLM-jp>",
55
+ "lstrip": false,
56
+ "normalized": false,
57
+ "rstrip": false,
58
+ "single_word": false,
59
+ "special": true
60
+ },
61
+ "7": {
62
+ "content": "<EOD|LLM-jp>",
63
+ "lstrip": false,
64
+ "normalized": false,
65
+ "rstrip": false,
66
+ "single_word": false,
67
+ "special": true
68
+ }
69
+ },
70
+ "bos_token": "<s>",
71
+ "chat_template": "{{bos_token}}{% for message in messages %}{% if message['role'] == 'user' %}{{ '\\n\\n### 指示:\\n' + message['content'] }}{% elif message['role'] == 'system' %}{{ '以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。' }}{% elif message['role'] == 'assistant' %}{{ '\\n\\n### 応答:\\n' + message['content'] + eos_token }}{% endif %}{% if loop.last and add_generation_prompt %}{{ '\\n\\n### 応答:\\n' }}{% endif %}{% endfor %}",
72
+ "clean_up_tokenization_spaces": false,
73
+ "cls_token": "<CLS|LLM-jp>",
74
+ "eod_token": "</s>",
75
+ "eos_token": "</s>",
76
+ "extra_ids": 0,
77
+ "mask_token": "<MASK|LLM-jp>",
78
+ "model_max_length": 1000000000000000019884624838656,
79
+ "pad_token": "<PAD|LLM-jp>",
80
+ "sep_token": "<SEP|LLM-jp>",
81
+ "sp_model_kwargs": {},
82
+ "tokenizer_class": "PreTrainedTokenizerFast",
83
+ "unk_token": "<unk>"
84
+ }