File size: 5,988 Bytes
a6a893a
 
 
 
 
 
 
 
 
 
 
 
 
4ae3ea5
 
 
 
 
 
a6a893a
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
# Untitled Model Card

# はじめに
Untitledは、AIアートに特化した画像生成AIです。

# 使い方
Web UIをインストールしてください。
Stable Diffusion v2 の使い方と同じく、safetensor形式のモデルファイルを[ここ](v1-1.safetensor)からダウンロードし、モデルフォルダに入れてください。
詳しいインストール方法は、[こちらの記事](https://note.com/it_navi/n/n6ffb66513769)を参照してください。
なお、xformersをインストールし、--xformers --disable-nan-checkオプションをオンにすることをおすすめします。そうでない場合は--no-halfオプションをオンにしてください。

# サンプル


# 配布の目的について
このモデルはNovel AI Diffusionから漏洩したモデル、また、そこから派生したモデルの利用を停止することを目的に作られました。
このモデルはDanbooruのようなサイトのデータを学習データに直接用いていません。
しかしながら、それらを用いたモデルをマージすることで間接的に用いていることになります。
目的のためには手段を選ばない方法をとっていますので、あらかじめご了承ください。

以下、一般的なモデルカードの日本語訳です。

## モデル詳細
- **モデルタイプ:** 拡散モデルベースの text-to-image 生成モデル
- **言語:** 日本語
- **ライセンス:** CreativeML Open RAIL++-M-NC License, AGPL-3.0
- **モデルの説明:** このモデルはプロンプトに応じて適切な画像を生成することができます。アルゴリズムは [Latent Diffusion Model](https://arxiv.org/abs/2112.10752) と [OpenCLIP-ViT/H](https://github.com/mlfoundations/open_clip) です。
- **補足:**
- **参考文献:**

      @InProceedings{Rombach_2022_CVPR,
          author    = {Rombach, Robin and Blattmann, Andreas and Lorenz, Dominik and Esser, Patrick and Ommer, Bj\"orn},
          title     = {High-Resolution Image Synthesis With Latent Diffusion Models},
          booktitle = {Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)},
          month     = {June},
          year      = {2022},
          pages     = {10684-10695}
      }

#### 想定される用途

- 自己表現
    - このAIを使い、「あなた」らしさを発信すること
- 画像生成AIに関する報道
    - 公共放送だけでなく、営利企業でも可能
        - 画像合成AIに関する情報を「知る権利」は創作業界に悪影響を及ぼさないと判断したためです。また、報道の自由などを尊重しました。
- 研究開発
    - Discord上でのモデルの利用
        - プロンプトエンジニアリング
        - ファインチューニング(追加学習とも)
            - DreamBooth など
        - 他のモデルとのマージ
    - 本モデルの性能をFIDなどで調べること
    - 本モデルがStable Diffusion以外のモデルとは独立であることをチェックサムやハッシュ関数などで調べること
- 教育
    - 美大生や専門学校生の卒業制作
    - 大学生の卒業論文や課題制作
    - 先生が画像生成AIの現状を伝えること
- Hugging Face の Community にかいてある用途
    - 日本語か英語で質問してください

#### 想定されない用途
- 物事を事実として表現するようなこと
- 収益化されているYouTubeなどのコンテンツへの使用
- 商用のサービスとして直接提供すること
- 先生を困らせるようなこと
- その他、創作業界に悪影響を及ぼすこと

# 使用してはいけない用途や悪意のある用途
- デジタル贋作 ([Digital Forgery](https://arxiv.org/abs/2212.03860)) は公開しないでください(著作権法に違反するおそれ)
    - 特に既存のキャラクターは公開しないでください(著作権法に違反するおそれ)
- 他人の作品を無断でImage-to-Imageしないでください(著作権法に違反するおそれ)
- わいせつ物を頒布しないでください (刑法175条に違反するおそれ)
    - いわゆる業界のマナーを守らないようなこと
- 事実に基づかないことを事実のように語らないようにしてください(威力業務妨害罪が適用されるおそれ)
    - フェイクニュース

## モデルの限界やバイアス

### モデルの限界

- 拡散モデルや大規模言語モデルは、いまだに未知の部分が多く、その限界は判明していない。

### バイアス

- 拡散モデルや大規模言語モデルは、いまだに未知の部分が多く、バイアスは判明していない。

## 学習

**学習データ**

Danbooruなどの無断転載サイトを除く、国内法に準拠したデータ。
Waifu Diffusion 1.5やIlluminati Diffusion 1.0などのモデル。

**学習プロセス**

- **ハードウェア:** A6000

## 評価結果

第三者による評価を求めています。

## 環境への影響

- **ハードウェアタイプ:** A6000
- **使用時間(単位は時間):** 300
- **学習した場所:** 日本

## 参考文献
    @InProceedings{Rombach_2022_CVPR,
        author    = {Rombach, Robin and Blattmann, Andreas and Lorenz, Dominik and Esser, Patrick and Ommer, Bj\"orn},
        title     = {High-Resolution Image Synthesis With Latent Diffusion Models},
        booktitle = {Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)},
        month     = {June},
        year      = {2022},
        pages     = {10684-10695}
    }

*このモデルカードは [Stable Diffusion v2](https://huggingface.co/stabilityai/stable-diffusion-2/raw/main/README.md) に基づいて、AI Picasso株式会社がかきました。