MJ和niji操作手册与咒语语法
一、快问快答
啥是Midjourney?也是基于latent diffusion算法的一种AI绘画实现方式,简称MJ。模型压缩技术,在尽可能不影响模型性能的情况下,通过删除模型中不重要的连接和节点来减小模型大小
啥是niji·journey?是MidJourney和Waifu合作推出的二次元模型,简称niji。
怎能画furry吗?MJ主打写实的兽人,niji画风更偏向二次元平涂(不严谨)。
怎么使用?discord公共频道或者私信机器人,需要T 子(电脑端推荐steam++,稳定免费,下载链接https://steampp.net/)。
怎么查看我已经生成的图片?https://www.midjourney.com/app/
在这个界面用discord登陆,能看到以往生成的图片还可以查询信息
但是!!所有的nswf(瑟瑟)关键词都不能输入!!!
(23年4月更新,好像现在不给白嫖了)价格档位?每个账号有25分钟的GPU时免费体验,大概能生成三十次。之后有$10、$30、$60三个价格档位,这里面推荐找四到六人拼一个$30的账号,fast模式15小时的GPU时(每个GPU时大概生成六十多张),无限制使用relaxed模式,高峰期需要排队速度慢,没啥人的时候基本跟fast模式一样快。
隐私模式?和机器人单独交互和隐私模式不是真的隐私,其他人在画廊还是能看到检索到的。真的检索模式需要使用$60的订阅后开启隐私模式,然后和机器人私聊或者在私有服务器里调用bot才行。
操作方式,进入discord后,在中文3频道,右上角#里找到furry就是咱们的中文furry频道了。
怎样操作?在有bot机器人的对话框输入斜杠/imagine或者输入斜杠直接点弹出的指令就行。
描述词?支持中文,但是是翻译器翻译成英文再送给算法的。小众词汇会出现翻译错误的情况,可以自己先试试翻一下,然后把可能出错的直接写英文。比如兽人,deepl翻译是orc,最好直接写furry或anthro。(23年4月更新,好像现在关闭中文输入了)
每次能同时生成几张图片?一个免费或30$用户最多三个图片生成线程,60$用户则是同时12线程。(23年4月批注,新注册账号已经取消免费体验了。$60的不是12个relax线程,只有fast模式才是12线程,relax模式也只有三线程)
另外,https://status.midjourney.com/可以查看当前服务器、画廊、bot的使用情况,可以根据当前等待时间自由切换fast还是relax模式。
绿色表示正常,黄色和红色表示拥堵或错误无法使用。
怎样快速上手?看完下面的语法后,再参考一下别人在频道里发的咒语。善用discord的搜索功能!哪个词拿不准了搜一下,看看别人用没用过、什么效果。看看别人的prompt都是什么结构,看看别人的语法。MJ和niji只要你用心学,三天就能速成,成为大魔法师。
如果发现本文档有错误或者有疑问请直接批注。
https://docs.qq.com/form/page/DSWxNYUhnS1dXUHRJ好的咒语记得存一下,频道里刷新的太快了,翻起来麻烦。
另外,如果你是一点都没接触过MJ的流程,我更推荐看这个系列视频快速上手https://space.bilibili.com/630876766/channel/series
最后是AI画兽人魔法全书的目录:https://docs.qq.com/doc/DSUtTRXhybndRQk53点击这里查看全部教学文档、咒语搜集。
二、操作和语法
https://midjourney.gitbook.io/docs/user-manual这是MidJourney官方的语法和使用方法。(aotu1111老哥,你看看人家的官方文档!写的多详细!不过WebUI免费开源,原谅你了)
有些语法在MJ和niji的不同版本可能无法使用,下面会说明。
/imagine 最基本的指令,根据您提供的提示文本创建图像(点击链接查看动画)。它生成一个由 4 张图像组成的网格,默认设置大约需要 50 秒。
(一)、文生图基本操作
生成图片后的界面如下,默认每张图由四张512x512拼接而成的1024x1024的图片,编号如图。
U代表放大重绘Upscale,可以把对应的图片放大优化,但是这种优化不是简单地把512放大到1024,而是相当于重新图生图,所以放大出来的内容会和四张图内部的小细节不一样,可能更好也可能更差,使用--uplight使放大时变化更少。(对于niji5和MJ V5来说,由于第一次生成的就是放大后的,所以U就是把那一张单独截取出来而已)
V代表变体Variations。将所选图像作为基础生成四张新图像,尝试保持整体风格和构图,不改变分辨率,修改的内容比U更多。
🔄 是为重做redo。无论在当前作业中执行了哪个操作,它都将再次运行。这可能会产生非常不同的结果,尤其是在重新运行/imagine命令时。
点击U之后生成的单张图片下方是这样的按钮。
Upscale to Max 进一步提高了放大图像的分辨率至最大(niji好像没有?有的,只有特定分辨率才会有)。
Make Variations 相当于V,将这张已经Upscale的图像作为基础生成四张新图像,尝试保持整体风格和构图,不改变分辨率。
Light Upscale Redo 将使用不同的方法重做放大,该方法尽量不向图像添加太多细节。如果您希望此方法成为默认的高档,请在您的/imagine命令的末尾添加--uplight。
Beta Upscale Redo 将使用更有效的方法重做放大,该方法从一开始就创建更高分辨率的图像。如果您希望此方法成为默认的高档,请在您的/imagine 命令的末尾添加--upbeta。请注意,此功能是实验功能,将来可能会被删除或发生重大更改。
分享和表达对这次作品的态度的表情,就顾名思义。善用表情评分!这个东西对于后期画廊整理图片很有用!
(二)、图生图基本操作
图生图(点击查看图生图的操作视频)
在对话中先上传一张图片,复制这张图片的链接。之后在/imagine 弹出的prompt框里把图片链接放到第一个就可以了。默认参考权重是图片比文字20:80。使用--iw 调整权重。
--iw <数字>设置相对于文本权重的图像提示权重。默认值为 --iw 0.25,即图片比文字的权重是20:80或1:4,设置为0不参考图片,设置为1各占一半。注意,--iw只能在MJ使用,niji无法调整图片和文字的权重。
图生图是最多可以支持五张图片的,在不同的版本中可能支持数量不一样。
(三)、MJ和niji的版本与型号的区分
先看一下对MJbot使用设置/settings的设置选项,我们可以看到,截止23年四月,MJ有五个大版本,niji有两个大版本。
先说大版本,niji是偏向二次元风格的模型,MJ则更加多元从写实到平面设计都可以画。MJ可以从v4开始用,v5则是主打超级写实的内容(这几个月网上那些以假乱真的伪照片都是MJ V5生成的)。对于画福瑞来说,niji v4和v5都是更偏向平涂和赛璐珞这样的二次元风格的,MJ V4基本只能画油画风格和写实、照片风格的兽人,但是MJ V5也是训练了很多美漫风格的兽人,也可以画偏美式风格的兽人了。(对于兽装的效果目前几个版本都不如Bing图像生成,只能说Dall·E2在训练的时候喂了很多(美式)兽装照片进去)另外MJ Test和Test Photo都是测试用的模型,一般用不到。
而每个大版本内部其实也是有不同的风格(微调的小版本),比如MJ v4有4a、4b、4c三个风格,可以在--v 4的基础上使用 --style 4a来开启MJ V4 4a,现阶段的MJ v4默认是4C。再比如niji5也有四个还是五个小版本,每个风格都不太一样。其实很难说哪个小版本更好,只能说哪个小版本更擅长什么,比如niji5最开始的默认版本画日漫风二次元平涂赛璐珞这些很好,画手也很好,唯一的问题就是过于爱画手了,没有写手部动作的时候它也喜欢把手拿出来给你炫耀一下hhh。
另外选择两次版本,就会去掉默认后缀,比如说在有默认后缀--v 5的时候,即使我输入--v 4,bot也会在--v 4之后再加一个--v 5,覆盖掉我突然想要的v4版本,而如果我选择两次默认版本,就变成了如果我不指定后缀就是我默认的版本,如果我输入版本就是我输入的这个版本而不是用默认版本去覆盖。
(四)、更多绘图相关的操作和语法
在/imagine 绘制过程中加在prompt末尾的参数修改,请根据实际情况修改参数。使用英语连字符--引出输入的参数,再加入一个空格输入修改的数字。
Mid和niji不使用括号表示权重增减,使用的是::<数字>语法(英文冒号)。数字越大权重越大,不写默认为1,值为-0.5时等效于--no 语法。其中数字必须是正数,v4之前的模型不支持小数。值得注意的是,::会改变前面所有词汇的权重为你给定的值,直到另一个冒号停止。另外::后不加数字可以作为切分符,用在两个词的中间进行语义切分,比如hot dog是热狗(吃的),hot::dog是热的狗(狗很热)。也就是说如果只有一个英文双冒号,那它会吧前面所有的词都认为是一个权重,如果是有两个双冒号,那么就会分成三个段,第一个双冒号之前的权重都是第一个双冒号的权重,两个双冒号之间的词汇都是第二个双冒号后的权重,第二个双冒号之后的词是默认权重。在格式上双冒号之前有空格,双冒号和数字之间没有空格,数字之后有空格。
--no 后填写负面描述词(Negative prompt)等效于文本提示权重使用::-0.5。--no 不想要的描述词1, 不想让它生成的描述词2 放在后缀的最后。
--aspect 或--ar <数字1:数字2>生成具有所需纵横比的图像。例如,尝试 --ar 16:9,以获得 16:9 的纵横比(448x256)。
--w <数字>和--h <数字>分别设置图像的宽度和高度。更多情况下直接使用--ar就好。--h 和 --w 使用的值应介于 256 和 2034 之间。同时请记住,最大upscale分辨率约为 300 万像素。这些值作为 64 的倍数效果更好(或 128 表示--hd)。(niji好像任何一个版本都不支持w和h的语法,只能ar)
--seed 设置种子,这有时有助于在尝试再次生成类似提示时保持更稳定和可重现。它必须是正整数(0到4294967295(232) 之间的任何整数)。如果不使用,后台将选择一个随机种子。你可以用✉信箱看到作业的消息,以了解使用了什么种子值。其次,只有初始四宫格的seed才有意义,后续升档upscale之后的种子就没法使得初始四宫格
--sameseed 使种子以相同的方式影响生成的网格的所有图像。如果不使用,网格中的每个图像将使用种子的不同“切片”,从而提供更高的多样性。(v5暂时还不支持)
--quality <数字>,或--q <数字>您要花费多少渲染质量时间。只有0.25、0.5、1、2、5这几个有效值,默认值为 1。q越高细节越多,生成时间越长,也要花费更多的GPU时长,但细节更多不一定效果更好,请根据实际效果设置。
--chaos <数字>,或--c <数字>结果会有多多样化、随机和不同。必须介于 0-100 之间。更高的值将有利于更有趣和不寻常的迭代,以换取不太可靠的结果。chaos是控制出的第一次四张四宫格不同的图片的差别的,这个值越大,四张图的差别和风格也就越大。
--fast 更快的图像,更少的一致性,更便宜。您也可以使用 --q 0.5 和 --q 0.25获得类似的结果,见下文。
--stop <数字>生成到百分比后停止生成。必须介于 10-100 之间。这目前不适用于upscales。
--video 保存进度视频,该视频在触发的 DM 中通过邮件✉️发送给您(您必须对信封做出反应才能获得视频链接)。这目前不适用于upscales。
--uplight 在选择 U 按钮时使用“light”升频器提升分辨率。使结果更接近原始图像,在放大过程中添加的细节更少。非常适合面部和光滑表面。
--upbeta
--styleize <数字>或--s <数字>风格化,625到60000之间的任何整数,默认2500。设置625关闭风格化,除此之外还常见1250、2000,值越高风格越明显,但是参考描述词的成分越少。(好像不能在niji上用?)
-- tile 生成无缝贴图,生成的图片像瓷砖一样拼到一起看不出来边界,不断循环。生成的图片可以在https://www.pycheung.com/checker/查看拼接为大图。
/preferred及其相关指令可以快捷输入
/prefer suffix 指令可以记录一系列默认参数,只能记录--开头的后缀。
/prefer option set 创建个人选项,然后在您调用它时通过直接写--就等效于您输入一大堆参数。需要删除时输入/prefer option set 就可以删除该预设。
发送信封emoji ✉<数字> 可以获取单张图片和种子、jobID,不写数字则单独发送每张图片(U模式里发送单张)
⭐️ emoji把图片添加收藏夹,在mid网站(链接在上文)的画廊内查看。
❌ emoji取消正在生成的项目。
(五)、其他绘图以外的操作和设置
/setting 设置。在这里的设置则是的默认参数。MJ version 是MidJourney的版本(--v),三个quality是默认质量(--q ,half是0.5,base是,high是2),四个Style是默认风格化等级(--s ,low是1250,med是2500,high是5000,very high是20000),upscale是默认U的模式选择(--uplight) ,Public/Private mode是公共/隐私模式(不充会员没用),Fast/Relax mode是生成速度。Remix mode开启后当你在生成图片后点击V或Variations时可以进一步修改prompt,关闭后则是沿用旧的prompt不能修改。建议开启。
/help 显示有关Midjourney Bot的普遍有用的信息和提示。
/info 显示有关配置文件、计划、使用情况和当前正在运行的作业的信息。使用这个查看生成了多少图像,还有多少余额。
/subscribe 会创建一个指向您当前Discord帐户的订阅页面的唯一链接,而无需登录网站。
/describe 根据图片逆向出咒语。选择一张图片上传,让MJ或者niji描述这张图片可能用到的咒语,体系也是MJ的咒语格式,会给出四个可能的咒语。但是/describe 不能像SD的图片浏览那样完全读出这张图片的原始的咒语,实测同样是MJ生成的图片,描述出来的咒语都和我输入的prompt不一样,但是还是比较像的。
/fast 和 /relax 在“快速”和“放松”模式之间切换。在快速模式下,如果作业中断,作业将按增量计费。在放松模式下,您的作业不会花费成本,但需要更长的时间才能生成。只有有效的标准和企业计划才能进入放松模式。(备注:上面是原文,实际使用中请根据你用户上的余额选择,慢速模式只要上机开始运行和快速模式一样快,但是在作业多的时间段会排队)
/show 在图库中恢复作业的 ID 后,您可以在聊天中再次召唤该作业,生成生成的图像和高档U+变体V按钮。这使您可以基本上恢复自己生成的任何工作,将其引入任何机器人渠道以在那里生成高档和变体,即使您无法访问原始消息。
/private和/public在“专用”和“公共”模式之间切换。在私有模式下,您的作业仅对您可见。在公共模式下,您的作业对库中的每个人都可见,即使您是在线程或 DM 中创建作业也是如此。访问私人模式每月额外收取 20 美元(交了20$的隐私模式才是真·隐私模式,不要随便上传私密图片)。
/invite邀请他人加入niji服务器。
(六)、MJ画廊的使用方法和进阶操作
MJ和niji的图片都可以在画廊找到https://www.midjourney.com/app/需要用同一个discord账号登陆。画廊很好用,但是服务器不稳定,时不时抽风,你在discord上能正常生成,但是画廊打开了点任何东西没反应。。。
首推一个教学视频https://www.bilibili.com/video/BV1kG4y1F7kY因为篇幅限制,我没法把所有操作都截图放到文章里,所以大家可以看视频快速学习。
1、个人主页
(左侧功能栏的Home)
(1)个人主页最上方是检索框,可以用咒语或者job ID搜索,右侧是刷新和批量选择模式的按钮。
(2)搜索框下方有你的头像和名字,你可以在这修改名字,查看生成图片的总数量,查看你关注的用户。右侧Rate Jobs是对对你生成的图片进行评级和反馈,用以帮助他们改进算法(好像你反馈后可以得到一些免费的fast时长)再右边Archive则是按照时间轴快速查看你的图片,在这个界面你可以快速定位某一天的作品并批量下载或收藏。右侧三个点是访客模式和默认显示设置。
(3)善用收藏夹collection功能,收藏夹可以方便的对某个题材或者咒语的图片进行归档,便于后期浏览和查找。
(4)善用图片的排序和筛选功能。左侧是排序功能,分别是最热、最新、收藏最多和最喜欢,这四个功能都是在画廊展出后用户做出的评分(包括你自己)或者算法觉得你的作品应有的评分。右侧是筛选功能,分别是全部,Grids四宫格(输入咒语出现的原始四张图),Upscales升档(点U之后的图片)最右边的四个表情分别是未做表情回复、不喜欢、喜欢、超爱,这些都是你在discord上或者画廊图片页面的表情回复。
2、图片功能
图片功能其实很简单,只要能看懂英语就没问题。
默认模式下我们把鼠标悬停在图片上会显示图片信息,鼠标放在上图红色的部分会显示一个加号,点击一下可以快速选中prompt,右侧则是显示生成的时间。左下角是生成的用户,右侧三个点的菜单里面有copy复制(full command全部指令,prompt咒语,job ID图片生成ID和seed种子)、在(discord界面或者新界面)打开这张图片、作为(简介图片或简介封面)、反馈(向官方反馈(比如出现暴力血腥之类的)或不要显示这张图片)、Add to collection添加到收藏夹、Favorite红心、保存等功能。三个点右侧的搜索很好用,可以用这张图片检索其他用户生成的类似的图片。最右侧的表情还是上面说过的用表情rank评级(hate/dislike/like/love)。
点开图片后来到图片详细信息界面。下面是一张升档后的图片的界面:
界面也是简单易懂,图片下方生成者旁边有关注按钮,右侧的四个图标跟上面一样简单易懂。
下方prompt每个逗号之间的词都是可以点击直接查看图片和搜索的。
再下方是升档图片的来源parent(也就是这张图片是从那张图片处理得来的,可以无限嵌套)和信息info,你可以看到图片尺寸日期和速度模式,还有--开头的指令。在一些图片的prompt旁边还会有#tag,可以点击查看。
最下方是探索社区里和这张图有联系的图片,很有用!如果你对这个咒语的题材感兴趣或者对现在的效果不满意,可以看下别人是如何优化的。
3、社区功能
社区功能虽然是MJ最强大的地方之一,但是经常会卡顿(有时候图片生成没卡,但是社区没法用了)。图标前面都讲过了,请善用搜索功能!很有用!
4、其他功能
在左侧功能栏的settings设置里可以更改图片卡片的尺寸,还有卡片和页面的布局,你可以试试找到你自己喜欢的布局。
Rank Pairs是用来给MJ做人工选择的,在这你可以在两张图片选择好的那一幅或者跳过和举报,这样让用户来标注生成的作品可以调教AI画的更好更符合大众口味。标注的多了可以获得40$的fast GPU使用时间。
Mansge Sub是管理订阅,这里不再展开。Help&FAQ是帮助界面和说明文档。About&Careers是工作人员名单和招聘(他们居然只有十一名全职员工)。Notifications是消息,有人给你评分点赞或者关注你了在这会有显示。最下方是你的账号
右侧三个点有管理订阅、查看通行证(没啥用但是挺好看)、进入discord服务器和退出登陆。
三、应用与实验记录、进阶用法
1.修改权重的语法::
修改权重的语法::是改变前面全部词汇的权重,不是逗号隔开的单独词汇。
这里只用::-0.5语法表示图片中不要出现rabbit兔子,所以出现的兽人就没有兔子(基本都是犬熊科)。
之后调换了Rabbit和furry anthro的位置,而furry anthro和Rabbit一起从图片中消失了,说明::-0.5对二者都起作用了。
2.找到图片的seed种子
在生成图片右上角选择发送表情,在表情弹窗中找到envelope信封,点击发送后看到左下角有信封标志就说明这个线程的工作信息已经私信DM到你和niji的机器人的私聊对话里了。
在私聊里就可以看到图片的种子
更多的关于::的用法可以参照【3.6 - midjourney 之权重切分符与负面描述词反向描述词 --no 教学】 https://www.bilibili.com/video/BV1bM411j77X
3.使用Job ID召唤以前的图片作业
如果以前生成过一个很好的图片(或者是别人生成的图片),可以使用Job ID重新召唤到新的队列中继续进行生成或修改。
获取Job ID的方式有两种,第一是发送信封私聊发送,另一种是在MJ官网画廊里找到Job ID。
然后我们就能召唤出以前的工作进程了:
4.使用Remix mode模式下的V或Variations进行微调
先用/setting打开设置,选中Remix mode,之后看图
5.在微调过程中C取值的选择
原图还是上面那张,c的取值范围是0到100,让我们看看加了crying face后的每个c取值的效果:
上图是没有写c取值的,下图是c取1的,左下角第三张的表情就很好了,但是服饰颜色和细节跟原图有很大差距。
下面是c取50和99时,可以看到构图已经发声较大的变化,所以在绘制差分时,c的取值基本是越小越好。
6.保证图片连续性
相似的描述词+同一个seed可以使得图片的主体角色变化幅度很小
但是当我们需要画面有很大变化的时候还能保证角色变化幅度很小要怎么做呢?下面提供一些思路:
在确定角色形象的时候可以用自己的oc垫图(如果没有oc可以用你想要的固定角色形象,也可以是你之前在生成中抽出来的喜欢的形象),确定一套基本的描述词(描述你的形象的最简描述,不包含表情背景以及行为动作之类的?),并确定最好的图片对应的seed。
之后想要这个角色在复杂场景或者做某个事情,都可以用这一套基本描述词作为起手式,用形象图片图生图,用seed控制总体(如果场景变化过大也许可以不用seed)。对于复杂场景可以先生成一个你想要的场景(或者从本地上传一个你想要的场景),然后用两张图喂进去,加上基本起手式图生图。对于动作可以直接喂一张图+起手式+动作描述。
但是注意,上述操作的有效性都不算特别高,需要大量的试错和微调才可能找到你想要的效果。
7.善用社区功能和描述功能,以图搜图找到想要的咒语
善用社区功能和描述功能,以图搜图找到想要的咒语。
两个非常好的功能,一定要善加利用,提升你找咒语的能力。
第一个就是/describe ,有哪个图你想要得到类似的画风或者内容,就直接丢进去让他描述,给出来的结果很有可能让你惊喜。
第二个是社区的找图片功能,这里面我觉得最好用的反而不是搜索,而是图片浏览的推荐类似图片,对于那些你想要有高质量,但是总是得不到想要的效果的情况下,去看看这张图片的关联结果,有时就能找到社区里的优质图片和咒语,进而根据别人的咒语来改进自己的。