【記事】上部

広告 AI 画像系AI

【LoRA】実践付き! 初心者の方にも分かりやすいLoRAの使い方解説!【SeaArt】【AI画像生成】

この記事は2024年に公開したものです。

今回ご紹介する方法は、SeaArtというAI画像生成サイトを使用して説明しています。
ただ、LoRAはAI画像生成全般で活用できるテクニックですので、SeaArt以外で活動している方も是非参考にしてみてください。

LoRAに使用する絵は作者が使用を許可しているものか自分で作成したものにしましょう。
著作権の存在する絵をLoRAに使用した場合トラブルに発展する可能性もあるので要注意です。

AIで思い通りに画像生成する際に欠かせないものそれが「LoRA」というものです。

筆者自身もまだ画像生成を初めて日が浅いですが、それでもLoRAの重要性は体感していますので、今回は実践を交えて紹介いたします!

LoRAについて

「LoRA」とは「Low-Rank Adaptation」の略です。

そして「Low-Rank Adaptation」とは、少ない計算量で大規模な言語モデルを効率的に調整できる学習モデル......らしいです。

なんのこっちゃ

LoRAとはAI技術に関する重要な用語らしいですが、とりあえず画像生成AI的には少ない枚数の画像を読み込ませることでその画像に寄せて描写するという認識で良いでしょう。

言葉だけではイマイチ説明がしづらいので、まずは↓の画像をご覧ください。

↑の画像は、↓のプロンプトで作られた画像です。

プロンプト

master piece, 8k, high quality, red scared samurai armor, samurai female, tomboy, gallant female, big breasts, short hair, scared on face

「samurai armor」と書かれているにもかかわらず、だいぶ軽装というかまぁ鎧では無いですよね。

そんな「うーん、AI多分鎧(甲冑)のこと分かってないな......」という時に役に立つのがLoRAなんです!

SeaArtをはじめ、生成AIはスーパーすごい能力を持ったテクノロジーです。

しかし人間が思う「○○を描いてって言ったら、大体◇◇なものが返ってくるでしょ」という感覚にはなかなか答えてくれず、どこか「ズレ」が存在します。

そんなAIに「参考資料」としてLoRAを渡すことで、描写してほしいもの(プロンプト)に対するAIの解像度・理解度を高めてより高精度な画像生成が可能となります。

つまり人間⇔AIの間での「ズレ」を減らすのに使えるわけです。

LoRA の種類について

LoRAには大まかにいくつかの種類に分けられるので、まずそちらをご紹介いたします。

生成する画像の画風(絵柄)に影響を与えるLoRAです。

これらを使用することで、生成する画像を選択したLoRAの画風(絵柄)に寄せます。

生成する画像の背景に影響を与えるのが「風景LoRA」です。

生成する画像の人物が身にまとう服に影響を与えます。

こちらは衣服と被りがちですが、画像で描かれる人物の属性(人種・種族)に影響を与えます

著作権の存在する絵をLoRAの学習画像として使用したり、著作権を侵害しているとハッキリしているLoRAを使用するのは控えましょう。

登場人物の姿勢・態勢(ポーズ)に影響を与えます。

LoRAの使い方

ここからは、実戦形式でLoRAの使い方をご紹介します。

LoRAのメニューを開く

まずは、SeaArtの「画像作成モード」右側のメニューから「LoRA」を選びます。

すると、↓のようなウィンドウが出てくると思います。

モデルを選ぶ画面と非常に似ていますが、ちゃんとLoRAを選ぶ画面になっているのでご心配なく!

自分に必要なLoRAのモデルを選ぶ

上のに現れたモデルの中からLoRAとして使うものを選ぶのですがそもそもどうやって選べばいいのでしょうか?

それは

生成する画像に必要な要素が描かれているモデル

を選びましょう。

具体的な例を挙げますと、例えば今回の私の場合は「AIが鎧(甲冑)を上手く描写してくれない」という悩みがあります。

なので、AIに「鎧(甲冑)とはどういうものか」を理解させるためのモデルを探します。

LoRAの検索バーから「samurai」と入力したら、良さげなものがあったのでそちらを使用します。

LoRAを設定して画像生成

表示されたモデルを選択してLoRAとして使用します。

すると、↓の赤線で囲った場所の数字が気になりますね。

これは、LoRAで選択したモデルの強度を決めるための数値です。

「モデルに引っ張られて性別まで変わってしまう」「絵柄がLoRAのモデルに寄りすぎている」という場合はこの数値を下げた方が良いでしょう。
「LoRAで選択したモデルの要素が反映されていない」なら、この数値を上げてみましょう

ただし数値が高くても低くても極端な値だと画像が崩れやすいという点には注意です。

初期設定の「1」だと強すぎるという場合が多いので、今回は少し減らして「0.8」で生成します。

もちろん、プロンプトは最初に生成したものと同じです!

プロンプト

master piece, 8k, high quality, red scared samurai armor, samurai female, tomboy, gallant female, big breasts, short hair, scared on face

生成中......

かなりちゃんとした鎧だ!

LoRAなしで生成したものと見比べてみましょう

比較

どうでしょう、同じプロンプトなのにこの違い、LoRAってすごくないですか!?

トリガーワード について

LoRAには「トリガーワード」というものが存在します。

赤枠で囲っているの「トリガーワード」です

トリガーワードとは一般的に

LoRAを適用するために含ませておくべきプロンプト

のことだと言われています。

入力したプロンプトの中にトリガーワードが入っていることが引き金(トリガー)となって、LoRAが使われるというわけです。

ただ......どうやらSeaArtではトリガーワードを入れなくてもLoRAを選択するだけで反映されるっぽいので、そちらを検証してみました。

  • LoRAなし
  • LorAあり・トリガーワードなし
  • LoRAあり・トリガーワードあり

の上記3パターンで画像生成して試していこうと思います。

使用するLoRAモデルは、先ほども使いました「Samurai armor(Japan)」です。

まずはLoRAなしで行います。

プロンプト

a gallant female, holding a sword, tomboy, big breast, short hair, glare, look at view

生成中......

十分満足な画像が生成されましたがプロンプトに書いてないので当然「武士感」は皆無ですね。

次はLoRAありトリガーワードはプロンプトに入れません

プロンプトは【条件1】と同じです。

プロンプト

a gallant female, holding a sword, tomboy, big breast, short hair, glare, look at view

生成中......

LoRA効いてね?

プロンプトには「武士・侍・甲冑」などのプロンプトは要れてないのに、急に鎧を身にまとい始めました。

当然トリガーワードを入れてないので、LoRAが効いているとしか思えません

トリガーワード = LoRAの起動に必要 という式が崩れますがはたして.....

最後は「LoRAあり・トリガーワードあり」です。

上2つのプロンプトに、今回使用しているLoRAモデルのトリガーワードを記述しました。

プロンプト

samurai, armor, a gallant female, holding a sword, tomboy, big breast, short hair, glare, look at view

生成中......

抜群に武士感が増しました。
まぁ、トリガーワード云々の前に「samurai, aromor」というプロンプトを入れているので当然かもしれませんが......。

トリガーワード は必要なのか?

トリガーワード無しLoRAでも武士要素が画像に入って来たのが気になります。

トリガーワード入れる意味ある......?

なので、ほかのLoRAモデルでも上でトリガーワードあり/なしで試してみました

M_Pixel 像素人人

絵柄をピクセル調にするLoRAモデルです。

トリガーワード:pixel

プロンプト(トリガーワードなし)

samurai, armor, a gallant female, holding a sword, tomboy, big breast, short hair, glare, look at view

トリガーワードなし

トリガーワードあり

調整不足で画像が崩れ気味ですが、トリガーワード無しでもしっかりpixelになっていますね。

M_Pixel 像素人人

キャラクター再現系のLoRAモデルです。

トリガーワード:asagi, bodysuit

プロンプト(トリガーワードなし)

samurai, armor, a gallant female, holding a sword, tomboy, big breast, short hair, glare, look at view

トリガーワードなし

トリガーワードあり

こちらも調整不足で画像が崩れていますが、プロンプトには一切元キャラを思わせる要素が無いのにアサギっぽくなっています。

結論:SeaArtにおいては、トリガーワードを入れなくてもLoRAで選択したモデルは画像に影響する。

そのことを踏まえて筆者が出した答えは

トリガーワードが自分の生成したい画像と大きくかけ離れていなければ、とりあえず入れておいてOK。

という感じです。

あくまで一般ユーザーの一つの意見に過ぎないことをご了承くださいませ!

さいごに

今回はSeaArtを使った実戦形式で、LoRAの使い方の解説をしました。
初心者の方にも分かりやすいよう心掛けたのですが、いかがだったでしょうか?

LoRAを使えば、自分がどんな画像を作ってもらいたいのかをAIに効果的に伝えることができます

ぜひ、この優れた機能を使って画像生成を楽しんでください!

    人気の記事

    1

    種類が、種類が多すぎる...!

    2

    「カスタムオーダーメイド3D2」にMODを導入する解説記事。
    今回は「しばりす2」編です。

    -AI, 画像系AI