第2回:
花に変身!?「強度」について学ぼう

こんにちは!ぼくは、インフロニア・ホールディングスのスポークスマン「キャレたん」!
今話題の生成AIという技術は便利だけど、著作権などいろいろとクリアしなくてはならない課題があるよね。
僕もそういったことを守った上で、使いこなしたいんだ。
第2回では、画像生成AIでつくりたいものによって、
上手につくれるものとつくれないものがあるのか
どんな工夫をすればイメージ通りになるのかを学ぼう!

前回のおさらい

前回(第1回)では、「キャレたん画像生成AIモデル」をつくったよね。
このモデルはキャレたんの特徴を学んでいて、それらの特徴を反映した画像を生成できるようにしたものだよ。
具体的には、「ファインチューニング」という方法を使って、“画像の数・ポーズ・表情・背景の色・学習回数”といった要素を調整しながらモデルをつくったんだ。

第1回はこちら

今回のもくじ

今回は画像生成AIモデルにどのように画像を出力してもらうか勉強(座学編)してから、 ”強度”という項目の調整して4パターンの画像をつくって、その違いを確かめていくよ(実践編)

1.画像生成AIモデルにテキストを入力しよう!

まずは座学編から!
画像生成AIモデルは入力されたテキストをもとに以下の流れで画像を出力するんだ!

  • 入力:作成したい画像をテキストで入力
  • 変換:入力テキストを画像生成用の数値情報に変換
  • 出力:変換された数値情報をもとに画像を生成し出力
でもテキストだけじゃなくて他にも設定しなきゃいけないものがあるみたい・・・?

2.”強度”でバランスを調整しよう!

テキストの入力以外に設定する必要があるのは”強度”と呼ばれるものなんだ!
強度っていうのは出力する画像に対する「テキストの影響度」や「画像生成AIモデルの影響度」を指すんだ。

黒板の図の場合は、”テキスト”のパラメーターは「強」に寄っているから、入力したテキストの特徴が画像に出やすいんだ
”画像生成AIモデル”のパラメーターは「弱」に寄っていて、画像生成AIモデルの特徴が画像に出にくいってことだね!

強度はテキストを入力するタイミングで設定するんだ!
次の実践編ではテキストを入力して、強度の強弱を設定しながら、それぞれの強度が画像にどのような影響を与えるか検証してみるよ!

3.【強度】テキスト:弱 画像生成AIモデル:弱の場合

次は実践編だね!座学編で学んだ通り、テキストを入力して、強度でバランスを調整しよう!前回作成した「キャレたんAIモデル」を使用して画像を生成していくよ!
ぼくはインフラの周りに咲いている花が大好きだから、テキストは“きれいな一輪の花”にして、強度はテキストを”弱”キャレたんAIモデルも”弱”で設定するよ!

まずは1枚目!    

   

中心部に小さな花びらが密集していく感じがテキストの「花」の要素が出ているね!
色は赤とかではなく、ぼくの色に近いように見えるね!ということは、キャレたんAIモデルである「ぼく」の要素も出ているから、テキストとキャレたんAIモデルのどちらの要素も出ていることが分かるね!    

4.テキスト:強 画像生成AIモデル:強の場合

今度は、強度をテキストを”強”キャレたんAIモデルも”強”で設定するよ!
画像生成AIモデルを“強”にするということはぼくの特徴が出やすいのかな?

花というよりキャベツみたいになったかも・・・えこれぼくかな・・・?    

   

でもよく見てみると、波を打つような曲線や周りに付いている葉っぱはテキストの「花」の要素が出ていると思うね!
真ん中の大きなクリクリとした目はキャレたんAIモデルの要素も出ているみたいだ!
「テキスト:弱 キャレたんAIモデル:弱」と「テキスト:強 キャレたんAIモデル:強」のように両方の強度の強さが同じなら両方の要素が出るのかな?
よ~し!次は一方を強くして、一方を弱くして検証だ!    

5.テキスト:強 キャレたんAIモデル:弱の場合

今度は、強度をテキストは”強”キャレたんAIモデルは”弱”で設定するよ!
どちらかを強めることでどんな違いが出てくるのかな?ワクワクするね!

そのまんま花だ!ぼくはどこにいったんだ!!    

   

テキストの「花」の要素がとても強く出ているね!さらに「一輪の」というところも再現しているね!!
言うまでもなく、キャレたんAIモデルの要素が全くないね。今回はテキストの要素に極端に偏ったことが分かったし、次は画像生成AIモデルの強度を強めよう!    

6.テキスト:弱 画像生成AIモデル:強の場合

最後はテキストを”弱”キャレたんAIモデルは”強”で設定するよ!
キャレたんAIモデルを“強”にするからぼくらしさが出ているといいな~

ぼくがそのまま出ている・・・!    

   

テキストの「花」の要素は上手く出ていないね・・・ぼくがそのまま出てきたみたいな感じだから、キャレたんAIモデルに偏っているな~
「テキスト:強 キャレたんAIモデル:弱」と「テキスト:弱 キャレたんAIモデル:強」で分かったことは強度を“強”にした方の要素が出やすいってことだね。
よ~し最後にまとめだ!    

7.まとめ

今回の座学編では、画像を生成するには「テキスト」を入力して、「強度」を設定する必要があることと、さらにその「強度」はテキストとキャレたんAIモデルでそれぞれ設定できることを学んだね!

実践編では、「テキスト:弱 キャレたんAIモデル:弱」や「テキスト:強 キャレたんAIモデル:強」のようにテキストとキャレたんAIモデルを同じ強度にすると、テキストの要素とキャレたんAIモデルの要素も両方が出ることを発見したね!

逆に「テキスト:強 キャレたんAIモデル:弱」と「テキスト:弱 キャレたんAIモデル:強」のように異なる強度にしたときは、強度を”強”にした方の要素が強く出ることを発見したね!

だから、“同じ強度”か“異なる強度”に設定するかによって、出力のされ方は大きく分けて2つに分類されることが分かったね!

今回つくった画像では満足できる出来ではなかったな・・・だからもっともーっと画像生成AIについて勉強しなくちゃ!
そう思って強度以外に設定できるところはないか調べてみたんだ!
調べたところどうやら今回登場した「テキスト」は専門用語では「プロンプト」といって、もっと細かく画像生成AIに指示を与えられるみたいなんだ!
次回はこの「プロンプト」について解説するね!    

   
サカモト

技術担当からのひと言

はじめは思ったとおりの画像がなかなか出ない歯痒さもありますが、
思ったとおりの画像がすぐに出てしまっては、それはそれでつまらないものです。

他の記事はこちら(全6回)

1 2 3 4 5 6
前回へ 次回へ