コンテンツへスキップ

画像生成AI (Image Creator)

  • by

Image Creator

最近ネットでは画像生成AIを利用した画像が目立つようになってきました。クリエイターにとって画像生成AIはこれまでにない進化だと思います。
今後、どれだけ手助けになるのか、それとも脅威になるのか現時点では未知数です。

そこでいくつかの画像生成AIを試してみました。今回はMicrosoftのImage Creator

Image CreatorのエンジンはOpenAI社のDALL-E3という画像生成AIのようです。もちろんOpenAI社のChatGPT plusでも利用されています。

OpenAI社の最高経営責任者サミュエル・H・アルトマンが解任され、Microsoftに入社したということで、今後両社の関係も気になるところです。

早速試してみました。

写真の生成

プロンプトに
”アジア系の選手が卓球競技をしているリアルな写真”と入力、生成してみました。

アジア系と入れたのは欧米人ではないモデルを期待したワードです。

素晴らしいモデルの写真3枚を生成してくれました。ただ、女性以外、筋肉質過ぎる点がひっかかり、もう少し普通の人にならないか入力を修正してみることにしました。

プロンプトに
”アジア系の素人の選手が卓球競技をしているリアルな写真”と追加して入力、生成してみました。

人物は良い感じになりましたが素人としてしまったので服装がラフになってしまいました。
ユニフォームは着せたままと思い、

再度プロンプトに
”アジア系の素人の選手がユニフォームを着用し卓球競技をしているリアルな写真”と変更して入力、生成してみました。

ほぼイメージに近い写真になりました!

イラストの生成

今度はイラストに挑戦。

プロンプトに
”アジア系の選手が卓球競技をしているシンプルなベクターイラスト”と入力、生成してみました。

一人の選手から二人の選手を左右対称に生成しているため対戦時の角度に違和感があったり、実際にはない卓球台のサイズが描かれていたり、三人の対戦や複数の球の利用などAIの未熟さが感じられます。

間違い探しのイラスト作成なら完璧なのですが・・・

修正できるか試しに
プロンプトに
”アジア系の選手がボール1個で卓球競技をしているシンプルなベクターイラスト”と入力、生成してみました。

ボールは1個になりましたが、今度は機械的な修正のためか問題のなかったネットの形状がおかしいことになりました。

それから、ベクターイラストと指定しましたが出力はビットマップなので他のツールでベクター化する必要があります。

画像生成AIさん、まだまだですね。

ロゴの生成

文字を入れたロゴに挑戦してみました。

プロンプトに
”卓球とHiroshimaというフォントをモチーフにしたロゴ”と入力、生成してみました。

興味深いロゴが生成されましたが、言語対応されていないことが一目瞭然です。そのため、Hiroshimaに関して正しいものもありますが、どこの国の言語か不明になってしまっています。言語対応が今後のAIの課題だと思います。

また、入力時”卓球””Hiroshimaという文字”の2つのキーワードで入力したつもりでしたが、”卓球という文字(TABLE TENNIS)””Hiroshimaという文字”で解釈されてしまいました。そこまで読み取ってくれると助かりますが、これは人でもあり得ることですから入力する側の注意事項でしょう。

もっと詳細なキーワードを入れ、実際のロゴをデザインするヒントとして利用することは十分可能だと思います。

アイソメトリック(等角投影図)の生成

大きな会場で競技をしているイラストイメージを生成してみました。

プロンプトに
”卓球競技を複数行っている会場の様子のベクタースタイルをアイソメトリックで”と入力、生成してみました。

これは笑えます!

全体の雰囲気はイメージ通りですが、卓球台の大きさに驚きです。競技方法までインプットされていませんね。

卓球は英語でtabele tennisですから、テニスの情報が含まれてしまい該当のイラストになっていることが予想されます。

ちなみに
”卓球を複数競技している大会場の様子のベクタースタイルをアイソメトリックで、卓球台のサイズ統一して
あるいは
”卓球を複数競技している大会場の様子のベクタースタイルをアイソメトリックで、卓球台のサイズ正確に
と入力しても台の大きさは正確に描かれませんでした。

まだ、正確に理解できていない部分があると思います。

Image Creatorを利用して・・・

Image Creatorは生成した画像は全て1024×1024ピクセルの正方形の画像で出力されます。

縦横比変更して画像を拡張する際はPhotoshopの生成塗りつぶしのAI機能を使うと良さそうです。

PhotoshopのAIも凄い。元々情報が不足している部分を予測し拡張してくれる機能です。これまで縦横比の写真の加工で問題だった部分解消されそうです。

Image Creatorですが、無料で利用できる点は良いのですが商用利用できないデメリットがあります。
エンジン部分のOpenAI社のDALL-E3は無料で商用利用可能なだけに残念です。

Image Creatorを利用するためにはMicrosoft EdgeでBingを使わなければならないのでブラウザや検索エンジンのシェア率に変化をもたらすかも知れません。Microsoftは狙っていますね。

ブーストという利用制限に関するものがあります。収益モデルなのかサーバーの負荷防止用なのか不明ですがブーストがあるうちは比較的早く画像を生成できます。生成する度に-1され、無くなると時間がかかります。修正かけているとあっという間に使い切ってしまいます。
ただ、無くなっても1日で15回復するようです。

利用して感じたのは思い通りの画像に近づけるためには入力がキーになることが分かりました。まるで警察で目撃者が犯人の似顔絵を作成しているような作業でした。似顔絵を描く警察官(画像生成AI)はまだ能力が十分ではありませんが利用することで経験値の高い警察官になるはずです。

次回はStable Diffusionを試してみたいと思います。