無料で使えるGoogleの生成AI「Gemini」。パソコンだけでなくスマートフォンでも気軽に使えます。
提案書や、メールの下書きなどテキストを生成してくれるので便利ですよね。
提案文やWebサイトにイラストが欲しいと思ったときに、画像を探すのは手間ではないでしょうか?
Geminiで画像が作成できたら時間の短縮になりますね。
「Geminiは画像生成できるの」
「どんな画像が作成できるの」
こんな疑問をお持ちの方も多いのではないでしょうか。
この記事では、Geminiの画像生成の疑問にお答えする以下の内容を解説しています。
- Geminiで作れる画像種類
- 画像の生成の仕方
- 画像生成のプロンプト書き方
- Geminiで作成した画像の注意点
実際にGeminiを使用して画像を作成しました。ChatGPTとの比較もあります。
Geminiで画像生成したいと思っている方は、参考にしてください。
1.Geminiで画像を生成するには
Geminiで画像を生成するには、スマートフォンやパソコンでGeminiにアクセスしてテキストを入れると作成できます。
残念なことですが、2024年8月時点では画像の生成には制限があります。
Geminiの2つの制限事項
Geminiの画像生成には、3つの制限事項があります。
- プロンプトは英語のみ
- 人物の生成ができない
- 画像のアスペクト比は固定
1.プロンプトは英語で指示
英語で指示をする必要があります。
2024年8月の時点では日本語で画像は生成できません。リリース予定はあるようですが、時期は未定です。
※2024年8月28日(現地時間)に日本語対応の発表がありました。
英語が得意でなくても大丈夫。
日本語で指示してGeminiでプロンプトを英語にしてもらいましょう!
プロンプト
絵画調のひまわりをGeminiで生成するプロンプトを英語で作成して
絵画調のひまわりを生成するGeminiのプロンプト例(英語)
絵画調のひまわりをGeminiで生成するための英語のプロンプトは、いくつかの要素を組み合わせることで、より詳細なイメージを生成することができます。
基本的なプロンプト
- A painting of sunflowers. (ひまわりの絵画)
スタイルを指定する
- A vibrant oil painting of sunflowers. (鮮やかな油絵のひまわり)
- A Van Gogh-inspired painting of sunflowers. (ゴッホ風のひまわりの絵画)
- A minimalist watercolor painting of a single sunflower. (ミニマルな水彩画の一輪のひまわり)
雰囲気を指定する
- A warm, impressionistic painting of sunflowers in a field. (暖かい印象派のひまわりの畑の絵画)
- A dark, moody painting of sunflowers in a vase. (暗いムードのある花瓶のひまわりの絵画)
詳細な描写
- A close-up of a sunflower with intricate details of the petals. (花びらの複雑なディテールをクローズアップしたひまわり)
- A field of sunflowers at sunset with a golden sky. (夕焼けの金色の空の下のひまわりの畑)
組み合わせ例
- “Create a vibrant oil painting of a close-up of a sunflower with intricate details of the petals.” (花びらの複雑なディテールをクローズアップした鮮やかな油絵のひまわりを作成してください。)
- “Generate a minimalist watercolor painting of a single sunflower against a blue sky.” (青い空を背景にした一輪のひまわりのミニマルな水彩画を生成してください。)
さらに高度なプロンプト
- “A hyperrealistic painting of a sunflower with raindrops on the petals, in the style of a Dutch Golden Age master.” (オランダ黄金時代の巨匠のスタイルで、花びらに雨滴が付いたひまわりの超現実的な絵画。)
- “A surrealist painting of a giant sunflower floating in space, with a cosmic background.” (宇宙を背景に、宇宙空間を漂う巨大なひまわりのシュールな絵画。)
プロンプトを作成する際のヒント
- 多様な形容詞: 色、質感、光、感情などを表す形容詞を使うことで、より詳細なイメージを伝えます。
- 具体的な指示: 特定の画家のスタイル、構図、照明などを指定することで、より具体的なイメージを生成できます。
- 実験: 異なる組み合わせを試すことで、思いもよらない美しい画像が生成されることがあります。
Geminiの機能:
- テキストから画像への変換: テキストの説明に基づいて、画像を生成します。
- スタイルの転送: 既存の画像のスタイルを新しい画像に適用します。
- 画像の編集: 生成された画像を編集し、細部を調整できます。
これらのプロンプトを参考に、あなたの理想のひまわりの絵画を生成してみてください。
翻訳:
- 絵画: painting
- ひまわり: sunflower
- オイルペインティング: oil painting
- 水彩画: watercolor painting
- 印象派: Impressionism
- ミニマル: minimalist
- クローズアップ: close-up
- ディテール: detail
- 夕焼け: sunset
- 超現実主義: surrealism
- 宇宙: space
- コズミック: cosmic
いろいろなプロンプトを教えてくれます。
Geminiの回答にもありますが、実験だと思って色々な画像を作成しましょう。
人と違って何度指示しても嫌がることはありませんから。
Google翻訳を使って英訳する方法もあります。
コピペが簡単なので、スマートフォンでGeminiで画像を生成するときに重宝します。
参考:Google翻訳
2.人物の画像生成はできない
現在のところ人物の生成はできません。
2024年2月に画像生成をリリースした時点では人物の生成もできていましたが、人物の画像生成で起こるハルシネーション(幻覚)に批判が集中したため中止しました。
2024年8月時点でも人物の画像生成はできません。
3.画像のアスペクト比は固定
Geminiの画像生成機能では、生成される画像のアスペクト比は固定されており、ユーザーが自由に設定できません。
生成される画像は正方形です。
またGeminiの画像生成機能で生成される画像の解像度に関する情報は、現時点では発表されていません。
生成した画像情報を確認すると1536 × 1536 ピクセルでした。
2.プロンプト書き方
Geminiで画像を生成するために、どんな画像を作成してほしいかをテキストで指示しないといけません。
画像イメージして言語化をするのは、慣れないと大変です。
初めて画像生成を行ってもイメージ通りにできなくて「つかえないじゃん」と思う人もいるかもしれませんね。
単純に「海辺の画像を作成して」と指示すれば、画像を作成してくれますが、思ったような画像はなかなか作成してくれません。
どのようにプロンプトを書けば良いのか注意点を4つ紹介します。
1.簡潔で具体的な指示をする
Geminiを人と思って、描いてほしい画像を簡潔に具体的な指示をしましょう。
長文よりも箇条書きで書くのがコツです。
例えば「猫の写真」ではなく「茶色のふわふわの毛、青い目、窓辺に座っている子猫の写真を作成してください」のように具体的な場所や、色などを指示します。
2.生成したい画像イメージの複数要素を指示する
生成したい画像のイメージを、複数の要素を組み合わて指示しましょう。
例えば「山️と湖️、木に囲まれた赤い屋根の家の写真を生成してください」のように、複数の要素を組み合わせることで、より複雑で詳細な画像を生成することができます。
3.画風や質感などを指定する
生成したい画像の画風や質感などを指定しましょう。
例:「油絵風の、光沢のある金属製のロボットの写真を生成してください」のように、具体的な指示を与えることで、よりイメージに近い画像を生成することができます。
4.補足情報を加える
必要に応じて、構図やアングルなどの補足情報を加えましょう。
例:「猫がカメラ目線でこちらを見ている、上から見下ろした構図の写真を生成してください」のように、補足情報を加えることで、より具体的な指示を出すことが大切です。
Geminiで画像を作成を検証
実際にプロンプトをいれて画像を生成しました。
画像を生成する方法は、簡単です。
普段のつかっているチャットボックスにプロンプトを英語で入力すれば生成してくれます。
Geminiを始めて利用する場合は、Googleのアカウント取るだけで利用できます。
詳しくは過去の記事で紹介していますので、こちらをご覧ください。
ひまわりの油絵
ひまわりの油絵を作成してみました。
プロンプト
Create an oil painting. Three sunflowers in a white vase. The vase is placed on an antique table.(油絵を作成。白い花瓶に3本のひまわり、花瓶はアンティークのテーブルの上に置かれています)
ビーチの写真
夏の朝のビーチの写真を生成してもらいましょう。
プロンプト
Create an image A calm summer morning on a beach, the sun rising over the sea.(画像を作成、 ビーチの穏やかな夏の朝、海から昇る太陽)
猫のアニメ風
アニメ風に猫の絵を描いてもらいます。
プロンプト
Create a white cat, fluffy fur, sitting on a windowsill, in an anime style.(窓辺に座る、ふわふわの毛並みをした白猫をアニメ風に作成して)
1枚目は、イメージしたアニメ風でしたが、そのほかはイラストのようですね。
「さらに生成」をクリックすると追加で2枚生成します。
ChatGPTとの比較
無料のChatGPTでも画像生成ができるようになりました。画像の生成はDALL-Eで行います。
Geminiとの違いは2点です。
- 画像は1日2枚
- 生成できる画像は1回1枚
プロンプトの書き方で、紹介したプロンプトを例にして比較しました。
どちらも素敵な画像を作成してくれます。
比較1 茶色のふわふわの毛、青い目、窓辺に座っている子猫の写真
ChatGPTで生成した画像
Geminiで生成した画像
どちらもプロンプト通りの画像ですね。
Geminiの方が、写真の感じになっているように見えます。
比較2 山️と湖️、木に囲まれた赤い屋根の家の写真
ChatGPTで生成した画像
Geminiで生成した画像
どちらも山️と湖️、木に囲まれた赤い屋根の家の写真が生成されました。
ChatGPTの生成した画像は、家だけでなくボートや小屋があり素敵ですね。
Geminiで作成した画像の注意点
Geminiで生成した画像の著作権や商用利用できるのか気になりますよね。
2023年6月の文化庁著作権セミナー「A I と著作権」に日本の生成AIで作成した画像の著作権についての見解があります。
参考:令和5年度著作権セミナー「AIと著作権」
AIを利用して生成した場合でも、その利用が著作権侵害となるかは、人がAIを利用せず絵を描いた等の場合と同様に判断されます。
生成AIで作成した画像を商用利用する場合は、人が描いた画像と同じ注意をすれば利用可能です。
注意点は「類似性(人が見て明らかに既存の著作物と類似している)」と「依拠(いきょ)性(既存の著作物を意識して作られている)」が挙げられます。
類似性は目で確認する以外方法がありませんが、依拠性は「鳥山明風の絵を書いて」などと指定するのが著作権侵害になることに注意しましょう。
企業が商用利用する時は、生成した画像のプロンプトを保存しておき、依拠性がないことの証明とするなどの対策が有効と言われています。
またGemini API 追加利用の規定によると
規約されたコンテンツの使用サービスの一部では、ユーザーによるオリジナル コンテンツの生成を許可しています。 Google はこれらのコンテンツに対する所有権を主張することはありません。
生成した画像の所有権をGoogleは主張しないと書かれているため、Googleは画像の著作権を主張しないようです。
したがって著作権対策は必要ですが、日本ではGeminiで生成した画像の商用利用ができます。
Geminiで画像を作成しよう!
GoogleAI Geminiは、テキストの生成だけでなく画像生成もできます。
今のところ日本語対応や人の画像生成はできませんが、Geminiの開発が進めば対応されるでしょう。
スマートフォンでも使えるので、通勤・通学中の移動中でも画像が手軽に生成できます。
Geminiでいろいろな画像作成して楽しみましょう!