プロンプトエンジニアリング入門ガイド
AI画像生成で思い通りの画像を作るために必要な「プロンプト」の基礎知識から実践テクニックまでを解説します。 Midjourney、Stable Diffusion、DALL·Eなど、主要なAI画像生成モデルに対応した汎用的なガイドです。
目次
プロンプトエンジニアリングとは
なぜプロンプトが重要なのか
プロンプトの8つの構成要素
1. 被写体(Subject)
画像の主題となる人物、物体、風景などを記述します。プロンプトの中で最も重要な要素です。「若い女性」ではなく「20代の日本人女性、ショートヘア、白いワンピース」のように具体的に記述すると、より意図した結果に近づきます。特に人物の場合は、年齢、性別、髪型、服装、表情、ポーズなどを詳細に指定することが重要です。
2. スタイル(Style)
画像の全体的なアートスタイルを指定します。写実的(photorealistic)、アニメ風(anime style)、油絵風(oil painting)、水彩画(watercolor)、3Dレンダリング(3D render)、ミニマリスト(minimalist)など、多彩なスタイルを指定できます。また、特定のアーティストや作品のスタイルを参照することもできます(例:「ジブリ風」「サイバーパンク風」)。
3. ライティング(Lighting)
光の種類、方向、強さ、色温度を指定します。ライティングは画像の雰囲気を決定する極めて重要な要素です。「ゴールデンアワーの柔らかい光(golden hour soft light)」「ドラマティックなサイドライト(dramatic side lighting)」「ネオン照明(neon lighting)」「スタジオ照明(studio lighting)」など、様々な指定が可能です。逆光(backlit)、リムライト(rim light)、チアロスクーロ(chiaroscuro)なども効果的です。
4. カメラ・アングル(Camera/Angle)
撮影に使用するカメラの種類やレンズ、アングルを指定します。「35mmレンズ」「望遠レンズ(telephoto lens)」「マクロ撮影(macro photography)」「ドローン空撮(aerial drone shot)」など。アングルとしては「ローアングル(low angle)」「俯瞰(bird's eye view)」「アイレベル(eye level)」などがあります。ボケ味(bokeh)や被写界深度(depth of field)の指定も画像のクオリティを大きく左右します。
5. 構図(Composition)
画像内の要素の配置やバランスを指定します。「三分割法(rule of thirds)」「中央配置(centered composition)」「シンメトリー(symmetrical)」「リーディングライン(leading lines)」「ネガティブスペース(negative space)」などの指定が可能です。構図の指定は、プロフェッショナルな印象の画像を得るために非常に効果的です。
6. カラーパレット(Color Palette)
画像の配色を指定します。「暖色系(warm tones)」「寒色系(cool tones)」「モノクロ(monochrome)」「パステルカラー(pastel colors)」「ハイコントラスト(high contrast)」「彩度低め(desaturated)」などの指定ができます。特定の色を名指しすることも効果的です(例:「ティール&オレンジ」「ブルーとゴールド」)。
7. テクスチャ・素材(Texture/Material)
画像内の質感や素材感を指定します。「光沢のある(glossy)」「マットな(matte)」「メタリック(metallic)」「半透明(translucent)」「粗い(rough)」「滑らかな(smooth)」などを指定することで、画像にリアリティや独特の雰囲気を与えます。
8. ムード・雰囲気(Mood)
画像全体のムードや感情的なトーンを指定します。「穏やかな(serene)」「ミステリアスな(mysterious)」「ドラマティックな(dramatic)」「ノスタルジックな(nostalgic)」「夢幻的な(dreamy)」「壮大な(epic)」など。ムードの指定は、画像に統一感と物語性を与える重要な要素です。
プロンプト作成の実践テクニック
具体的に記述する
抽象的な表現を避け、具体的なディテールを含めましょう。「美しい風景」ではなく「霧に包まれた朝の竹林、太陽の光が木漏れ日として差し込む、京都」のように書くと、はるかに意図通りの結果が得られます。
品質修飾子を活用する
「highly detailed(高精細)」「8K resolution(8K解像度)」「masterpiece(傑作)」「professional photography(プロ写真)」「award-winning(受賞作品級)」などの品質修飾子を加えると、全体的なクオリティが向上する傾向があります。
ネガティブプロンプトを使いこなす
Stable Diffusionなどのモデルでは、生成してほしくない要素を「ネガティブプロンプト」として指定できます。「blurry(ぼやけた)」「low quality(低品質)」「deformed(変形した)」「watermark(透かし)」などを指定することで、品質の高い画像が得られやすくなります。
語順を意識する
多くのAIモデルでは、プロンプトの先頭にある要素がより強く反映されます。最も重要な要素(通常は被写体)を先頭に配置し、補足的な要素を後に続けましょう。
反復と改善を繰り返す
一度で完璧なプロンプトが書けることはまれです。生成結果を見ながら、プロンプトを少しずつ調整していくことが重要です。PROMPT NINJAでは、画像からプロンプトをリバースエンジニアリングすることで、この学習プロセスを大幅に短縮できます。