初心者向け Whisk AIで始めるクリエイティブビジュアル制作ガイド

Whisk AIは、Google Labsが開発した無料の画像生成ツールです。このツールは、画像の理解にGemini AI（Gemini Pro/Vision）を、視覚的なプロンプト（被写体、シーン、スタイル）やテキストからの高品質な画像生成にImagen 3（またはImagen 4などの新しいバージョン）を使用しています。また、生成された画像から動画を作成することも可能です。このガイドでは、Whisk AIの使い方とその様々な機能について詳しく解説します。

今すぐ生成！

パート1. Whisk AIでテキストプロンプトからAI画像を生成する方法

Googleの実験的なAIツールであるWhiskを使えば、テキストプロンプトから素早く画像を生成できます。手順は非常にシンプルです。

ステップ1. アカウントにサインインする

まずWhisk AIのセットアップが必要ですが、これはとても簡単です。まず、Google LabsによるWhisk AIのサイトにアクセスし、アカウントにサインインして「Enter Tool」をクリックします。

ステップ2. プロンプトを入力または生成する

ツール内の下部中央にプロンプトボックスがあります。生成したい内容を自由に入力してください。また、ランダムなアイデアが欲しい場合は、ダイス（サイコロ）のアイコンをクリックすると、プロンプトを自動生成してくれます。気に入った内容が出るまで、ダイスボタンを繰り返しクリックできます。

ステップ3. 画像設定をカスタマイズする

アスペクト比を選択するボタンもあります。デフォルトは16:9ですが、1:1や9:16に切り替えることも可能です。

次に設定（Settings）を確認すると、デフォルトではシード値（Seed）のロックが解除されています。ほとんどの場合、このままにしておくのが最適です。

ステップ4. 画像を生成する

あとは矢印ボタンをクリックするだけです。数秒後、2つのバリエーションが表示されます。

結果に満足できない場合は、さらに生成することもできます。その場合は、バリエーションの1つをクリックして、再度「Generate」をクリックしてください。

スタイルや媒体を指定せずにクリエイティブなプロンプトを入力すると、Whiskは異なる視覚的アプローチを提案することがあります。一方のバリエーションはイラストやカートゥーン風になり、もう一方は背景をぼかした写真のような仕上がりになるかもしれません。

より詳細なプロンプトを試すと、Whiskは要求に応じて特定の時代の要素を含めることもできます。グループシーンでは、生成された結果は視覚的にうまくまとまることが多いですが、背景のテキストなどの細かいディテールは読み取れない場合があります。

ステップ5. 生成された画像を調整する

生成された画像にマウスを合わせると、「Refine（調整）」ボタンが表示されます。これをクリックしてください。

これで、チャット形式で編集を行うワークフローに入ります。ここではプレビュー画像が表示されますが、プロンプトのダイス機能はありません。変更したい内容を伝えると、Whisk AIがそれに応じて調整を行ってくれます。

この機能は、画像に多くの変更を加えます。単一のディテールを変えるだけでなく、全体的に少しずつ異なる新しい画像を作成します。

「Refine」のチャット編集ワークフローでは、継続的に変更を加えたり要素を追加したりできます。例えば、キャラクターの近くに別のオブジェクトを追加することも可能です。この際、2番目のバージョンと3番目のバージョンの間で、ある程度の整合性が維持される場合があります。

ステップ6. 画像をダウンロードする

画像のバリエーションをダウンロードするには、上部にある「My Library（マイライブラリ）」をクリックします。

ここに保存されたプロジェクトが表示されます。画像にマウスを合わせたときに表示される3つのドットをクリックし、「Download」を選択します。

パート2. Whiskで参照写真を使用してAI画像を生成する方法

プロンプトボックスの下にある「Add Images（画像を追加）」ボタンに気づいたかもしれません。これを使えば、被写体、シーン、スタイルの参照画像を追加できます。手順は以下の通りです。

ステップ1. 新規プロジェクトを作成して画像を追加する

まず、右上隅にある3本線をクリックしてメイン設定を開き、「New Project（新規プロジェクト）」を選択します。

次に、プロンプトボックスで「Add Images」をクリックします。

ステップ2. 被写体、シーン、スタイルを指定する

左側のペインに「Subject（被写体）」、「Scene（シーン）」、「Style（スタイル）」のオプションが表示されます。

これらの各オプションでは、テキストを使用するか、画像をアップロードして、希望する被写体、シーン、スタイルを説明できます。「+」アイコンのすぐ隣にあるボタンを使えば、AIでスタイル、被写体、シーンを生成することも可能です。

例えば、「Subject」に女性の写真をアップロードし、「Scene」に青いドレスの画像をアップロードします。これら2つにチェックを入れ、プロンプトで「女性が青いドレスを着ている」と説明すれば、2つのバリエーションで良い結果が得られます。

テキストプロンプト、参照画像、またはプリセットスタイルを使用して生成画像に「Style」を追加し、それにもチェックを入れると、さらに2つのバリエーションが生成されます。スタイルのテキストプロンプトを空にしても、Whisk AIはスタイルを被写体やシーンに合わせようとします。

これらのカテゴリーには複数の画像を追加できます。生成時、Whiskは被写体、シーン、スタイルの説明を組み合わせて出力に反映させます。

ステップ3. 画像を調整してダウンロードする

前述と同様に、生成された画像にマウスを合わせ、「Refine」をクリックしてテキストプロンプトで編集します。保存された画像はライブラリの「Images」セクションからダウンロードできます。

ただし、これはキャラクターやシーンの完全な一貫性を保つための方法ではありません。複数の画像を1つの画像に合成するのではなく、提供された各画像から説明を生成し、それらの説明を元に全く新しい画像を生成します。

Whiskによると、提供された画像から詳細の一部を捉え、被写体、シーン、スタイルの「本質」を抽出しようとしますが、すべての特徴や細部を再現するわけではありません。例えば、ある画像を被写体として、別の画像をシーンとして提供し、そのシーンで人物が活動しているプロンプトを入力して生成すると、結果は両方の参照に似たものになります。被写体はどことなく似ており、シーンも提供したものに近くなりますが、違いは生じます。Whiskによれば、これは想定された動作であり、正確な一貫性は目標ではないとのことです。

パート3. Whisk AIのプリセットスタイルテンプレートとは？

Whisk AIで画像を追加することでさらに多くのことが可能ですが、仕組みは理解できたかと思います。また、このツールにはプリセットのスタイルテンプレートも用意されており、被写体やシーンの参照写真と組み合わせて活用できます。新規プロジェクトを作成した後、ドロップダウンリストからテンプレートを選択できます。

テキストプロンプトを空白にしたり、シーンを説明しなかったりしても、Whisk AIは画像をうまく理解して生成してくれます。

では、これらのプリセットテンプレートが実際にどのような効果をもたらすのか見ていきましょう。

ステッカー（Sticker）

このプリセットは、被写体をノートやノートPCに貼るようなフラットなステッカー風にします。画像をグラフィックな形と色に簡略化し、本物のステッカーデザインのように大胆でクリーンな見た目にします。人物、ロゴ、オブジェクトなどを投入すると、Whiskは太い縁取りや明確な形状を持つ、印刷可能なステッカーのような作品を生成します。基本的には、フォトリアルなシーンではなく、ステッカーアートに変換します。

エナメルピン（Enamel Pin）

これは、カラーエナメルを流し込んだメタルピンのようなスタイルにします。通常の写真ではなく、ジャケットやバッグに付けるコレクターズアイテムのピンバッジのような、ファッション性の高いデザインに被写体を変換します。

ぬいぐるみ（Plushie）

これを選択すると、Whisk AIは被写体を抱きしめたくなるような柔らかいぬいぐるみのバージョンにします。色はよりソフトに、形はより丸みを帯びて厚みが増し、おもちゃ屋のディスプレイにあるような物理的なぬいぐるみのように見えます。「これを可愛くて柔らかい感じにして」と頼んだ結果をおもちゃのアートとして解釈したような仕上がりです。

カード（Card）

カードテンプレートは、デザインされたカードに被写体が印刷されたような画像を作成します。テキスト入りのグリーティングカードそのものではなく、構図が整い、フレームに収まったような見た目になります。レイアウト要素や装飾的な背景が追加され、印刷されたカードのような意図的なデザイン性が感じられます。グリーティングカードの表紙にするような完成されたイラストをイメージしてください。

チョコレートボックス（Chocolate Box）

このスタイルは、装飾されたチョコレートの箱の蓋にあるような、パッケージに配置されたアートワークのように見えます。被写体は、豪華な背景やレイアウトと共にパッケージ化されたような外観になり、まるでギフト用のチョコレート箱の一部であるかのように表現されます。結果はフォトリアルではなく、遊び心のある装飾的なものになります。

カプセルトイ（Capsule Toy）

カプセルトイは、自動販売機のカプセルから出てくるような小さなコレクターズトイの見た目を被写体に与えます。出力は「おもちゃらしく」、丸みを帯びてシンプルで、少しカートゥーン風のデザインになり、楽しさが感じられます。

弁当箱（Bento Box）

弁当箱スタイルは、お弁当の中身のように要素を配置します。被写体は他の要素やパターンと一緒に並べられ、詰め合わせのようなグループ化された構図が作られます。実際の本物の食べ物を描くわけではありませんが、デザイン的には視覚的なセットのようにオブジェクトがまとめられて配置されます。これは、1つの画像で複数の角度やバージョンを見せるのに適しています。

パート4. Whisk AIで生成した画像から動画を生成する方法

Whisk AIには「Animate（アニメーション化）」機能があります。これはV2を使用した画像から動画への変換機能です。生成された画像にマウスを合わせると、このボタンが表示されます。左上隅にある「Animate」ボタンをクリックしてください。

動画で何が起きてほしいかを説明することもできますが、これは任意です。Whisk AIに任せることもでき、その場合は矢印の「Generate」ボタンを押します。

あとはWhisk AIの処理を待ちます。動画が生成されたら、「Play」をクリックしてプレビューします。BGMトラックも自動的に追加されていることに気づくでしょう。

動画をダウンロードしたい場合は、動画にマウスを合わせて「Download」をクリックします。動画形式またはアニメーションGIFとしてダウンロードを選択できます。

ライブラリページでは、「Videos」セクションに保存されています。

Whiskは、Animate機能が利用可能な国において、10回まで無料でこの機能を提供しています。無料ユーザーが作成できる画像数にも制限があるようですが、その具体的な数は明記されていません。動画生成については月10回までの制限があります。10本以上の動画を生成したい場合や、無料の画像制限を超えたい場合は、Google AIサブスクリプションが必要です。月額19.99ドルのProプラン（初月無料）や、月額249.99ドルのUltraサブスクリプション（最初の3ヶ月は月額124.99ドル）が用意されています。

パート5. Whisk AIに関するよくある質問（FAQ）

Q1. Whisk AIは無料ですか？

A1. はい、GoogleのWhisk画像・動画生成ツールは、Google Labsの実験的プロジェクトであるため、一般的に無料で使用できます。画像やテキストプロンプトを使用して静止画や動的なビジュアルを作成できますが、最初は動画生成が10回までといった使用制限がある場合があります。スタイルのリミックスやシンプルなビジュアルストーリーボードの作成に非常に適しています。

Q2. Google LabsのWhiskはまだ利用可能ですか？

A2. 現時点では、Google Whisk AIはGoogleのクリエイティブ実験ラインナップの一部として、約100カ国で展開されています。お住まいの地域でWhiskが利用可能であれば、アカウントがアクセス権を持っている限り使用できます。利用可能性は地域や展開状況によって異なる場合があります。

Whisk AIのまとめ

以上でWhisk AIのクイックウォークスルーを終わります。このツールが、画像生成、調整、アニメーション、参照画像、スタイル、プリセットを1つのワークスペースでどのように処理するかを見てきました。WhiskはまだGoogle Labsの実験的プロジェクトであるため、完成された製品というよりはクリエイティブなサンドボックス（実験場）のようなものであり、プレッシャーを感じることなく探索を楽しむことができます。ビジュアルを試したり、異なるスタイルを実験したり、数クリックでプリセットが結果をどう変えるかを確認したいなら、Whiskは無料で利用できる今のうちに存分に遊べるツールです。

ホーム > Learn > 初心者向け Whisk AIで始めるクリエイティブビジュアル制作ガイド

「評価」をお選びください：

ご意見をお聞かせください。

コメントを書く

製品また記事に関するコメントを書きましょう。

初心者向け Whisk AIで始めるクリエイティブビジュアル制作ガイド