Seedance 画像から動画へ:写真をアニメ化する完全チュートリアル(2026)
Seedance で写真を動画に — ソース画像の準備、参照素材と初期フレームの違い、モーションプロンプト、顔の一貫性維持、よくあるアーティファクトの修正まで。
画像から動画(i2v)は Seedance 2.0 で最もレバレッジが高く、そして最も誤用されている機能です。モデルがテキストから何を想像するかに賭ける代わりに、すでに正しいフレーム — あなたの商品、あなたの顔、あなたの構図 — を渡し、プロンプトはモーションと音声だけに使います。私たちのテストでは、特定の実物に似ていなければならない被写体において、i2v は「使えるクリップまでの試行回数」をテキストから動画の約半分に削減しました。
このチュートリアルでは i2v ワークフロー全体を扱います:テキストから動画よりも i2v を選ぶべき場面、ソース画像の準備方法、初期フレーム(init image)と Seedance の 12 素材参照システムの違い、商品・ポートレート・風景それぞれのモーションプロンプトのパターン、そして私たちが日常的に使うアーティファクト修正。すべて Sora2U の Seedance ジェネレーターで実行できます — 画像をアップロードし、モーションを書き、生成するだけです。
画像から動画がテキストから動画に勝つ場面
経験則:最初のフレームが正確でなければならないなら i2v、モーション自体が主役なら t2v。具体的に i2v が勝つのは:
- 実在の商品が認識可能なままでなければならない — パックショット、デバイス、アパレル。商品のテキスト記述は必ずズレますが、写真は決してズレません。
- 特定の顔やブランドルックが交渉不可 — 創業者のポートレート、繰り返し登場するキャラクター、固定されたカラーグレード。
- 静止画にすでにお金を払っている — 商品写真や不動産写真が限界費用ゼロに近いコストで動画になります。
- 構図が精密 — 三分割構図、テキストオーバーレイ用のネガティブスペース、広告枠に合わせた正確なフレーミング。
カメラ主導のショット(ドローン引き、トラッキング)や、モデルに世界を発明させたいシーンでは、テキストから動画が依然として優れています。その場合は Seedance プロンプト工学ガイドから始めてください — そこで解説する 4 ブロック構造が本記事の土台です。
ソース画像の準備
Seedance はソースフレームのすべてを継承します — シャープネス、ノイズ、色被り、そしてミスまで。30 秒の準備が 3 回の再生成を節約します:
- 解像度:出力の高さ以上でアップロード — 1080p 動画なら 1080px 以上。ぼやけた画像はアップロード前にアップスケール。Seedance はボケを塗り潰しに増幅します。
- アスペクト比:目標比率(16:9、9:16、1:1)に自分でクロップする。自動クロップは勝手に判断し、縦型出力では被写体の頭が切れることが頻発します。
- モーション用の余白:動かす予定の方向に 10–15% の空きフレームを残す — ドリーインには消費できる背景が、パンには行き先が必要です。
- クリーンなエッジ:ウォーターマーク、枠線、タイムスタンプはモーションが始まると蠢くアーティファクトになります。先に除去を — ウォーターマーク除去ツールなら 1 パスで処理できます。
- 明確な被写体を 1 つ:i2v は被写体の優先順位付けが苦手です。同格の被写体が 5 つあるフレームは、5 つの中途半端なアニメーションを生みます。
初期フレーム vs 参照素材
Seedance には画像を渡す方法が 2 つあり、この混同が最も多い i2v のミスです。初期フレーム(init image)は文字どおり第 1 フレーム — 動画はそこから始まります。参照素材(1 回の生成で最大 12 個:画像・動画・音声)はガイダンス — キャラクター・商品・スタイルが動画全体を通してどう見えるべきかを伝えますが、第 1 フレームは規定しません。
| 初期フレーム | 参照素材 | |
|---|---|---|
| 役割 | 文字どおりの第 1 フレーム | アイデンティティとスタイルの誘導 |
| 数 | 1 枚 | 最大 12 個(画像・動画・音声) |
| 制御範囲 | 第 1 フレームの構図・フレーミング・照明 | 全フレームでの被写体の見た目 |
| 最適な用途 | 特定の写真を動かす | ショット・クリップをまたぐキャラクターの一貫性 |
| 誤用時の症状 | 約 5 秒後にアイデンティティが漂流 | 第 1 フレームが構図を無視 |
プロのパターンは併用です:初期フレームで正確なオープニングを固定し、同じ被写体を別角度から撮った参照を 2–3 枚追加する。被写体が振り向いたりカメラが動いたりしたときにアイデンティティを固定するのは参照素材です — 第 1 フレームだけでは、商品の背面がどう見えるかをモデルに教えられません。
最初の 1 枚をワンパスで動かす
Seedance 2.0 に画像をアップロードし、一文のモーションプロンプトを添えるだけ — 最長 15 秒、1080p、ネイティブ音声付き。
アフィリエイトリンク — 追加費用なしで、当サイトに手数料が入ることがあります。
画像の上にモーションプロンプトを書く
i2v では「どう見えるか」はすでに画像が答えています。画像を文章で再記述するプロンプトはトークンの無駄であり、漂流を招きます。記述するのは変化するものだけ:被写体のモーション、カメラのモーション、音声。約 40 語以内に収めます。
- 弱い例:「秋の橋の上に立つ、黄色いコートを着た赤毛の美しい女性……」(画像の再記述 — 残したかったディテールをモデルが「修正」するおそれ)。
- 強い例:「彼女がカメラの方を向いて微笑み、髪がそよ風に揺れる。スロードリーイン。音声:橋の下の川、遠くの鳥の声。」
- 強い例(商品):「ボトルが 90 度回転し、結露の水滴がガラスを伝う。カメラ固定。音声:かすかな炭酸の音、アンビエントなラウンジ音楽。」
モーション強度は明示的に校正します — ポートレートと商品には「subtle」「ゆっくり」「控えめに」、変形に耐えられるシーンにだけ「ダイナミック」を。指定がなければ、Seedance は大半の商用ショットが望むより多くのモーションをデフォルトで入れてきます。i2v タグ付きのテスト済みモーションテンプレートはプロンプトライブラリの Seedance セクションにあります。
3 つのプレイブック:商品・ポートレート・風景
商品ショット
1 クリップにつきアニメ化する性質は1 つだけ:回転、蓋の開閉、液体の注ぎ、布の落ち着き。カメラは固定かスロードリーインに留め、素材感はネイティブ音声に売らせます — クリック音、炭酸の音、布の擦れる音。これが 2026 年最安の商品動画パイプラインです:手持ちのパックショットを入れて、5 秒のヒーロークリップが従量課金換算で 1 ドル未満で出てきます。ファネル全体の計算は EC 向け動画マーケティングガイドで。
ポートレート
顔はもっとも失敗が許されません。マイクロモーションのみを要求します:まばたき、ゆっくりした微笑み、30 度未満のわずかな首の動き、そよ風に揺れる髪。同じ顔の写真を 1–2 枚、参照素材として追加し、クリップは 5–10 秒に — アイデンティティの保持は 10 秒を超えると目に見えて劣化します。台詞ありなら Seedance はポートレートをスクリプトにリップシンクさせますが、音素をきれいに出すには頭をほぼ正面に保つ必要があります。
風景
風景はモーションへの耐性が最も高く、ゆっくりしたカメラ移動が輝く場所です:雲を流し、水面を揺らし、草をそよがせ、そこにスローパンかドリーを重ねます。環境音のベッドを必ず書くこと(「松林を抜ける風、遠くの波」)— 無音の風景クリップはシネマグラフに見えてしまい、動画になりません。守るべきアイデンティティがないからこそ、ここでは 10–15 秒がフルに使えます。
アイデンティティを安定させる
- 被写体を別角度から撮った参照素材を 2–3 個追加する — 漂流対策として単体で最も効果が大きい修正です。
- 顔を保持したいクリップは 10 秒上限に。長い 1 本より短い 2 本を生成して編集で繋ぐ。
- 1 クリップ内の被写体の回転は 90 度以内に — 完全な振り向きは、見えていない側をモデルに発明させてしまいます。
- プロンプト内の呼び方を統一する(「参照画像の女性」)。顔の特徴を言葉で再記述しない。
- シリーズものでは、バッチ内のすべての生成で同一の参照セットとソース画像のスタイルを使い回す。
アイデンティティが関係しないショットでより速く安い反復が必要なら、Sora2U の Seedance 1.5(10 クレジット/秒)が下書きティアです — クレジットの詳細は料金ページへ。Seedance の i2v が Kling とどう比べられるかは Seedance 2.0 vs Kling の比較をご覧ください。
よくあるアーティファクトと修正
- クリップ途中で顔が変わる — 同じ顔の参照写真を追加、クリップを 5–8 秒に短縮、要求するモーションを減らす。
- 手と指の歪み — ソース画像では手を静止させるかフレーム外に。手の動きは本当に必要なときだけプロンプトする。
- 背景の「呼吸」や揺れ — モーションプロンプトがシーンに対して攻めすぎ。「カメラ固定、控えめなモーション」を追加して再実行。
- ロゴやラベル文字が溶ける — ラベル面をカメラに向けたまま、回転は 90 度以内に。ヒーローショットではロゴをポストで修復。
- 第 1 フレームの色味シフト — Seedance はまれにフレーム 1 を再グレーディングします。カラーグレードをソースに焼き込み、「元のカラーグレーディングを維持」と明記する。
- 被写体が固まりカメラだけ動く — プロンプトがカメラモーションしか記述していません。被写体に明示的な動詞を 1 つ与える。
実テスト由来の i2v パターンを毎週
毎月数百枚の静止画を動かし、生き残ったモーションプロンプトだけをお届けします — 週 1 通。
よくある質問
AI で写真を動画にするにはどうすればいいですか?
Sora2U ジェネレーターで Seedance 2.0 のような画像から動画モデルに写真を初期フレームとしてアップロードし、変化だけを記述する短いモーションプロンプト(「彼女が振り向いて微笑む、スロードリーイン」)を書いて生成します。最長 15 秒・1080p・ネイティブ音声付きです。
画像から動画とテキストから動画はどう使い分けますか?
第 1 フレームが正確でなければならない場合はすべて i2v — 実在の商品、特定の顔、固定された構図、すでに持っている静止画。モデルにシーンを発明させたい場合や、カメラモーション主導のショットはテキストから動画を使います。
AI 動画用のソース画像はどのくらいの解像度が必要ですか?
目標出力の高さ以上 — 1080p 動画なら 1080px 以上 — で、目標アスペクト比(16:9、9:16、1:1)に事前にクロップしておきます。ぼやけた画像はアップロード前にアップスケールを。i2v はボケを塗り潰しに増幅します。
AI の画像から動画で顔を一貫させるには?
初期フレームに加えて、同じ顔を別角度から撮った参照写真を 2–3 枚併用し、クリップは 5–10 秒、頭の回転は 30 度未満に抑え、特徴を言葉で再記述せず「参照画像の人物」と呼びます。
Seedance で商品写真を広告動画にできますか?
できます — 最も強力な商用ユースケースの一つです。パックショットをアップロードし、1 クリップにつき 1 つの性質(回転・蓋の開閉・注ぎ)だけを動かし、カメラは固定、クリック音や炭酸の音はネイティブ音声に任せます。5 秒のヒーロークリップは従量課金換算で 1 ドルを大きく下回ります。
