Seedance 2.0 チュートリアル：ネイティブ音声付き AI 動画の完全ガイド（2026） | Sora2U

Q: 米国から Seedance を使えますか？

2026 年 4 月時点で ByteDance の直販プロダクトは米国未展開ですが、[Sora2U ジェネレーター](/seedance-generator)、fal.ai、CapCut Dreamina などのサードパーティ経由で今日から利用できます。

Seedance 2.0 は ByteDance のフラッグシップ動画モデルであり、音声と映像を同時生成する初の本格的なシステムです。台詞・環境音・音楽が映像と同じ生成パスから出力されます。このアーキテクチャこそが実機テストで 8.9/10 を獲得した理由であり、2026 年 4 月の Sora 終了後、会話シーンのデフォルト推奨になった理由です。

このチュートリアルでは、アクセスの取得、最初の生成、会話とリップシンク、マルチショット絵コンテ、参照素材、コスト計算まで全工程を解説します。セットアップを省きたい場合は Sora2U 上で直接 Seedance 2.0 を使って生成できます。ByteDance のアカウントは不要です。

Seedance 2.0 とは何か（そして何でないか）

Seedance 2.0 は最長 15 秒・1080p のネイティブ音声付きクリップを生成します。際立つのは 8 言語以上に対応した音素レベルのリップシンク — スクリプトした台詞をキャラクターが話し、口の動きが一致します。さらに 1 回の生成で最大 12 個のマルチモーダル参照素材（画像・動画・音声）を受け付け、これがキャラクターの一貫性とブランドの統一感を実現する仕組みです。

ただしリアルタイムツールではありません。15 秒クリップの生成には約 10 分かかるため、闇雲な再生成より計画的なワークフローが向いています。短時間での反復が必要なら、まず高速なモデルで下書きし、最終パスだけを Seedance に任せましょう。この 2 段階ワークフローは秒単価コスト分析で詳しく解説しています。

ステップ 1：アクセスを取得する

Sora2U ジェネレーター — 最速ルート。Seedance ジェネレーターを開き、Seedance 2.0（20 クレジット/秒・ネイティブ音声）か Seedance 1.5（10 クレジット/秒・高速下書き）を選んでブラウザ内で生成。
fal.ai 従量課金 — 解像度とキュー階層に応じて $0.06–0.15/秒。API 自動化向け。
CapCut Dreamina — フリーミアムのバンドル。CapCut で編集しているなら最も手軽。

ステップ 2：最初のテキストから動画生成

Sora 時代の長い映画的な段落とは異なり、Seedance は短く構造化されたシーン記述を好みます。信頼できるスターターテンプレート：

主体 — 誰/何かを 2–3 個の具体的な属性で（「50 代の屋台の女性店主、節くれだった手、温かい笑顔」）。
アクション — 1 ショットにつき明確な動作を 1 つ（「熱した鉄板でパンケーキを返す」）。
環境 — 場所・時間帯・天候（「ナイトマーケット、小雨、ネオンの反射」）。
音声キュー — 音声は同時生成されるため明示的に記述：「油の弾ける音、遠くの雑踏、テントを打つ小雨」。

プロンプト全体は 80 語以内に。結果が外れたら一度に 1 ブロックだけ修正します。Seedance は局所的な編集に予測どおり反応するため、反復コストが低いのが特長です。コピペで使えるテンプレートはプロンプトライブラリの Seedance セクションへ。

このチュートリアルのプロンプトをそのまま試す

Seedance 2.0 はネイティブの台詞音声付き 1080p 動画を生成します。本ガイドのテンプレートを貼り付けて結果を比べてみてください。

アフィリエイトリンク — 追加費用なしで、当サイトに手数料が入ることがあります。

Seedance 2.0 で生成する

ステップ 3：会話シーンとリップシンク

2026 年時点で競合が追いつけない機能です。引用符と話者タグで台詞をプロンプトに直接書きます：

「明るいオフィスの給湯室、同僚二人。女性（40 代・眼鏡）：“ローンチの数字見た？” 男性（30 代・コーヒー片手）：“予測の 2 倍だよ。” 彼女は笑い、彼はコーヒーをこぼしそうになる。オフィスの環境音、冷蔵庫の低い唸り。」

台詞は 1 行 12 語以内に — 長い行は最後の 1 秒で口の動きがずれます。
英語以外の台詞は言語を明示（「日本語で話す」）。リップシンクは 8 言語以上で音素レベルです。
1 クリップにつき感情のビートは 1 つ。「彼女が笑う」は機能し、「懐疑から喜び、そして不安へ」は機能しません。
環境音は最後に記述すると、台詞の下のミックスベッドになります。

ステップ 4：マルチショット絵コンテ

15 秒の上限内で SHOT マーカーを使って 2–3 個の独立したショットを演出でき、カット間でもキャラクターの同一性が保たれます：

「SHOT 1（0–5 秒）：ワイドショット、日の出の崖に到達するハイカー、風の音。SHOT 2（5–10 秒）：顔のクローズアップ、彼女が息を吐く、静かな畏敬。SHOT 3（10–15 秒）：ドローンが引いて渓谷の全景、高まるアンビエント音楽。」

15 秒を超えるコンテンツはシーンごとに生成して編集で繋ぎます。複数クリップの結合・カラーマッチ・音声レベル調整は脚本から公開までのワークフローガイドで解説しています。

ステップ 5：参照素材でキャラクターを固定する

1 回の生成で最大 12 個の参照素材をアップロードできます。実務で重要なのは 3 種類：キャラクター参照（同じ顔を別角度から撮った写真 2–3 枚）、スタイル参照（目標のカラーグレードを含む 1 フレーム）、商品参照（EC 用のパックショット）。プロンプト内で素材を参照します（「参照画像の女性」）。これが連続コンテンツでキャラクターを維持する仕組みであり、Sora 2 との直接対決でキャラクター主導のコンテンツ部門を制した理由です。

料金：実際のプロジェクトのコスト

アクセス経路	価格	向いている用途
Sora2U — Seedance 2.0	20 クレジット/秒	ネイティブ音声付きの最終パス
Sora2U — Seedance 1.5	10 クレジット/秒	高速な下書きと反復
fal.ai 従量課金	$0.06–0.15/秒	API 自動化
Atlas Cloud 高速ティア	約 $0.02/秒	低優先度のバッチ処理
CapCut Dreamina	フリーミアム	CapCut ユーザー

現実的な 30 秒広告（15 秒クリップ 2 本、各 4 回の下書き、2 回の最終パス）は従量課金換算でおよそ $8–15 — 従来の撮影なら 1 日 $1,500 以上です。クレジットパックは Sora2U の料金ページをご覧ください。

よくある失敗パターンと対処法

最後の 1 秒で口がずれる — 台詞を短くするか、話していない動作でクリップを終える。
ショット間でキャラクターが変わる — 顔を文章で再記述せず、キャラクター参照画像を追加する。
音声ミックスが濁る — 環境音のレイヤーは最大 2 つまで。3 つ以上は台詞と競合します。
画面内のテキストが崩れる — 2026 年の全モデル共通の弱点。タイトルや字幕は編集で追加。
ピーク時間帯のキュー遅延 — 15 秒クリップに約 10 分。大量生成は夜間バッチで。

毎週新しい Seedance テクニックを受け取る

すべての Seedance リリースを実機テストし、テストを生き残ったプロンプトだけをお届けします。

購読する

よくある質問

Seedance 2.0 は Sora 2 より優れていますか？

得意分野が異なります。Seedance 2.0（8.9/10）は台詞・リップシンク・マルチショットの一貫性・15 秒の尺で優位、Sora 2（9.0/10）は 4 秒の短尺でのセマンティック忠実度で優位です。詳細は Sora 2 vs Seedance 2.0 の比較へ。

Seedance 2.0 の生成にはどれくらい時間がかかりますか？

15 秒・1080p・音声付きクリップで約 10 分です。下書きは Seedance 1.5（Sora2U ではクレジットコスト約半分）で行い、当たったプロンプトを 2.0 で清書するのがおすすめです。

Seedance 2.0 は日本語の台詞に対応していますか？

対応しています。リップシンクは日本語・中国語・スペイン語を含む 8 言語以上で音素レベルの精度です。プロンプトで言語を明示すると最良の結果が得られます。

米国から Seedance を使えますか？

2026 年 4 月時点で ByteDance の直販プロダクトは米国未展開ですが、Sora2U ジェネレーター、fal.ai、CapCut Dreamina などのサードパーティ経由で今日から利用できます。

Seedance 2.0 の動画は商用利用できますか？

できます。生成物には商用ライセンスが付帯します。他の AI 動画と同様、実在の人物の肖像や商標キャラクターの商用生成は避けてください。