動画

Seedance 2.0

ByteDanceのフラッグシップマルチモーダル動画モデル — 統合音声動画生成とOmni-referenceディレクター制御。

モデル概要

Seedance 2.0はByteDanceの次世代動画モデルで、統合音声動画アーキテクチャを採用しています。対話、環境音、音楽がビジュアルと同じパスで生成され、自然なリップシンクと物理に沿った効果音を実現します。Omni-referenceモードは最大9枚の画像、3本の動画クリップ、3つの音声ファイルを受け付け、@Image1、@Video1、@Audio1構文でプロンプトから参照できるため、キャラクターの見た目、モーションスタイル、リズムを1回のレンダーで組み合わせられます。HiArtでは、画像キャンバスから始まるショート広告、音楽同期コンテンツ、マルチアセットキャンペーンに最適です。

向いている用途

  • 8言語以上のリップシンク付きネイティブ音声動画同時生成
  • Omni-reference:1レンダーあたり最大9画像、3動画、3音声クリップ
  • テキスト→動画、先頭/末尾フレーム、Omni-referenceモード
  • 480p、720p、1080pで4〜15秒クリップ
  • 適応アスペクト比と改善されたモーション物理
  • カメラ、リズム、被写体モーションのディレクター級制御

代表的なワークフロー

  • 同期ナレーションとサウンドデザイン付きショート広告
  • 音声参照トラックを使った音楽同期SNSクリップ
  • 画像モデルの静止フレーム参照と一致させる必要があるキャラクター動画
  • パッケージショットとモーション参照を組み合わせた商品紹介動画
  • 被写体アイデンティティを一貫させたマルチショットナラティブシーケンス

HiArtでの使い方

  1. 01動画ノードを追加し、HiArtキャンバスでSeedance 2.0を選択します。
  2. 02モードを選択:テキスト→動画、先頭/末尾フレーム、またはOmni-reference。
  3. 03参照メディアを添付し、プロンプトで引用します(@Image1が@Video1のモーションを実行)。
  4. 04音声生成を有効にし、尺(4〜15秒)と解像度を設定して生成・反復します。

仕様

プロバイダー
ByteDance Seed
モード
テキスト→動画、先頭/末尾フレーム、Omni-reference
4〜15秒
解像度
480p、720p、1080p
Omni-reference上限
9画像、3動画(合計≤15秒)、3音声クリップ(合計≤15秒)
音声
リップシンク付きネイティブ生成

参考リンク

よくある質問

Omni-referenceモードとは?
Omni-referenceは開始フレームだけでなく、複数の画像、動画、音声ファイルをクリエイティブ入力として添付できます。各アセットをプロンプトで参照し、外見、モーション、リズムを1回の生成で組み合わせます。
Seedance 2.0と2.0 Fastのどちらを使うべき?
480p/720pでのモーションプレビューと迅速な反復にはSeedance 2.0 Fastを使用します。1080p出力や最高のモーション・音声品質が必要な場合はフルSeedance 2.0に切り替えてください。

関連モデル

キャンバスで試す

無料登録してプロジェクトを開き、生成前にモデル設定を行えます。