ImagineMot — AI動画制作

想像をフレームへ、静止画が動き出す

Realistic Image Quality

Multi-shot Consistency

Audio-Video Sync

ImagineMot

Image / text to video playground

Prompt

prompt

reference_image_urls

0/9

+ Add more files (0/9)

reference_video_urls

0/3

+ Add more files (0/3)

reference_audio_urls

Click to upload or drag and drop

Select files

generate_audio

web_search

nsfw_checker

duration

callbackUrl

resolution

aspect_ratio

Output

taskId: - · state: -

No output yet

AIモデル提供元

Google Veo

ByteDance Seedance

商用利用ライセンス

高速生成とリアルな品質に特化したマルチモーダルAI動画モデル。平均生成時間: 約5分（Standard）、約4分（Turbo）。

Standard

高精細な品質と細かな制御で、プロ品質とマルチショットの一貫性を実現。

Turbo

より高速でコスト効率が高く、試行錯誤や大量の短尺生成に最適。

オンラインデモ | 例

オンラインでプレビューし、ワークフローに合わせてパラメータを素早く検証。

ドキュメント | ガイド

パラメータ説明と例で素早く開始し、量産へ。

入力設定

テキスト・画像・動画・音声の参照を組み合わせて、構図、スタイル、動きの方向をコントロール。

JPG/PNG/WEBP/BMP/GIF対応、各最大30MB。最初/最後のフレームと参照画像をアップロード。

基本パラメータ

時間（4–15秒）、解像度、アスペクト比、Web検索＆安全チェックを設定。AI自動音声で音声同期も可能。

AI自動音声

オン/オフで音声生成を同期し、より自然なオーディオ・ビジュアル整合を実現。

解像度

480P / 720P / 1080P など、用途に合わせて選択。

アスペクト比

16:9、4:3、1:1、3:4、9:16、21:9。

時間

4〜15秒の範囲で指定でき、テンポや遷移を自動調整。

主な特長

2つのバージョン、映画的なカメラモーション、ストーリーボードから動画、マルチモーダル制御、音声同期、柔軟な長さ。

2つのバージョン

Standardは品質と制御重視、Turboは高速な試行錯誤とバッチ生成向け。

映画的モーション

追従・周回・トランジションなどを安定した動きとリアルな物理で再現。

演出 & ストーリーボード

参照からスタイルや編集リズムを学習し、台本/絵コンテから完成動画へ。

マルチモーダル融合

テキスト・画像・動画・音声の参照を組み合わせて高い操作性を実現。

音声・映像同期

音声生成によりリップシンク、ビート同期、雰囲気に合ったカットをサポート。

柔軟な長さ

4〜15秒を選択でき、テンポと物語構造を自動で最適化。

高速生成

平均生成時間: 約5分（Standard）/ 約4分（Turbo）。

約5分

Standard 平均

約4分

Turbo 平均

マルチモーダル

テキスト/画像/動画/音声