ドリームマシーン(テキストからビデオモデル) - 百科事典
Dream Machineは、Luma Labsが作成し2024年6月に発表したテキストからビデオモデルです。ユーザーの指示や静止画に基づいてビデオ出力を生成します。Dream Machineはリアルな動きをキャプチャする能力で知られており、一部の批判者はトレーニングデータの透明性に欠けると指摘しています。
歴史
Dream Machineは、サンフランシスコに本社を置く生成型人工知能会社であるLuma Labsが作成しました。Luma Labsは以前、3Dモデル生成エンジンであるGenieを開発していました。2024年6月12日に公開され、Luma LabsはX(旧Twitter)上でそれを発表し、作成したビデオの例を共有しました。公開直後、ソーシャルメディアのユーザーはMidjourneyで生成された画像のビデオ版や、「耳飾りの少女」や「Doge」などのアートワークやミームの動き再現などを投稿しました。一つのビデオ、架空のアニメ映画「Monster Camp」のトレーラーは、Luma LabsがXアカウントで再投稿しました。プラットフォームのユーザーは、ビデオが「モンスターたちの城」のファンの美学を盗んだと批判し、シリーズのキャラクターであるマイク・ワズオスキーがトレーラーに登場することも指摘しました。また、エレノア・アージェロポウロス監督がDream Machineで作成したピクサー風の古エジプトの少女のアニメーションビデオがオンラインで viral になりました。
機能
2024年6月現在、ユーザーはGoogleアカウントでサインアップし、指示を入力したり静止画を使用することで、5秒間で1360 × 752ピクセルのビデオを作成できます。Dream Machineは自身の大規模言語モデルに基づいて指示を変更します。ユーザーは1日10つのビデオを作成でき、Dream Machineで無料で30本のビデオを作成できます。プログラムには、標準、プロ、プレミアムのサブスクリプションプランもあり、それぞれ120、400、2,000本のビデオを作成できます。Dream Machineのウェブサイトでは、ビデオがテキストや動きを表現するのが難しいと述べています。Luma Labsは、Dream Machine向けの開発者フレンドリーなAPIをリリースする計画があると述べています。リリースの翌週、Luma Labsはビデオの延長、検索機能、ビデオ内編集機能を追加すると発表しました。
受け入れ
Dream Machineが発表された際、OpenAIが作成したテキストからビデオモデルのSoraや、別のテキストからビデオモデルのKlingと比較されました。The Vergeのチャールズ・プルリアム・モアは、生成型AIの「楽観的なファン」が「Dream Machineを革新的な革新」と呼んだと述べましたが、トレーニングデータが公開されていないことについて指摘しました。TechRadarのマーク・ウィルソンも、Dream Machineのトレーニングデータが不明であることについて指摘し、「個人的な使用やGIFゲームの向上を超えた可能性が限られている」と述べましたが、「もっと高度で(もちろん高価な)AIビデオ生成器の試食として確かに楽しいツール」と書きました。Tom's Guideのライアン・モリソンは、Dream Machineを「最も良い指示追従と動き理解AIビデオモデルの1つ」と「生成型AIビデオにおける素晴らしい次のステップ」と呼びましたが、「まだ必要なものに及ばない」とも述べました。Mashableのチャス・ディベネディットトは、ソーシャルメディアで回りまわるユーザー作成のDream Machineビデオを「不気味な動き」や「ハリ・ポッターのような」ものと描述しました。
参考文献
外部リンク
公式ウェブサイト