動画生成AI「Kling(クリング)」の概要
Kling(クリング)は、中国のショート動画プラットフォーム大手Kuaishou(快手)が開発した動画生成AIモデルです。
2024年6月に発表され、テキストプロンプトから高品質な動画を生成する能力を持っています。
Klingは、独自の大規模言語モデル「Large Vision Language Model (LVLM)」をベースに構築されており、効率的なトレーニングインフラと推論最適化により、最大2分間の30fps、1080pの高画質動画生成を実現しています。
Klingの特徴的な点は、独自のアテンションメカニズムを採用していることで、時間と空間を組み合わせた処理により、複雑な動きをリアルにモデル化できることです。
これにより、物理法則に沿った自然な動きの動画生成が可能となっています。Klingの発表以来、その高い生成精度がOpenAIのSoraに匹敵するとして、ネット上で大きな注目を集めています。
公式サイト:
公式ツイッター:
動画生成AI「KLING(クリング)」のサンプル動画
Twitterで人気を集めているKlingのサンプル動画のURLを3つ抽出しました。
https://twitter.com/minchoi/status/1806332328039297403
https://twitter.com/bdsqlsz/status/1798710076175528354
https://twitter.com/kling_ai/status/1798710076175528354
これらの動画は、Klingの高度な動画生成能力を示すものとして注目を集めています。リアルな動きや物理法則の再現、複雑なシーンの生成など、Klingの多様な機能を垣間見ることができます。
ただし、これらはKlingの能力を示すために選ばれた例であり、すべての生成結果がこのレベルの品質であるとは限らないことに注意が必要です。
動画生成AI「Kling(クリング)」の機能
Klingの主要な機能は、テキストプロンプトから高品質な動画を生成することです。具体的には、以下のような機能を提供しています:
- テキストから動画生成:入力されたテキストプロンプトに基づいて、最大2分間(後に3分間に拡張)の動画を生成します。
- 高解像度・高フレームレート:生成される動画は1080p解像度、30fpsのフルHD品質です。
- 静止画から動画変換:任意の静止画像を5秒の動画に変換する機能があります。
- 動画延長:生成された動画をワンクリックで最長4.5秒延長することができます。
- 動きの追加:新たなプロンプトを与えることで、既存の動画にさまざまな動きを追加できます。
- 物理法則に基づいた自然な動き:独自の3D時空間アテンションシステムにより、複雑な動きや物の相互作用をより正確に再現します。
これらの機能により、Klingは非常に柔軟で高品質な動画生成が可能となっています。例えば、「窓から異なる風景が見える列車の旅」や「季節の変化に伴い風景も変わる庭で自転車に乗る少年」といった複雑なシーンも生成できることが報告されています。
動画生成AI「Kling(クリング)」で利用可能なAIモデル
Klingは、Kuaishouが独自に開発したAIモデルです。具体的には以下のようなモデルや技術が利用されています:
- Large Vision Language Model (LVLM):Klingのベースとなる大規模言語モデルで、画像処理能力を持っています。
- 拡散トランスフォーマー:動画生成AIで従来から使われてきた拡散モデルをトランスフォーマー・アーキテクチャと組み合わせることで、より大きな動画データファイルを理解し、効率的に結果を生成しています。
- 3D Space-Time Attention System:独自のアテンションメカニズムで、時間と空間を組み合わせた処理により、複雑な動きをリアルにモデル化します。
- スケーラブルなフレームワークと最適化された推論:長時間の高解像度動画を生成するために使用されています。
これらのモデルと技術の組み合わせにより、Klingは高品質で自然な動きを持つ動画を生成することができます。特に、物理法則に基づいた動きの再現や、複雑なシーンの生成において優れた性能を発揮しています。
動画生成AI「Kling(クリング)」の料金
Klingの料金体系に関する詳細な情報は、現時点で公開されておらず、期間限定で無料で使えます。
しかし、以下のような状況が報告されています:
- 無料トライアル:Klingは現在、中国で公開デモが利用可能な状態です。これは、一般ユーザーが無料でサービスを試すことができる可能性を示唆しています。
- ウェイティングリスト:6月23日時点で、累計14万人がKlingの利用を申請しているとの報告があります。これは、サービスが段階的に公開されている可能性を示しています。
- アプリ内での利用:Klingは、Kuaishouの動画共有アプリ「快影(Kuai Ying)」内で利用できるようです。このことから、アプリの利用料金や、アプリ内課金の可能性があります。
- 商用利用:現時点では、商用利用に関する料金体系は明らかにされていません。
今後、Klingの一般公開が進むにつれて、より詳細な料金情報が公開されると予想されます。無料トライアルや段階的な料金プランの導入など、ユーザーのニーズに合わせた柔軟な料金体系が期待されます。
動画生成AI「Kling(クリング)」の登録方法
Klingの登録方法は以下の手順で行います:
- 快影(Kuai Ying)アプリのダウンロード:まず、Kuaishouの動画共有アプリ「快影」をダウンロードします。現時点ではiOSのみ対応しています。
- ユーザー規約とプライバシーポリシーの同意:アプリを開いたら、「用户协议及隐私政策」(ユーザー規約およびプライバシーポリシー)の「同意并进入」(同意して進む)を選択します。
- AI創作機能の選択:アプリ内で「AI创作」(AI創作)を選択します。
- 体験申請:「申请体验」(申請体験)を選択します。パンダがギターを弾いているイラストが目印です。
- ログイン方法の選択:「其他方式登录」(その他の方法でログイン)を選択します。
- 中国の電話番号の登録:中国の電話番号を登録する必要があります。
- ウェイティングリストへの参加:登録が完了すると、ウェイティングリストに参加することができます。
注意点として、現時点では中国の電話番号が必要であり、海外からの利用には制限があります。また、ウェイティングリストに参加しても、すぐにサービスを利用できるわけではありません。今後、国際展開や利用条件の緩和が期待されています。
動画生成AI「Kling(クリング)」の他動画生成AIとの違い
Klingは、他の動画生成AIと比較して以下のような特徴や違いがあります:
- 生成動画の長さ:Klingは最大3分間の動画を生成できるのに対し、OpenAIのSoraは最大1分間です。この点でKlingは優位性を持っています。
- 物理法則の再現:Klingは独自の3D時空間アテンションシステムにより、複雑な動きや物の相互作用をより正確に再現できます。例えば、食べ物が減っていく様子や、サイドミラーに映る風景の変化など、細かな物理的な変化を表現できます。
- 利用可能性:Soraやその他の動画生成AI(Google VEO、Luma AI)と比較して、Klingは既に一部のユーザーが利用可能な状態にあります。ただし、現時点では中国国内での利用に限られています。
- フィクション題材の表現力:Klingは「カフェで新聞を読むウサギ」「ギターを弾くパンダ」「車を運転する白猫」といったフィクション題材の表現も得意としています。
- 技術的アプローチ:KlingはLVLMをベースにしており、拡散トランスフォーマーと3D時空間アテンションシステムを組み合わせています。これは、他のAIモデルとは異なるアプローチです。
- 中国市場向け最適化:Kuaishouのプラットフォームとの統合により、中国のショート動画市場に特化した機能や最適化が行われている可能性があります。
これらの特徴により、Klingは特に長時間の動画生成や物理的に正確な動きの再現において、他の動画生成AIと差別化されています。ただし、国際的な利用可能性や多言語対応などの面では、まだ改善の余地があると言えるでしょう。
コメント