論文の概要: SwarmGPT-Primitive: A Language-Driven Choreographer for Drone Swarms Using Safe Motion Primitive Composition
- arxiv url: http://arxiv.org/abs/2412.08428v1
- Date: Wed, 11 Dec 2024 14:48:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-12 14:01:09.434663
- Title: SwarmGPT-Primitive: A Language-Driven Choreographer for Drone Swarms Using Safe Motion Primitive Composition
- Title(参考訳): SwarmGPT-Primitive: 安全なモーションプリミティブ構成を用いたドローン群のための言語駆動型コレオグラフィ
- Authors: Vedant Vyas, Martin Schuck, Dinushka O. Dahanaggamaarachchi, Siqi Zhou, Angela P. Schoellig,
- Abstract要約: SwarmGPT-Primitiveは、大きな言語モデルの推論能力と安全な動き計画を統合する言語ベースの振付法である。
SwarmGPT-Primitiveフレームワークは、安全なモーションプランニングからコレオグラフィー設計を分離する。
我々は、さまざまな歌を基にした振付を行う最大20機のドローンの群れによるシミュレーションと実験を通じて、我々のアプローチを実証する。
- 参考スコア(独自算出の注目度): 7.683717031940845
- License:
- Abstract: Catalyzed by advancements in hardware and software, drone performances are increasingly making their mark in the entertainment industry. However, designing smooth and safe choreographies for drone swarms is complex and often requires expert domain knowledge. In this work, we introduce SwarmGPT-Primitive, a language-based choreographer that integrates the reasoning capabilities of large language models (LLMs) with safe motion planning to facilitate deployable drone swarm choreographies. The LLM composes choreographies for a given piece of music by utilizing a library of motion primitives; the language-based choreographer is augmented with an optimization-based safety filter, which certifies the choreography for real-world deployment by making minimal adjustments when feasibility and safety constraints are violated. The overall SwarmGPT-Primitive framework decouples choreographic design from safe motion planning, which allows non-expert users to re-prompt and refine compositions without concerns about compliance with constraints such as avoiding collisions or downwash effects or satisfying actuation limits. We demonstrate our approach through simulations and experiments with swarms of up to 20 drones performing choreographies designed based on various songs, highlighting the system's ability to generate effective and synchronized drone choreographies for real-world deployment.
- Abstract(参考訳): ハードウェアとソフトウェアの進歩によって、ドローンのパフォーマンスはエンターテイメント業界でますます注目を集めている。
しかし、ドローン群のためのスムーズで安全な振付を設計するのは複雑であり、しばしば専門家のドメイン知識を必要とする。
本研究では,大規模言語モデル(LLM)の推論機能と安全な動作計画を統合し,展開可能なドローン群コレオグラフィを容易にする言語ベースのコレオグラフィであるSwarmGPT-Primitiveを紹介する。
LLMは、動きプリミティブのライブラリを利用して、特定の楽曲のための振付を作成する。言語ベースの振付には、現実の展開のための振付を認証する最適化ベースの安全フィルタが備わっている。
全体的なSwarmGPT-Primitiveフレームワークは、コレオグラフィー設計を安全な動作計画から切り離し、非専門家のユーザは、衝突やダウンウォッシュ効果の回避やアクティベーション制限の満足といった制約に従わずに、作曲を再宣伝し、洗練することができる。
我々は、さまざまな曲に基づいてデザインされた振付を行う最大20台のドローンの群れによるシミュレーションと実験を通じて、我々のアプローチを実証し、実世界の展開のために効果的で同期化されたドローン振付を生成するシステムの能力を強調した。
関連論文リスト
- Lodge++: High-quality and Long Dance Generation with Vivid Choreography Patterns [48.54956784928394]
Lodge++は、高品質で、超長い、鮮やかなダンスを生成するためのコレオグラフィーフレームワークである。
計算効率の課題に対処するため、Lodge++では、粗いダンスから罰金までのダンスを生成するための2段階の戦略を採用している。
Lodge++は,様々なダンスジャンルに適した超長いダンスを高速に生成できることを示す広範な実験によって検証されている。
論文 参考訳(メタデータ) (2024-10-27T09:32:35Z) - Image Conductor: Precision Control for Interactive Video Synthesis [90.2353794019393]
映画製作とアニメーション制作は、しばしばカメラの遷移と物体の動きを調整するための洗練された技術を必要とする。
イメージコンダクタ(Image Conductor)は、カメラトランジションとオブジェクトの動きを正確に制御し、単一の画像からビデオアセットを生成する方法である。
論文 参考訳(メタデータ) (2024-06-21T17:55:05Z) - Duolando: Follower GPT with Off-Policy Reinforcement Learning for Dance Accompaniment [87.20240797625648]
舞踊伴奏と呼ばれる3次元舞踊生成の分野における新しい課題を紹介する。
これは、リードダンサーの動きと、基礎となる音楽リズムと同期した「フォロワー」と呼ばれるダンスパートナーからの応答的な動きを生成する必要がある。
本稿では,GPTに基づくDuolandoモデルを提案する。このモデルでは,音楽の協調情報,リーダの動作,従者の動きに基づいて,後続のトークン化動作を自動回帰予測する。
論文 参考訳(メタデータ) (2024-03-27T17:57:02Z) - Harmonious Group Choreography with Trajectory-Controllable Diffusion [28.82215057058883]
Trajectory-Controllable Diffusion (TCDiff) は、重複しない軌道を利用してコヒーレントなダンスの動きを促進する新しい手法である。
ダンサーの衝突に対処するために,音楽に基づいて複数のダンサーの軌道を生成できるダンス・ビート・ナビゲータを導入する。
フレキシブルなフットワークを実現するために,隣接するフレームからの軌道変位を利用したフットワークアダプタを提案する。
論文 参考訳(メタデータ) (2024-03-10T12:11:34Z) - Bailando: 3D Dance Generation by Actor-Critic GPT with Choreographic
Memory [92.81383016482813]
そこで我々は3Dキャラクターを1曲の楽曲に追従して踊るための新しい音楽間距離フレームワークBailandoを提案する。
本稿では,音楽に忠実な流麗なダンスにユニットを構成するアクタ批判型生成事前学習変換器(GPT)を紹介する。
提案するフレームワークは,定性的かつ定量的に最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-03-24T13:06:43Z) - Music-to-Dance Generation with Optimal Transport [48.92483627635586]
本稿では,音楽から3Dダンス振付を生成するためのMDOT-Net(Music-to-Dance with Optimal Transport Network)を提案する。
生成したダンス分布とグロモフ=ワッサーシュタイン距離の信頼度を評価するための最適な移動距離を導入し、ダンス分布と入力音楽の対応性を測定する。
論文 参考訳(メタデータ) (2021-12-03T09:37:26Z) - Learning to Generate Diverse Dance Motions with Transformer [67.43270523386185]
ダンス・モーション・シンセサイザーのための完全なシステムを提案する。
大規模なダンスモーションデータセットはYouTubeビデオから作成される。
新たな2ストリームモーショントランス生成モデルでは、高い柔軟性で動作シーケンスを生成することができる。
論文 参考訳(メタデータ) (2020-08-18T22:29:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。