論文の概要: UniMotion: A Unified Motion Framework for Simulation, Prediction and Planning
- arxiv url: http://arxiv.org/abs/2602.00566v1
- Date: Sat, 31 Jan 2026 07:12:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 05:16:56.305046
- Title: UniMotion: A Unified Motion Framework for Simulation, Prediction and Planning
- Title(参考訳): UniMotion: シミュレーション、予測、計画のための統一モーションフレームワーク
- Authors: Nan Song, Junzhe Jiang, Jingyu Li, Xiatian Zhu, Li Zhang,
- Abstract要約: 動作タスク間の共有構造をキャプチャする統合モーションフレームワークUniMotionを提案する。
UniMotionは、これらの動作タスクを同時にサポートするために、専用のインタラクションモードと調整されたトレーニング戦略を採用している。
さらなる微調整により、UniMotionはさまざまな動作タスクにおける最先端のパフォーマンスを達成し、自動運転のための汎用的でスケーラブルなソリューションとして確立する。
- 参考スコア(独自算出の注目度): 60.55873455475112
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Motion simulation, prediction and planning are foundational tasks in autonomous driving, each essential for modeling and reasoning about dynamic traffic scenarios. While often addressed in isolation due to their differing objectives, such as generating diverse motion states or estimating optimal trajectories, these tasks inherently depend on shared capabilities: understanding multi-agent interactions, modeling motion behaviors, and reasoning over temporal and spatial dynamics. Despite this underlying commonality, existing approaches typically adopt specialized model designs, which hinders cross-task generalization and system scalability. More critically, this separation overlooks the potential mutual benefits among tasks. Motivated by these observations, we propose UniMotion, a unified motion framework that captures shared structures across motion tasks while accommodating their individual requirements. Built on a decoder-only Transformer architecture, UniMotion employs dedicated interaction modes and tailored training strategies to simultaneously support these motion tasks. This unified design not only enables joint optimization and representation sharing but also allows for targeted fine-tuning to specialize in individual tasks when needed. Extensive experiments on the Waymo Open Motion Dataset demonstrate that joint training leads to robust generalization and effective task integration. With further fine-tuning, UniMotion achieves state-of-the-art performance across a range of motion tasks, establishing it as a versatile and scalable solution for autonomous driving.
- Abstract(参考訳): 運動シミュレーション、予測、計画は自律運転の基本課題であり、それぞれが動的交通シナリオのモデル化と推論に不可欠である。
多様な運動状態の生成や最適軌道の推定など、異なる目的のために、しばしば分離して対処されるが、これらのタスクは本質的には、多エージェント相互作用の理解、動作のモデル化、時間的および空間的ダイナミクスの推論といった共有機能に依存する。
この基本的な共通性にもかかわらず、既存のアプローチは一般的に、クロスタスクの一般化とシステムのスケーラビリティを妨げる特別なモデル設計を採用する。
より重要なことに、この分離はタスク間の潜在的な相互利益を見落としている。
これらの観測によって動機づけられたUniMotionは、個々の要求を調節しながら、動作タスク間の共有構造をキャプチャする統合モーションフレームワークである。
UniMotionはデコーダのみのTransformerアーキテクチャ上に構築されており、専用の対話モードとトレーニング戦略を採用して、これらの動作タスクを同時にサポートしている。
この統合された設計は、共同最適化と表現共有を可能にするだけでなく、必要に応じて個別のタスクを専門化するための微調整も可能にしている。
Waymo Open Motion Datasetに関する大規模な実験は、共同トレーニングが堅牢な一般化と効果的なタスク統合につながることを実証している。
さらなる微調整により、UniMotionはさまざまな動作タスクにおける最先端のパフォーマンスを達成し、自動運転のための汎用的でスケーラブルなソリューションとして確立する。
関連論文リスト
- DeMo++: Motion Decoupling for Autonomous Driving [41.6423398623095]
動作意図を2つの異なるコンポーネントに分離するフレームワークであるDeMo++を提案する。
隣接するシーンにおける動き間の関係を探索するために,クロスシーンの軌道間相互作用機構を導入する。
DeMo++は、モーション予測(Argoverse 2とnuScenes)、モーション計画(nuPlan)、エンドツーエンド計画(SIM)など、さまざまなベンチマークで最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-07-23T09:11:25Z) - Learning to Move in Rhythm: Task-Conditioned Motion Policies with Orbital Stability Guarantees [45.137864140049814]
我々は,学習した微分型エンコーダと超臨界ホップ分岐を結合したフレームワークであるOrbitally Stable Motion Primitives (OSMPs)を紹介する。
提案手法は,多種多様なロボットプラットフォームにまたがる広範囲なシミュレーションと実世界の実験によって検証される。
論文 参考訳(メタデータ) (2025-07-12T17:10:03Z) - GENMO: A GENeralist Model for Human MOtion [64.16188966024542]
本稿では,1つのフレームワークで動作推定と生成を橋渡しする汎用人体運動モデル GENMO を提案する。
我々の重要な洞察は、出力運動が観測された条件信号を正確に満たさなければならないような制約された動き生成として運動推定を再構成することである。
我々の新しいアーキテクチャは、可変長動きと混合マルチモーダル条件(テキスト、オーディオ、ビデオ)を異なる時間間隔で処理し、柔軟な制御を提供する。
論文 参考訳(メタデータ) (2025-05-02T17:59:55Z) - DeepInteraction++: Multi-Modality Interaction for Autonomous Driving [80.8837864849534]
我々は,モダリティごとの個別表現を学習し,維持することのできる,新しいモダリティインタラクション戦略を導入する。
DeepInteraction++はマルチモーダルなインタラクション・フレームワークであり、マルチモーダルな表現型インタラクション・エンコーダとマルチモーダルな予測型インタラクション・デコーダを特徴とする。
実験では,3次元物体検出とエンドツーエンドの自律走行の両方において,提案手法の優れた性能を示す。
論文 参考訳(メタデータ) (2024-08-09T14:04:21Z) - AMP: Adversarial Motion Priors for Stylized Physics-Based Character
Control [145.61135774698002]
我々は,与えられたシナリオで追跡するキャラクタの動作を選択するための完全自動化手法を提案する。
キャラクタが実行するべきハイレベルなタスク目標は、比較的単純な報酬関数によって指定できる。
キャラクタの動作の低レベルスタイルは、非構造化モーションクリップのデータセットによって指定できる。
本システムでは,最先端のトラッキング技術に匹敵する高品質な動作を生成する。
論文 参考訳(メタデータ) (2021-04-05T22:43:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。