Fugu-MT 論文翻訳(概要): Deciphering Movement: Unified Trajectory Generation Model for Multi-Agent

論文の概要: Deciphering Movement: Unified Trajectory Generation Model for Multi-Agent

arxiv url: http://arxiv.org/abs/2405.17680v1
Date: Mon, 27 May 2024 22:15:23 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-29 23:01:26.829823
Title: Deciphering Movement: Unified Trajectory Generation Model for Multi-Agent
Title（参考訳）: 解読運動:マルチエージェントのための統一軌道生成モデル
Authors: Yi Xu, Yun Fu,
Abstract要約: 任意の軌道をマスク入力として処理する統一軌道生成モデルUniTrajを提案する。具体的には,空間特徴抽出のためのトランスフォーマーエンコーダ内に埋め込まれたゴースト空間マスキング(GSM)モジュールを導入する。バスケットボール-U,サッカー-U,サッカー-Uの3つの実用的なスポーツゲームデータセットをベンチマークして評価を行った。
参考スコア（独自算出の注目度）: 53.637837706712794
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Understanding multi-agent behavior is critical across various fields. The conventional approach involves analyzing agent movements through three primary tasks: trajectory prediction, imputation, and spatial-temporal recovery. Considering the unique input formulation and constraint of these tasks, most existing methods are tailored to address only one specific task. However, in real-world applications, these scenarios frequently occur simultaneously. Consequently, methods designed for one task often fail to adapt to others, resulting in performance drops. To overcome this limitation, we propose a Unified Trajectory Generation model, UniTraj, that processes arbitrary trajectories as masked inputs, adaptable to diverse scenarios. Specifically, we introduce a Ghost Spatial Masking (GSM) module embedded within a Transformer encoder for spatial feature extraction. We further extend recent successful State Space Models (SSMs), particularly the Mamba model, into a Bidirectional Temporal Mamba to effectively capture temporal dependencies. Additionally, we incorporate a Bidirectional Temporal Scaled (BTS) module to comprehensively scan trajectories while maintaining the temporal missing relationships within the sequence. We curate and benchmark three practical sports game datasets, Basketball-U, Football-U, and Soccer-U, for evaluation. Extensive experiments demonstrate the superior performance of our model. To the best of our knowledge, this is the first work that addresses this unified problem through a versatile generative framework, thereby enhancing our understanding of multi-agent movement. Our datasets, code, and model weights are available at https://github.com/colorfulfuture/UniTraj-pytorch.
Abstract（参考訳）: マルチエージェントの振る舞いを理解することは、様々な分野において重要である。従来の手法では, 軌道予測, インプット, 空間的時間的回復という3つの主要なタスクを通じてエージェントの動きを解析する。これらのタスクのユニークな入力の定式化と制約を考えると、既存のほとんどのメソッドは1つの特定のタスクにのみ対処するように調整されている。しかし、現実世界のアプリケーションでは、これらのシナリオは同時に発生することが多い。その結果、あるタスクのために設計されたメソッドは、しばしば他のタスクへの適応に失敗し、結果としてパフォーマンスが低下する。この制限を克服するために,任意の軌道をマスク入力として処理し,多様なシナリオに適用可能な統一軌道生成モデルUniTrajを提案する。具体的には,空間特徴抽出のためのトランスフォーマーエンコーダ内に埋め込まれたゴースト空間マスキング(GSM)モジュールを導入する。我々はさらに、最近成功したステートスペースモデル(特にマンバモデル)を双方向のテンポラルマンバに拡張し、時間的依存を効果的に捉える。さらに、双方向時間スケール(BTS)モジュールを組み込んで、シーケンス内の時間的欠落関係を維持しながら、トラジェクトリを包括的にスキャンする。バスケットボール-U,サッカー-U,サッカー-Uの3つの実用的なスポーツゲームデータセットを評価し,評価を行った。大規模な実験は、我々のモデルの優れた性能を示す。我々の知る限りでは、この統一的な問題を多元的生成フレームワークを通じて解決し、マルチエージェント運動の理解を深める最初の研究である。データセット、コード、モデルウェイトはhttps://github.com/colorfulfuture/UniTraj-pytorch.comで公開されています。

関連論文リスト

Efficient Multi-Person Motion Prediction by Lightweight Spatial and Temporal Interactions [45.51160285910023]
空間的・時間的相互作用を単純化し,多人数動作予測のための計算効率の良いモデルを提案する。 CMU-Mocap, MuPoTS-3D, 3DPW の標準データセット上で, マルチメトリックの最先端性能を実現する。
論文参考訳（メタデータ） (2025-07-13T02:16:37Z)
SportMamba: Adaptive Non-Linear Multi-Object Tracking with State Space Models for Team Sports [10.705443721911406]
SportMambaは、動的チームスポーツのトラッキングに特化した適応型ハイブリッドMOT技術である。提案手法であるSportsMambaは,SportsMOTデータセットにおける各種メトリクスの最先端性能を示す。
論文参考訳（メタデータ） (2025-06-03T19:28:41Z)
GENMO: A GENeralist Model for Human MOtion [64.16188966024542]
本稿では,1つのフレームワークで動作推定と生成を橋渡しする汎用人体運動モデル GENMO を提案する。我々の重要な洞察は、出力運動が観測された条件信号を正確に満たさなければならないような制約された動き生成として運動推定を再構成することである。我々の新しいアーキテクチャは、可変長動きと混合マルチモーダル条件(テキスト、オーディオ、ビデオ)を異なる時間間隔で処理し、柔軟な制御を提供する。
論文参考訳（メタデータ） (2025-05-02T17:59:55Z)
UniSTD: Towards Unified Spatio-Temporal Learning across Diverse Disciplines [64.84631333071728]
本稿では,時間的モデリングのためのトランスフォーマーベースの統合フレームワークであるbfUnistageを紹介する。我々の研究は、タスク固有の視覚テキストが時間学習のための一般化可能なモデルを構築することができることを示した。また、時間的ダイナミクスを明示的に組み込むための時間的モジュールも導入する。
論文参考訳（メタデータ） (2025-03-26T17:33:23Z)
TacticExpert: Spatial-Temporal Graph Language Model for Basketball Tactics [0.0]
バスケットボールの戦術モデリングは、歴史的データから複雑な空間的依存関係を効率的に抽出する必要がある。既存の最先端(SOTA)モデルは、主にグラフニューラルネットワーク(GNN)に基づいており、長期的な、長距離、きめ細かい相互作用を捉えるのに苦労している。
論文参考訳（メタデータ） (2025-03-13T08:27:24Z)
Multi-Transmotion: Pre-trained Model for Human Motion Prediction [68.87010221355223]
マルチトランスモーション(Multi-Transmotion)は、モダリティ事前トレーニング用に設計された革新的なトランスフォーマーベースのモデルである。提案手法は,下流タスクにおける各種データセット間の競合性能を示す。
論文参考訳（メタデータ） (2024-11-04T23:15:21Z)
TranSPORTmer: A Holistic Approach to Trajectory Understanding in Multi-Agent Sports [28.32714256545306]
TranSportmerは、これらすべてのタスクに対処できる統合トランスフォーマーベースのフレームワークである。時間的ダイナミクスと社会的相互作用を同変的に効果的に捉える。プレイヤー予測、プレイヤー予測・インプット、ボール推論、ボールインプットにおいて、最先端のタスク固有モデルより優れている。
論文参考訳（メタデータ） (2024-10-23T11:35:44Z)
TIMBA: Time series Imputation with Bi-directional Mamba Blocks and Diffusion models [0.0]
時間指向変換器を状態空間モデル(SSM)に置き換えることを提案する。我々は、拡張表現を実現するために、SSM、グラフニューラルネットワーク、ノード指向変換器を統合するモデルを開発する。
論文参考訳（メタデータ） (2024-10-08T11:10:06Z)
MambaTrack: A Simple Baseline for Multiple Object Tracking with State Space Model [18.607106274732885]
我々は、MTP(Mamba moTion Predictor)という、マンバをベースとしたモーションモデルを導入する。 MTPは、物体の時空間的位置ダイナミクスを入力として、バイマンバ符号化層を用いて動きパターンをキャプチャし、次の動きを予測する。提案するトラッカーであるMambaTrackは、DancetrackやSportsMOTなどのベンチマークで高度なパフォーマンスを示す。
論文参考訳（メタデータ） (2024-08-17T11:58:47Z)
DeTra: A Unified Model for Object Detection and Trajectory Forecasting [68.85128937305697]
提案手法は,2つのタスクの結合を軌道修正問題として定式化する。この統合タスクに対処するために、オブジェクトの存在, ポーズ, マルチモーダルな将来の振る舞いを推測する精細化変換器を設計する。実験では、我々のモデルはArgoverse 2 Sensor and Openデータセットの最先端性よりも優れています。
論文参考訳（メタデータ） (2024-06-06T18:12:04Z)
Modeling Continuous Motion for 3D Point Cloud Object Tracking [54.48716096286417]
本稿では,各トラックレットを連続ストリームとみなす新しいアプローチを提案する。各タイムスタンプでは、現在のフレームだけがネットワークに送られ、メモリバンクに格納された複数フレームの履歴機能と相互作用する。頑健な追跡のためのマルチフレーム機能の利用性を高めるために,コントラッシブシーケンス強化戦略を提案する。
論文参考訳（メタデータ） (2023-03-14T02:58:27Z)
Snipper: A Spatiotemporal Transformer for Simultaneous Multi-Person 3D Pose Estimation Tracking and Forecasting on a Video Snippet [24.852728097115744]
RGBからの多人数ポーズ理解には、ポーズ推定、トラッキング、動き予測という3つの複雑なタスクが含まれる。既存の作業の多くは、ひとつのタスクに集中するか、複数のタスクを別々に解決するためのマルチステージアプローチを採用するかのどちらかです。 Snipperは、複数の人物によるポーズ推定、追跡、動き予測を同時に行うための統合されたフレームワークである。
論文参考訳（メタデータ） (2022-07-09T18:42:14Z)
Learning Behavior Representations Through Multi-Timescale Bootstrapping [8.543808476554695]
本稿では,行動のマルチスケール表現学習モデルであるBootstrap Across Multiple Scales (BAMS)を紹介する。まず,異なる地形タイプをナビゲートする四足歩行のデータセットに本手法を適用し,そのモデルが行動の時間的複雑さを捉えていることを示す。
論文参考訳（メタデータ） (2022-06-14T17:57:55Z)
Joint Spatial-Temporal and Appearance Modeling with Transformer for Multiple Object Tracking [59.79252390626194]
本稿ではTransSTAMという新しい手法を提案する。Transformerを利用して各オブジェクトの外観特徴とオブジェクト間の空間的時間的関係の両方をモデル化する。提案手法はMOT16, MOT17, MOT20を含む複数の公開ベンチマークで評価され, IDF1とHOTAの両方で明確な性能向上を実現している。
論文参考訳（メタデータ） (2022-05-31T01:19:18Z)
P-STMO: Pre-Trained Spatial Temporal Many-to-One Model for 3D Human Pose Estimation [78.83305967085413]
本稿では,2次元から3次元のポーズ推定作業のためのP-STMOモデルを提案する。提案手法は,パラメータが少なく,計算オーバーヘッドが少なく,最先端の手法より優れている。
論文参考訳（メタデータ） (2022-03-15T04:00:59Z)
baller2vec: A Multi-Entity Transformer For Multi-Agent Spatiotemporal Modeling [17.352818121007576]
マルチエージェント・テンポラリ・モデリングは,アルゴリズム設計の観点からも,計算の観点からも難しい課題である。本稿では,標準トランスフォーマーの多元性一般化である Baller2vec について紹介する。バスケットボールに関連する2つのタスクを訓練し,マルチエージェント・テンポラル・モデリングにおける Baller2vec の有効性を検証した。
論文参考訳（メタデータ） (2021-02-05T17:02:04Z)
SMART: Simultaneous Multi-Agent Recurrent Trajectory Prediction [72.37440317774556]
本稿では,将来の軌道予測における2つの重要な課題に対処する手法を提案する。エージェントの数に関係なく、トレーニングデータと予測と一定時間の推測の両方において、マルチモーダリティ。
論文参考訳（メタデータ） (2020-07-26T08:17:10Z)
A Spatial-Temporal Attentive Network with Spatial Continuity for Trajectory Prediction [74.00750936752418]
空間連続性をもつ空間時間減衰ネットワーク(STAN-SC)という新しいモデルを提案する。まず、最も有用かつ重要な情報を探るために、空間的時間的注意機構を提示する。第2に、生成軌道の空間的連続性を維持するために、シーケンスと瞬間状態情報に基づく共同特徴系列を実行する。
論文参考訳（メタデータ） (2020-03-13T04:35:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。