論文の概要: HOME: Heatmap Output for future Motion Estimation
- arxiv url: http://arxiv.org/abs/2105.10968v1
- Date: Sun, 23 May 2021 16:27:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 14:59:29.030786
- Title: HOME: Heatmap Output for future Motion Estimation
- Title(参考訳): HOME:将来の動き推定のためのヒートマップ出力
- Authors: Thomas Gilles, Stefano Sabatini, Dzmitry Tsishkou, Bogdan
Stanciulescu, Fabien Moutarde
- Abstract要約: Homeは、エージェントの将来の位置の確率分布を表す画像出力を用いて、モーション予測問題に対処するフレームワークである。
提案手法をArgoverse Motion Forecasting Benchmarkに適用し,オンラインリーダーボード上で1位を獲得した。
- 参考スコア(独自算出の注目度): 2.424910201171407
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we propose HOME, a framework tackling the motion forecasting
problem with an image output representing the probability distribution of the
agent's future location. This method allows for a simple architecture with
classic convolution networks coupled with attention mechanism for agent
interactions, and outputs an unconstrained 2D top-view representation of the
agent's possible future. Based on this output, we design two methods to sample
a finite set of agent's future locations. These methods allow us to control the
optimization trade-off between miss rate and final displacement error for
multiple modalities without having to retrain any part of the model. We apply
our method to the Argoverse Motion Forecasting Benchmark and achieve 1st place
on the online leaderboard.
- Abstract(参考訳): 本稿では,エージェントの将来の位置の確率分布を表す画像出力を用いて,動き予測問題に対処するフレームワークであるHOMEを提案する。
この方法では,従来の畳み込みネットワークとエージェントインタラクションのアテンション機構を結合したシンプルなアーキテクチャが実現され,エージェントの将来性に関する制約のない2次元トップビュー表現が出力される。
この出力に基づいて,エージェントの将来位置の有限集合をサンプリングする2つの手法を設計する。
これらの手法により,モデルの一部を再トレーニングすることなく,複数モードのミスレートと最終変位誤差の最適化トレードオフを制御できる。
提案手法をArgoverse Motion Forecasting Benchmarkに適用し,オンラインリーダーボード上で1位を獲得した。
関連論文リスト
- AdaOcc: Adaptive Forward View Transformation and Flow Modeling for 3D Occupancy and Flow Prediction [56.72301849123049]
CVPR 2024 における nuScenes Open-Occ データセットチャレンジにおいて,視覚中心の3次元活動とフロー予測トラックのソリューションを提案する。
我々の革新的なアプローチは、適応的なフォワード・ビュー・トランスフォーメーションとフロー・モデリングを取り入れることで、3次元の占有率とフロー予測を向上させる2段階のフレームワークである。
提案手法は回帰と分類を組み合わせることで,様々な場面におけるスケールの変動に対処し,予測フローを利用して将来のフレームに現行のボクセル特徴をワープする。
論文 参考訳(メタデータ) (2024-07-01T16:32:15Z) - Generative Hierarchical Temporal Transformer for Hand Pose and Action Modeling [67.94143911629143]
ハンドポーズとアクションをモデル化するための生成型Transformer VAEアーキテクチャを提案する。
手ポーズとアクションのセマンティックな依存性と時間的粒度を忠実にモデル化するために、我々はこのフレームワークを2つのケース化されたVAEブロックに分解する。
その結果,独立解よりも認識と予測の連成モデリングが向上することが示唆された。
論文 参考訳(メタデータ) (2023-11-29T05:28:39Z) - Real-Time Motion Prediction via Heterogeneous Polyline Transformer with
Relative Pose Encoding [121.08841110022607]
既存のエージェント中心の手法は、公開ベンチマークで顕著な性能を示した。
K-nearest neighbor attention with relative pose encoding (KNARPE) は、トランスフォーマーがペアワイズ相対表現を使用できる新しいアテンション機構である。
エージェント間でコンテキストを共有し、変化しないコンテキストを再利用することで、私たちのアプローチはシーン中心のメソッドと同じくらい効率的になり、最先端のエージェント中心のメソッドと同等に実行されます。
論文 参考訳(メタデータ) (2023-10-19T17:59:01Z) - MotionLM: Multi-Agent Motion Forecasting as Language Modeling [15.317827804763699]
マルチエージェント動作予測のための言語モデルであるMotionLMを提案する。
本手法は,対話的なスコアリングに先立って個々のエージェントの軌道生成を行う,ポストホック相互作用をバイパスする。
モデルの逐次分解は、時間的因果条件のロールアウトを可能にする。
論文 参考訳(メタデータ) (2023-09-28T15:46:25Z) - QCNeXt: A Next-Generation Framework For Joint Multi-Agent Trajectory
Prediction [5.312631388611489]
路上エージェントの将来の軌跡の同時分布を推定することは自動運転に不可欠である。
本稿では,QCNeXtと呼ばれるマルチエージェント軌道予測のための次世代フレームワークを提案する。
提案手法はArgoverse 2マルチエージェント動作予測ベンチマークで1位である。
論文 参考訳(メタデータ) (2023-06-18T09:40:40Z) - MotionDiffuser: Controllable Multi-Agent Motion Prediction using
Diffusion [15.146808801331774]
MotionDiffuserは、複数のエージェント上での将来の軌跡の連成分布の拡散に基づく表現である。
そこで本稿では,コスト関数の相違に基づくトラジェクトリサンプリングを可能にする汎用的な制約付きサンプリングフレームワークを提案する。
我々は,Open Motionデータセット上でのマルチエージェント動作予測の最先端結果を得る。
論文 参考訳(メタデータ) (2023-06-05T17:55:52Z) - GoRela: Go Relative for Viewpoint-Invariant Motion Forecasting [121.42898228997538]
精度や一般化を犠牲にすることなく、全てのエージェントとマップに対して効率的な共有符号化を提案する。
不均一空間グラフにおけるエージェントとマップ要素間の幾何学的関係を表現するために、ペアワイズ相対的な位置符号化を利用する。
我々のデコーダは視点非依存であり、レーングラフ上でエージェント目標を予測し、多様かつコンテキスト対応のマルチモーダル予測を可能にする。
論文 参考訳(メタデータ) (2022-11-04T16:10:50Z) - LatentFormer: Multi-Agent Transformer-Based Interaction Modeling and
Trajectory Prediction [12.84508682310717]
将来の車両軌道予測のためのトランスフォーマーモデルであるLatentFormerを提案する。
提案手法をnuScenesベンチマークデータセット上で評価し,提案手法が最先端性能を実現し,トラジェクトリ指標を最大40%向上することを示す。
論文 参考訳(メタデータ) (2022-03-03T17:44:58Z) - Poseur: Direct Human Pose Regression with Transformers [119.79232258661995]
単一画像からの2次元人間のポーズ推定に対する直接回帰に基づくアプローチを提案する。
私たちのフレームワークはエンドツーエンドの差別化が可能で、キーポイント間の依存関係を自然に活用することを学びます。
我々のアプローチは、最も優れたヒートマップベースのポーズ推定手法と比較して好意的に機能する最初の回帰ベースのアプローチである。
論文 参考訳(メタデータ) (2022-01-19T04:31:57Z) - THOMAS: Trajectory Heatmap Output with learned Multi-Agent Sampling [2.424910201171407]
本稿では,高速かつ同時エージェントによる将来のヒートマップ推定のための統一モデルアーキテクチャを提案する。
シーン一貫性のある予測を生成することは、衝突のない軌道の単なる世代を越えている。
我々は、Interaction Multi-agent Prediction Challengeについて報告し、オンラインテストリーダーボードで1st$をランク付けした。
論文 参考訳(メタデータ) (2021-10-13T10:05:47Z) - Traffic Agent Trajectory Prediction Using Social Convolution and
Attention Mechanism [57.68557165836806]
本稿では,自律走行車周辺における標的エージェントの軌道予測モデルを提案する。
対象エージェントの履歴トラジェクトリをアテンションマスクとしてエンコードし、ターゲットエージェントとその周辺エージェント間の対話関係をエンコードするソーシャルマップを構築する。
提案手法の有効性を検証するため,提案手法を公開データセット上の複数の手法と比較し,20%の誤差低減を実現した。
論文 参考訳(メタデータ) (2020-07-06T03:48:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。