論文の概要: RedMotion: Motion Prediction via Redundancy Reduction
- arxiv url: http://arxiv.org/abs/2306.10840v2
- Date: Thu, 5 Oct 2023 16:13:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-06 22:01:36.526103
- Title: RedMotion: Motion Prediction via Redundancy Reduction
- Title(参考訳): RedMotion:冗長化による動き予測
- Authors: Royden Wagner, Omer Sahin Tas, Marvin Klemp, Carlos Fernandez Lopez
- Abstract要約: 動作予測のための変換モデルであるRedMotionを導入する。
第1の冗長性低減は、内部トランスデコーダによって誘導され、可変サイズの道路環境トークンセットを縮小する。
第2の冗長性低減は, 自己指導型学習目標であり, 道路環境の拡張ビューから生成された埋め込みに冗長性低減原理を適用した。
- 参考スコア(独自算出の注目度): 13.530817610569448
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predicting the future motion of traffic agents is vital for self-driving
vehicles to ensure their safe operation. We introduce RedMotion, a transformer
model for motion prediction that incorporates two types of redundancy
reduction. The first type of redundancy reduction is induced by an internal
transformer decoder and reduces a variable-sized set of road environment
tokens, such as road graphs with agent data, to a fixed-sized embedding. The
second type of redundancy reduction is a self-supervised learning objective and
applies the redundancy reduction principle to embeddings generated from
augmented views of road environments. Our experiments reveal that our
representation learning approach can outperform PreTraM, Traj-MAE, and
GraphDINO in a semi-supervised setting. Our RedMotion model achieves results
that are competitive with those of Scene Transformer or MTR++. We provide an
open source implementation that is accessible via GitHub
(https://github.com/kit-mrt/red-motion) and Colab
(https://colab.research.google.com/drive/1Q-Z9VdiqvfPfctNG8oqzPcgm0lP3y1il).
- Abstract(参考訳): 交通機関の将来の動きを予測することは、自動運転車の安全な運転を確保するために不可欠である。
2種類の冗長性低減を組み込んだ動作予測用トランスモデルであるredmotionを提案する。
第1の冗長性低減は、内部変圧器デコーダによって誘導され、エージェントデータ付き道路グラフなどの道路環境トークンの可変サイズのセットを固定サイズの埋め込みに還元する。
第2の冗長性低減は, 自己指導型学習目標であり, 道路環境の拡張ビューから生成された埋め込みに冗長性低減原理を適用した。
実験の結果,PreTraM,Traj-MAE,GraphDINOを半教師付き環境下で,表現学習手法が優れていることがわかった。
我々のRedMotionモデルは、Scene TransformerやMTR++と競合する結果を得る。
github(https://github.com/kit-mrt/red-motion)とcolab(https://colab.research.google.com/drive/1q-z9vdiqvfpfctng8oqzgm0lp3y1il)からアクセスできるオープンソース実装を提供する。
関連論文リスト
- OFMPNet: Deep End-to-End Model for Occupancy and Flow Prediction in Urban Environment [0.0]
環境中の全ての動的オブジェクトの将来の挙動を予測するために,エンド・ツー・エンドのニューラルネットワーク手法を提案する。
本稿では, 終点誤差の大幅な低減を図った新しい時間重み付きモーションフロー損失を提案する。
論文 参考訳(メタデータ) (2024-04-02T19:37:58Z) - MGTR: Multi-Granular Transformer for Motion Prediction with LiDAR [7.135065870025928]
我々は,異なる種類のトラフィックエージェントに対して,異なる粒度のコンテキスト特徴を利用するエンコーダデコーダネットワークであるMulti-Granular TRansformer (MGTR) フレームワークを提案する。
我々は,オープンデータセットの動作予測ベンチマーク上でMGTRを評価し,提案手法が最先端のパフォーマンスを達成し,リーダボードで1位となったことを示す。
論文 参考訳(メタデータ) (2023-12-05T00:48:31Z) - RoadFormer: Duplex Transformer for RGB-Normal Semantic Road Scene Parsing [17.118074007418123]
RoadFormer(ロードフォーマー)は、トランスフォーマーベースの道路シーン解析用データフュージョンネットワークである。
RoadFormerは、ロードシーン解析のための最先端ネットワークをすべて上回っている。
論文 参考訳(メタデータ) (2023-09-19T06:32:19Z) - MTR++: Multi-Agent Motion Prediction with Symmetric Scene Modeling and
Guided Intention Querying [110.83590008788745]
自律運転システムにとって、複雑な運転シナリオを理解し、情報的な決定を下すためには、動きの予測が不可欠である。
本稿では,これらの課題に対処するためのMotion TRansformer (MTR) フレームワークを提案する。
最初のMTRフレームワークは、学習可能な意図クエリを備えたトランスフォーマーエンコーダ-デコーダ構造を利用する。
複数のエージェントに対するマルチモーダル動作を同時に予測するMTR++フレームワークを導入する。
論文 参考訳(メタデータ) (2023-06-30T16:23:04Z) - Motion Transformer with Global Intention Localization and Local Movement
Refinement [103.75625476231401]
動き TRansformer (MTR) は、大域的意図の局所化と局所的な動きの洗練の合同最適化として、動き予測をモデル化する。
MTRは、限界運動予測と関節運動予測の両方において最先端の性能を達成する。
論文 参考訳(メタデータ) (2022-09-27T16:23:14Z) - Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。
本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。
提案手法は,高品質なトラフィックフローマップを作成できる。
論文 参考訳(メタデータ) (2021-09-29T07:51:49Z) - IA-RED$^2$: Interpretability-Aware Redundancy Reduction for Vision
Transformers [81.31885548824926]
自己注意型モデルであるTransformerは近年,コンピュータビジョン分野における主要なバックボーンになりつつある。
解釈可能性を考慮した冗長度低減フレームワーク(IA-RED$2$)を提案する。
画像タスクとビデオタスクの両方で広範囲に実験を行い、最大1.4倍のスピードアップを実現しました。
論文 参考訳(メタデータ) (2021-06-23T18:29:23Z) - Maneuver-based Anchor Trajectory Hypotheses at Roundabouts [3.5851903214591663]
人的データから学習することで、挑戦的なラウンドアバウト環境における車両の動き予測の問題に対処する。
ドライバーの意図は、セマンティクス駆動の概念に対応する一連の操作によって符号化される。
我々のモデルは、ラウンドアバウンドにおける可能な結果の空間をカバーする、一連の操作特異的なアンカー軌道を用いる。
論文 参考訳(メタデータ) (2021-04-22T17:08:29Z) - Transformers Solve the Limited Receptive Field for Monocular Depth
Prediction [82.90445525977904]
畳み込みニューラルネットワークとトランスの両方の恩恵を受けるアーキテクチャであるTransDepthを提案します。
連続ラベルを含む画素単位での予測問題にトランスフォーマーを適用する最初の論文である。
論文 参考訳(メタデータ) (2021-03-22T18:00:13Z) - Spatial-Channel Transformer Network for Trajectory Prediction on the
Traffic Scenes [2.7955111755177695]
本稿では,注意機能付き軌道予測のための空間チャネル変換器ネットワークを提案する。
エージェント間の社会的相互作用を測定するために、チャネルワイズモジュールが挿入される。
このネットワークは,交通現場における実世界の軌道予測データセットにおいて,有望な結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-01-27T15:03:42Z) - IntentNet: Learning to Predict Intention from Raw Sensor Data [86.74403297781039]
本論文では,LiDARセンサが生成する3次元点群と,環境の動的なマップの両方を利用するワンステージ検出器と予測器を開発した。
当社のマルチタスクモデルは、それぞれの別々のモジュールよりも高い精度を実現し、計算を節約します。
論文 参考訳(メタデータ) (2021-01-20T00:31:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。