論文の概要: Efficient Baselines for Motion Prediction in Autonomous Driving
- arxiv url: http://arxiv.org/abs/2309.03387v1
- Date: Wed, 6 Sep 2023 22:18:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-08 14:49:20.873479
- Title: Efficient Baselines for Motion Prediction in Autonomous Driving
- Title(参考訳): 自律走行における運動予測の効率的なベースライン
- Authors: Carlos G\'omez-Hu\'elamo, Marcos V. Conde, Rafael Barea, Manuel
Oca\~na, Luis M. Bergasa
- Abstract要約: 複数の周辺エージェントの運動予測(MP)は、任意に複雑な環境において重要な課題である。
注意機構やGNNを含むMPのためのSOTA(State-Of-The-Art)技術を用いて,コンパクトなモデルを開発することを目指している。
- 参考スコア(独自算出の注目度): 7.608073471097835
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Motion Prediction (MP) of multiple surroundings agents is a crucial task in
arbitrarily complex environments, from simple robots to Autonomous Driving
Stacks (ADS). Current techniques tackle this problem using end-to-end
pipelines, where the input data is usually a rendered top-view of the physical
information and the past trajectories of the most relevant agents; leveraging
this information is a must to obtain optimal performance. In that sense, a
reliable ADS must produce reasonable predictions on time. However, despite many
approaches use simple ConvNets and LSTMs to obtain the social latent features,
State-Of-The-Art (SOTA) models might be too complex for real-time applications
when using both sources of information (map and past trajectories) as well as
little interpretable, specially considering the physical information. Moreover,
the performance of such models highly depends on the number of available inputs
for each particular traffic scenario, which are expensive to obtain,
particularly, annotated High-Definition (HD) maps.
In this work, we propose several efficient baselines for the well-known
Argoverse 1 Motion Forecasting Benchmark. We aim to develop compact models
using SOTA techniques for MP, including attention mechanisms and GNNs. Our
lightweight models use standard social information and interpretable map
information such as points from the driveable area and plausible centerlines by
means of a novel preprocessing step based on kinematic constraints, in
opposition to black-box CNN-based or too-complex graphs methods for map
encoding, to generate plausible multimodal trajectories achieving up-to-pair
accuracy with less operations and parameters than other SOTA methods. Our code
is publicly available at https://github.com/Cram3r95/mapfe4mp .
- Abstract(参考訳): 複数の周辺エージェントの動作予測(MP)は、単純なロボットから自律走行スタック(ADS)まで、任意の複雑な環境において重要なタスクである。
現在の手法では、入力データが通常、物理情報のレンダリングトップビューであり、最も関連性の高いエージェントの過去のトラジェクトリであるエンドツーエンドパイプラインを使用してこの問題に対処している。
その意味では、信頼できるADSは時間に基づいて合理的な予測を生成する必要がある。
しかし、多くのアプローチが単純なConvNetとLSTMを使って社会的潜在機能を得るが、State-Of-The-Art(SOTA)モデルは、情報ソース(マップと過去のトラジェクトリ)の両方を使用する場合、リアルタイムアプリケーションには複雑すぎるかもしれない。
さらに、これらのモデルの性能は、特に注釈付き高精細(HD)マップを得るのに費用がかかる交通シナリオごとに利用可能な入力数に大きく依存する。
本研究では,よく知られたargoverse 1モーション予測ベンチマークの効率的なベースラインを提案する。
我々は,注意機構やGNNを含むMPのためのSOTA技術を用いたコンパクトモデルの開発を目指している。
軽量なモデルでは, 移動可能な領域からの点や可算中心線といった標準的な社会的情報や解釈可能な地図情報を, ブラックボックスのcnnベースあるいは過剰複雑グラフ法とは対照的に, 運動的制約に基づく新しい前処理ステップを用いて利用し, 他の sota 法よりも操作性やパラメータの少ない精度で高次的マルチモーダルトラジェクタを生成できる。
私たちのコードはhttps://github.com/cram3r95/mapfe4mpで公開しています。
関連論文リスト
- SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for
Autonomous Driving [27.776472262857045]
本稿では,自動運転車のための簡易かつ効率的な運動予測ベースライン(SIMPL)を提案する。
メッセージ転送を対称的に行う,コンパクトで効率的なグローバル機能融合モジュールを提案する。
強力なベースラインとして、SIMPLはArgoverse 1と2のモーション予測ベンチマークで高い競争性能を示す。
論文 参考訳(メタデータ) (2024-02-04T15:07:49Z) - JRDB-Traj: A Dataset and Benchmark for Trajectory Forecasting in Crowds [79.00975648564483]
ロボット工学、自動運転車、ナビゲーションなどの分野で使用される軌道予測モデルは、現実のシナリオにおいて課題に直面している。
このデータセットは、ロボットの観点から、すべてのエージェント、シーンイメージ、ポイントクラウドの位置を含む包括的なデータを提供する。
本研究の目的は,ロボットに対するエージェントの将来の位置を,生の感覚入力データを用いて予測することである。
論文 参考訳(メタデータ) (2023-11-05T18:59:31Z) - A Fast and Map-Free Model for Trajectory Prediction in Traffics [2.435517936694533]
本稿では,交通地図に依存しない効率的な軌道予測モデルを提案する。
注意機構、LSTM、グラフ畳み込みネットワーク、時間変換器を包括的に活用することにより、我々のモデルは全てのエージェントのリッチな動的および相互作用情報を学習することができる。
提案モデルでは,既存のマップフリー手法と比較して高い性能を達成し,Argoverseデータセット上のほとんどのマップベース最先端手法を超越する。
論文 参考訳(メタデータ) (2023-07-19T08:36:31Z) - Exploring Attention GAN for Vehicle Motion Prediction [2.887073662645855]
身体的・社会的文脈を考慮した動き予測モデルにおける注意の影響について検討した。
本稿では,Argoverse Motion Forecasting Benchmark 1.1 を用いて提案手法の有効性を検証する。
論文 参考訳(メタデータ) (2022-09-26T13:18:32Z) - Conditioned Human Trajectory Prediction using Iterative Attention Blocks [70.36888514074022]
本研究では,都市環境における歩行者位置予測を目的とした,簡易かつ効果的な歩行者軌道予測モデルを提案する。
我々のモデルは、複数のアテンションブロックとトランスフォーマーを反復的に実行できるニューラルネットワークアーキテクチャである。
ソーシャルマスク, 動的モデル, ソーシャルプーリング層, 複雑なグラフのような構造を明示的に導入することなく, SoTAモデルと同等の結果が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T07:49:48Z) - Exploring Map-based Features for Efficient Attention-based Vehicle
Motion Prediction [3.222802562733787]
複数のエージェントの動作予測は、任意に複雑な環境において重要なタスクである。
本稿では,効率的な注意モデルを用いてArgoverse 1.0ベンチマークで競合性能を実現する方法を示す。
論文 参考訳(メタデータ) (2022-05-25T22:38:11Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - Learnable Online Graph Representations for 3D Multi-Object Tracking [156.58876381318402]
3D MOT問題に対する統一型学習型アプローチを提案します。
我々は、完全にトレーニング可能なデータアソシエーションにNeural Message Passing Networkを使用します。
AMOTAの65.6%の最先端性能と58%のIDスウィッチを達成して、公開可能なnuScenesデータセットに対する提案手法のメリットを示す。
論文 参考訳(メタデータ) (2021-04-23T17:59:28Z) - Injecting Knowledge in Data-driven Vehicle Trajectory Predictors [82.91398970736391]
車両軌道予測タスクは、一般的に知識駆動とデータ駆動の2つの視点から取り組まれている。
本稿では,これら2つの視点を効果的に結合する「現実的残留ブロック」 (RRB) の学習を提案する。
提案手法は,残留範囲を限定し,その不確実性を考慮した現実的な予測を行う。
論文 参考訳(メタデータ) (2021-03-08T16:03:09Z) - Trajformer: Trajectory Prediction with Local Self-Attentive Contexts for
Autonomous Driving [13.861631911491651]
自己意識は、エージェントの社会的文脈を表現するためのより良い制御を可能にする。
Argoverseデータセットの様々なベースラインに対する標準メトリクスの改善を示す。
論文 参考訳(メタデータ) (2020-11-30T15:42:15Z) - Multi-scale Interaction for Real-time LiDAR Data Segmentation on an
Embedded Platform [62.91011959772665]
LiDARデータのリアルタイムセマンティックセグメンテーションは、自動運転車にとって不可欠である。
ポイントクラウド上で直接動作する現在のアプローチでは、複雑な空間集約操作を使用する。
本稿では,マルチスケールインタラクションネットワーク(MINet)と呼ばれるプロジェクションベースの手法を提案する。
論文 参考訳(メタデータ) (2020-08-20T19:06:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。