論文の概要: On-Road Object Importance Estimation: A New Dataset and A Model with Multi-Fold Top-Down Guidance
- arxiv url: http://arxiv.org/abs/2411.17152v1
- Date: Tue, 26 Nov 2024 06:37:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-27 13:31:21.405334
- Title: On-Road Object Importance Estimation: A New Dataset and A Model with Multi-Fold Top-Down Guidance
- Title(参考訳): オンロードオブジェクトの重要度推定:マルチフォールトトップダウン誘導を用いた新しいデータセットとモデル
- Authors: Zhixiong Nan, Yilong Chen, Tianfei Zhou, Tao Xiang,
- Abstract要約: 本稿では,交通オブジェクト重要度(TOI)という,新しい大規模データセットを提案する。
ボトムアップ機能とマルチフォールドトップダウンガイダンスを統合するモデルを提案する。
我々のモデルは最先端の手法を大きなマージンで上回る。
- 参考スコア(独自算出の注目度): 70.80612792049315
- License:
- Abstract: This paper addresses the problem of on-road object importance estimation, which utilizes video sequences captured from the driver's perspective as the input. Although this problem is significant for safer and smarter driving systems, the exploration of this problem remains limited. On one hand, publicly-available large-scale datasets are scarce in the community. To address this dilemma, this paper contributes a new large-scale dataset named Traffic Object Importance (TOI). On the other hand, existing methods often only consider either bottom-up feature or single-fold guidance, leading to limitations in handling highly dynamic and diverse traffic scenarios. Different from existing methods, this paper proposes a model that integrates multi-fold top-down guidance with the bottom-up feature. Specifically, three kinds of top-down guidance factors (ie, driver intention, semantic context, and traffic rule) are integrated into our model. These factors are important for object importance estimation, but none of the existing methods simultaneously consider them. To our knowledge, this paper proposes the first on-road object importance estimation model that fuses multi-fold top-down guidance factors with bottom-up feature. Extensive experiments demonstrate that our model outperforms state-of-the-art methods by large margins, achieving 23.1% Average Precision (AP) improvement compared with the recently proposed model (ie, Goal).
- Abstract(参考訳): 本稿では,運転者の視点から捉えた映像シーケンスを入力として活用する,オンロードオブジェクトの重要度推定の問題に対処する。
この問題は安全でスマートな運転システムにとって重要であるが、この問題の探索は依然として限られている。
一方、一般公開されている大規模なデータセットは、コミュニティではほとんどありません。
本稿では,このジレンマに対処するため,新しい大規模データセットであるTraffic Object Importance(TOI)を提案する。
一方、既存のメソッドはボトムアップ機能またはシングルフォールドガイダンスのみを考慮しており、非常にダイナミックで多様なトラフィックシナリオを扱う際の制限につながります。
本稿では,既存手法と異なり,ボトムアップ機能とマルチフォールドトップダウンガイダンスを統合したモデルを提案する。
具体的には,3種類のトップダウン誘導要因(運転意図,意味コンテキスト,交通ルール)をモデルに統合する。
これらの因子はオブジェクトの重要度推定に重要であるが、既存の手法ではこれらを同時に考慮していない。
本稿では,ボトムアップ機能を備えたマルチフォールドトップダウン誘導因子を融合した最初のオンロードオブジェクト重要度推定モデルを提案する。
大規模な実験により, 提案したモデル(ie, Goal)と比較して, 平均精度(AP)が23.1%向上し, 最先端の手法よりも優れた結果が得られた。
関連論文リスト
- DeTra: A Unified Model for Object Detection and Trajectory Forecasting [68.85128937305697]
提案手法は,2つのタスクの結合を軌道修正問題として定式化する。
この統合タスクに対処するために、オブジェクトの存在, ポーズ, マルチモーダルな将来の振る舞いを推測する精細化変換器を設計する。
実験では、我々のモデルはArgoverse 2 Sensor and Openデータセットの最先端性よりも優れています。
論文 参考訳(メタデータ) (2024-06-06T18:12:04Z) - A Novel Benchmarking Paradigm and a Scale- and Motion-Aware Model for
Egocentric Pedestrian Trajectory Prediction [7.306417438683524]
我々は,エゴセントリックな歩行者軌道予測アルゴリズムを評価するための新しいパラダイムを提案する。
我々は,挑戦的なシナリオにおいて,我々のアプローチが最大40%の大幅な改善を実現していることを示す。
論文 参考訳(メタデータ) (2023-10-16T14:08:34Z) - Studying How to Efficiently and Effectively Guide Models with Explanations [52.498055901649025]
「モデルガイダンス」とは「正しい理由のために正しい」ことを保証するためにモデルの説明を規則化する考え方である。
PASCAL VOC 2007 および MS COCO 2014 データセット上で, 各種損失関数, 帰属方法, モデル, 誘導深度について詳細な評価を行う。
具体的には、一般的に使用されるセグメンテーションマスクよりもはるかに安価で入手可能なバウンディングボックスアノテーションを用いてモデルをガイドする。
論文 参考訳(メタデータ) (2023-03-21T15:34:50Z) - CPPF++: Uncertainty-Aware Sim2Real Object Pose Estimation by Vote Aggregation [67.12857074801731]
そこで本研究では,シミュレートからリアルなポーズ推定のための新しい手法であるCPPF++を提案する。
投票衝突による課題に対処するため,投票の不確実性をモデル化する新たなアプローチを提案する。
ノイズの多いペアフィルタリング、オンラインアライメント最適化、機能アンサンブルなど、いくつかの革新的なモジュールを組み込んでいます。
論文 参考訳(メタデータ) (2022-11-24T03:27:00Z) - Goal-driven Self-Attentive Recurrent Networks for Trajectory Prediction [31.02081143697431]
人間の軌道予測は、自動運転車、社会認識ロボット、およびビデオ監視アプリケーションの主要な構成要素である。
本稿では,過去の観測位置のみに作用する軽量な注意型リカレントバックボーンを提案する。
我々はU-Netアーキテクチャに基づく共通のゴールモジュールを使用し、シーン準拠の目的地を予測するために意味情報を抽出する。
論文 参考訳(メタデータ) (2022-04-25T11:12:37Z) - Important Object Identification with Semi-Supervised Learning for
Autonomous Driving [37.654878298744855]
本稿では,エゴセントリック駆動シナリオにおける重要な物体識別のための新しい手法を提案する。
モデルが無制限なラベル付きデータから学習できるようにするための,半教師付き学習パイプラインを提案する。
私たちのアプローチはルールベースのベースラインよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2022-03-05T01:23:13Z) - Can Deep Learning be Applied to Model-Based Multi-Object Tracking? [25.464269324261636]
マルチオブジェクトトラッキング(MOT)は、ノイズ測定を用いて未知の、時間変化のあるオブジェクトの状態をトラッキングする問題である。
ディープラーニング(DL)は、トラッキングパフォーマンスを改善するために、MOTでますます使われている。
本稿では,TransformerベースのDLトラッカーを提案し,その性能をモデルベースで評価する。
論文 参考訳(メタデータ) (2022-02-16T07:43:08Z) - Divide-and-Conquer for Lane-Aware Diverse Trajectory Prediction [71.97877759413272]
軌道予測は、自動運転車が行動を計画し実行するための安全クリティカルなツールです。
近年の手法は,WTAやベスト・オブ・マニーといったマルチコース学習の目標を用いて,強力なパフォーマンスを実現している。
我々の研究は、軌道予測、学習出力、そして運転知識を使って制約を課すことによるより良い予測における2つの重要な課題に対処する。
論文 参考訳(メタデータ) (2021-04-16T17:58:56Z) - Diverse Complexity Measures for Dataset Curation in Self-driving [80.55417232642124]
トラフィックシーンの面白さを定量化する多様な基準を活用した新たなデータ選択手法を提案する。
実験の結果,提案するキュレーションパイプラインは,より汎用的で高いパフォーマンスをもたらすデータセットを選択できることが判明した。
論文 参考訳(メタデータ) (2021-01-16T23:45:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。