論文の概要: Important Object Identification with Semi-Supervised Learning for
Autonomous Driving
- arxiv url: http://arxiv.org/abs/2203.02634v1
- Date: Sat, 5 Mar 2022 01:23:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-08 14:40:00.261682
- Title: Important Object Identification with Semi-Supervised Learning for
Autonomous Driving
- Title(参考訳): 半教師付き学習による自律運転のための重要物体識別
- Authors: Jiachen Li and Haiming Gang and Hengbo Ma and Masayoshi Tomizuka and
Chiho Choi
- Abstract要約: 本稿では,エゴセントリック駆動シナリオにおける重要な物体識別のための新しい手法を提案する。
モデルが無制限なラベル付きデータから学習できるようにするための,半教師付き学習パイプラインを提案する。
私たちのアプローチはルールベースのベースラインよりも大きなマージンで優れています。
- 参考スコア(独自算出の注目度): 37.654878298744855
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate identification of important objects in the scene is a prerequisite
for safe and high-quality decision making and motion planning of intelligent
agents (e.g., autonomous vehicles) that navigate in complex and dynamic
environments. Most existing approaches attempt to employ attention mechanisms
to learn importance weights associated with each object indirectly via various
tasks (e.g., trajectory prediction), which do not enforce direct supervision on
the importance estimation. In contrast, we tackle this task in an explicit way
and formulate it as a binary classification ("important" or "unimportant")
problem. We propose a novel approach for important object identification in
egocentric driving scenarios with relational reasoning on the objects in the
scene. Besides, since human annotations are limited and expensive to obtain, we
present a semi-supervised learning pipeline to enable the model to learn from
unlimited unlabeled data. Moreover, we propose to leverage the auxiliary tasks
of ego vehicle behavior prediction to further improve the accuracy of
importance estimation. The proposed approach is evaluated on a public
egocentric driving dataset (H3D) collected in complex traffic scenarios. A
detailed ablative study is conducted to demonstrate the effectiveness of each
model component and the training strategy. Our approach also outperforms
rule-based baselines by a large margin.
- Abstract(参考訳): シーンにおける重要な物体の正確な識別は、複雑な動的環境をナビゲートするインテリジェントエージェント(例えば自動運転車)の安全で高品質な意思決定と動作計画の前提条件である。
既存のほとんどのアプローチでは、様々なタスク(軌道予測など)を通じて、各オブジェクトに関連する重みを間接的に学習するために注意機構を採用しようとしている。
対照的に、このタスクを明示的な方法で取り組み、バイナリ分類(重要(important))あるいは非重要(unimportant))問題として定式化する。
我々は,シーン内のオブジェクトに対する関係推論を伴う自己中心駆動シナリオにおいて,重要なオブジェクト識別のための新しいアプローチを提案する。
さらに,人間のアノテーションは限定的かつ費用がかかるため,半教師あり学習パイプラインを提供し,無制限のラベルなしデータからモデルが学習できるようにする。
さらに,ego車両行動予測の補助タスクを活用し,重要度推定の精度をさらに高めることを提案する。
提案手法は,複雑なトラヒックシナリオで収集したh3d(public egocentric driving dataset)上で評価される。
各モデルコンポーネントの有効性とトレーニング戦略を示すために,詳細なアブレーション研究を行った。
我々のアプローチはルールベースのベースラインを大きく上回っている。
関連論文リスト
- On-Road Object Importance Estimation: A New Dataset and A Model with Multi-Fold Top-Down Guidance [70.80612792049315]
本稿では,交通オブジェクト重要度(TOI)という,新しい大規模データセットを提案する。
ボトムアップ機能とマルチフォールドトップダウンガイダンスを統合するモデルを提案する。
我々のモデルは最先端の手法を大きなマージンで上回る。
論文 参考訳(メタデータ) (2024-11-26T06:37:10Z) - Beyond One Model Fits All: Ensemble Deep Learning for Autonomous
Vehicles [16.398646583844286]
本研究では,Mediated Perception, Behavior Reflex, Direct Perceptionの3つの異なるニューラルネットワークモデルを紹介する。
我々のアーキテクチャは、グローバルなルーティングコマンドを使用して、ベース、将来の潜伏ベクトル予測、補助タスクネットワークからの情報を融合し、適切なアクションサブネットワークを選択する。
論文 参考訳(メタデータ) (2023-12-10T04:40:02Z) - DRUformer: Enhancing the driving scene Important object detection with
driving relationship self-understanding [50.81809690183755]
交通事故はしばしば致命傷を負い、2023年まで5000万人以上の死者を出した。
従来の研究は、主に個々の参加者の重要性を評価し、それらを独立した存在として扱うものであった。
本稿では、重要な物体検出タスクを強化するために、運転シーン関連自己理解変換器(DRUformer)を紹介する。
論文 参考訳(メタデータ) (2023-11-11T07:26:47Z) - Rank2Tell: A Multimodal Driving Dataset for Joint Importance Ranking and
Reasoning [19.43430577960824]
本稿では,重要度をランク付けするマルチモーダル・エゴ中心のデータセットである Rank2Tell を紹介し,その重要性の理由を述べる。
クローズドでオープンな様々な視覚的質問応答を用いて、複雑な交通シナリオにおいて、データセットは様々な重要なオブジェクトの様々な意味、空間的、時間的、関係的な属性の密接なアノテーションを提供する。
論文 参考訳(メタデータ) (2023-09-12T20:51:07Z) - Pedestrian Crossing Action Recognition and Trajectory Prediction with 3D
Human Keypoints [25.550524178542833]
歩行者の横断行動認識と軌道予測のための新しいマルチタスク学習フレームワークを提案する。
生のセンサデータから抽出した3D人間のキーポイントを用いて、人間のポーズや活動に関する豊富な情報をキャプチャする。
提案手法は,幅広い評価指標を用いて最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-06-01T18:27:48Z) - Unsupervised Self-Driving Attention Prediction via Uncertainty Mining
and Knowledge Embedding [51.8579160500354]
本研究では、不確実性モデリングと知識統合の駆動による自動運転の注意を予測できる教師なし手法を提案する。
結果は、完全に教師された最先端のアプローチと比較して、同等またはさらに印象的なパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-03-17T00:28:33Z) - INFOrmation Prioritization through EmPOWERment in Visual Model-Based RL [90.06845886194235]
モデルベース強化学習(RL)のための修正目的を提案する。
相互情報に基づく状態空間モデルに,変分エンパワーメントにインスパイアされた用語を統合する。
本研究は,視覚に基づくロボット制御作業における自然な映像背景を用いたアプローチの評価である。
論文 参考訳(メタデータ) (2022-04-18T23:09:23Z) - Reinforcement Learning for Sparse-Reward Object-Interaction Tasks in a
First-person Simulated 3D Environment [73.9469267445146]
高忠実な3Dシミュレーション環境において、AI2Thorのような一対一のオブジェクトインタラクションタスクは、強化学習エージェントに顕著なサンプル効率の課題をもたらす。
補助的なタスクとして注意的オブジェクトモデルを学ぶことで、監督なしに、ゼロからオブジェクトインタラクションタスクを学習できることが示される。
論文 参考訳(メタデータ) (2020-10-28T19:27:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。