論文の概要: Feature Importance in Pedestrian Intention Prediction: A Context-Aware Review
- arxiv url: http://arxiv.org/abs/2409.07645v1
- Date: Wed, 11 Sep 2024 22:13:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-13 18:21:43.801297
- Title: Feature Importance in Pedestrian Intention Prediction: A Context-Aware Review
- Title(参考訳): 歩行者の意図予測における特徴の重要性 : 文脈認識による検討
- Authors: Mohsen Azarmi, Mahdi Rezaei, He Wang, Ali Arabian,
- Abstract要約: コンピュータビジョンとディープニューラルネットワークを用いた自律走行車における歩行者横断意図の予測の最近の進歩は有望である。
歩行者の意図予測に適した新しいアプローチであるCAPFI(Context-aware Permutation Feature Importance)を導入する。
CAPFIは、細分化されたシナリオコンテキストを活用することにより、より解釈可能性と信頼性の高い特徴重要度評価を可能にする。
- 参考スコア(独自算出の注目度): 9.475536008455133
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advancements in predicting pedestrian crossing intentions for Autonomous Vehicles using Computer Vision and Deep Neural Networks are promising. However, the black-box nature of DNNs poses challenges in understanding how the model works and how input features contribute to final predictions. This lack of interpretability delimits the trust in model performance and hinders informed decisions on feature selection, representation, and model optimisation; thereby affecting the efficacy of future research in the field. To address this, we introduce Context-aware Permutation Feature Importance (CAPFI), a novel approach tailored for pedestrian intention prediction. CAPFI enables more interpretability and reliable assessments of feature importance by leveraging subdivided scenario contexts, mitigating the randomness of feature values through targeted shuffling. This aims to reduce variance and prevent biased estimations in importance scores during permutations. We divide the Pedestrian Intention Estimation (PIE) dataset into 16 comparable context sets, measure the baseline performance of five distinct neural network architectures for intention prediction in each context, and assess input feature importance using CAPFI. We observed nuanced differences among models across various contextual characteristics. The research reveals the critical role of pedestrian bounding boxes and ego-vehicle speed in predicting pedestrian intentions, and potential prediction biases due to the speed feature through cross-context permutation evaluation. We propose an alternative feature representation by considering proximity change rate for rendering dynamic pedestrian-vehicle locomotion, thereby enhancing the contributions of input features to intention prediction. These findings underscore the importance of contextual features and their diversity to develop accurate and robust intent-predictive models.
- Abstract(参考訳): コンピュータビジョンとディープニューラルネットワークを用いた自律走行車における歩行者横断意図の予測の最近の進歩は有望である。
しかしながら、DNNのブラックボックスの性質は、モデルがどのように機能し、入力機能が最終的な予測にどのように貢献するかを理解する上で、課題を提起する。
この解釈可能性の欠如は、モデルパフォーマンスに対する信頼を低下させ、特徴の選択、表現、モデルの最適化に関する情報的決定を妨げる。
これを解決するために,歩行者の意図予測に適した新しいアプローチであるCAPFI(Context-aware Permutation Feature Importance)を導入する。
CAPFIは、細分化されたシナリオコンテキストを活用し、ターゲットシャッフルによる特徴値のランダム性を緩和することにより、より解釈可能性と信頼性の高い特徴重要度評価を可能にする。
これは分散を減らし、置換中の重要点の偏りを抑えることを目的としている。
PIE(Pedestrian Intention Estimation)データセットを16のコンテキストセットに分割し、各コンテキストにおける意図予測のために5つの異なるニューラルネットワークアーキテクチャのベースライン性能を測定し、CAPFIを用いて入力特徴の重要度を評価する。
様々な文脈特性にまたがるモデル間のニュアンス差を観測した。
本研究は,歩行者拘束ボックスとエゴ車速度が歩行者の意図を予測する上で重要な役割を担っていること,および,クロスコンテクスト・パーミューテーション・アセスメント・アセスメントによる速度特性による潜在的な予測バイアスを明らかにする。
本稿では,動的な歩行者車移動のレンダリングにおける近接変化率を考慮し,入力特徴の意図的予測への寄与を高めることによる特徴表現を提案する。
これらの知見は、文脈的特徴の重要性と、その多様性が、正確で堅牢な意図予測モデルを開発することの重要性を浮き彫りにしている。
関連論文リスト
- Context-aware Multi-task Learning for Pedestrian Intent and Trajectory Prediction [3.522062800701924]
我々は,過去の軌跡観測,局所的文脈特徴,グローバルな特徴を組み合わせることで,軌跡と意図の予測を学習するPTINetを紹介する。
提案手法の有効性は, JAAD と PIE を用いて評価した。
PTINetは、都市環境で歩行者とシームレスに対話できる自動システムの開発の道を開く。
論文 参考訳(メタデータ) (2024-07-24T11:06:47Z) - Towards Generalizable and Interpretable Motion Prediction: A Deep
Variational Bayes Approach [54.429396802848224]
本稿では,分布外ケースに対する頑健な一般化性を有する動き予測のための解釈可能な生成モデルを提案する。
このモデルでは, 長期目的地の空間分布を推定することにより, 目標駆動動作予測を実現する。
動き予測データセットの実験は、適合したモデルが解釈可能で一般化可能であることを検証した。
論文 参考訳(メタデータ) (2024-03-10T04:16:04Z) - Knowledge-aware Graph Transformer for Pedestrian Trajectory Prediction [15.454206825258169]
歩行者運動軌跡の予測は、自動運転車の経路計画と移動制御に不可欠である。
近年の深層学習に基づく予測手法は、主に軌跡履歴や歩行者間の相互作用などの情報を利用する。
本稿では,予測性能を向上させるためのグラフトランス構造を提案する。
論文 参考訳(メタデータ) (2024-01-10T01:50:29Z) - Experimental Insights Towards Explainable and Interpretable Pedestrian
Crossing Prediction [0.47355466227925036]
本研究では,深層学習とファジィ論理を組み合わせた新しいニューロシンボリックアプローチを提案する。
我々は,一連の説明可能な特徴を利用する説明可能な予測器(ExPedCross)を開発し,歩行者が横断するか否かを予測するファジィ推論システムを開発した。
その結果,歩行者横断予測課題における説明可能性と解釈可能性について実験的に考察した。
論文 参考訳(メタデータ) (2023-12-05T16:39:32Z) - Variational Voxel Pseudo Image Tracking [127.46919555100543]
不確実性推定は、ロボット工学や自律運転といった重要な問題にとって重要なタスクである。
本稿では,3次元物体追跡のためのVoxel Pseudo Image Tracking (VPIT) の変分ニューラルネットワークによるバージョンを提案する。
論文 参考訳(メタデータ) (2023-02-12T13:34:50Z) - Context-empowered Visual Attention Prediction in Pedestrian Scenarios [0.0]
本稿では,歩行者の視覚的注意予測における3つの課題に対処する,新しいエンコーダ・デコーダアーキテクチャであるContext-SalNETを提案する。
まず、Context-SalNETは、エンコーダ・デコーダモデルの潜在空間における緊急性と安全性の優先性を明示的にモデル化する。
第2に,指数重み付き平均二乗誤差損失 (ew-MSE) を提案する。
論文 参考訳(メタデータ) (2022-10-30T19:38:17Z) - On-Board Pedestrian Trajectory Prediction Using Behavioral Features [5.97114962845139]
本稿では,車載カメラシステムにおける歩行者軌跡予測の新しい手法を提案する。
提案手法は,複数の入力モダリティ,すなわち歩行者の身体と頭部の向き,およびポーズを独立符号化ストリームで処理する。
歩行者行動予測のための2つのデータセットの実験において、歩行者軌道予測に行動特徴を用いることの利点を実証し、提案手法の有効性を評価する。
論文 参考訳(メタデータ) (2022-10-21T14:40:51Z) - Interpretable Social Anchors for Human Trajectory Forecasting in Crowds [84.20437268671733]
本研究では,人混みの軌跡を予測できるニューラルネットワークシステムを提案する。
解釈可能なルールベースのインテントを学び、ニューラルネットワークの表現可能性を利用してシーン固有の残差をモデル化する。
私たちのアーキテクチャは、インタラクション中心のベンチマークTrajNet++でテストされています。
論文 参考訳(メタデータ) (2021-05-07T09:22:34Z) - Generative Counterfactuals for Neural Networks via Attribute-Informed
Perturbation [51.29486247405601]
AIP(Attribute-Informed Perturbation)の提案により,生データインスタンスの反事実を生成するフレームワークを設計する。
異なる属性を条件とした生成モデルを利用することで、所望のラベルとの反事実を効果的かつ効率的に得ることができる。
実世界のテキストや画像に対する実験結果から, 設計したフレームワークの有効性, サンプル品質, および効率が示された。
論文 参考訳(メタデータ) (2021-01-18T08:37:13Z) - Spatiotemporal Relationship Reasoning for Pedestrian Intent Prediction [57.56466850377598]
視覚データに対する推論は、ロボティクスとビジョンベースのアプリケーションにとって望ましい能力である。
本稿では,歩行者の意図を推論するため,現場の異なる物体間の関係を明らかにするためのグラフ上でのフレームワークを提案する。
歩行者の意図は、通りを横切る、あるいは横断しない将来の行動として定義され、自動運転車にとって非常に重要な情報である。
論文 参考訳(メタデータ) (2020-02-20T18:50:44Z) - Value-driven Hindsight Modelling [68.658900923595]
値推定は強化学習(RL)パラダイムの重要な構成要素である。
モデル学習は、観測系列に存在する豊富な遷移構造を利用することができるが、このアプローチは通常、報酬関数に敏感ではない。
この2つの極点の間に位置するRLにおける表現学習のアプローチを開発する。
これにより、タスクに直接関連し、値関数の学習を加速できる、抽出可能な予測ターゲットが提供される。
論文 参考訳(メタデータ) (2020-02-19T18:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。