論文の概要: Diving Deeper Into Pedestrian Behavior Understanding: Intention Estimation, Action Prediction, and Event Risk Assessment
- arxiv url: http://arxiv.org/abs/2407.00446v1
- Date: Sat, 29 Jun 2024 14:03:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 03:15:45.247057
- Title: Diving Deeper Into Pedestrian Behavior Understanding: Intention Estimation, Action Prediction, and Event Risk Assessment
- Title(参考訳): 歩行者行動理解の深層化:意図推定、行動予測、事象リスク評価
- Authors: Amir Rasouli, Iuliia Kotseruba,
- Abstract要約: まず、これらのタスクをJAADとPIEという2つの広く使われている歩行者データセットでどのように表現し、注釈付けするかについて議論する。
これらの定義に基づく新しいベンチマーク、利用可能なアノテーション、および3つの新しいメトリクスクラスを提案し、それぞれがモデル性能の異なる側面を評価するように設計されている。
- 参考スコア(独自算出の注目度): 11.724862656802918
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we delve into the pedestrian behavior understanding problem from the perspective of three different tasks: intention estimation, action prediction, and event risk assessment. We first define the tasks and discuss how these tasks are represented and annotated in two widely used pedestrian datasets, JAAD and PIE. We then propose a new benchmark based on these definitions, available annotations, and three new classes of metrics, each designed to assess different aspects of the model performance. We apply the new evaluation approach to examine four SOTA prediction models on each task and compare their performance w.r.t. metrics and input modalities. In particular, we analyze the differences between intention estimation and action prediction tasks by considering various scenarios and contextual factors. Lastly, we examine model agreement across these two tasks to show their complementary role. The proposed benchmark reveals new facts about the role of different data modalities, the tasks, and relevant data properties. We conclude by elaborating on our findings and proposing future research directions.
- Abstract(参考訳): 本稿では,意図推定,行動予測,イベントリスク評価という3つの異なる課題の観点から,歩行者行動理解の問題を探究する。
まず、これらのタスクをJAADとPIEの2つの広く使われている歩行者データセットでどのように表現し、注釈付けするかについて議論する。
次に、これらの定義に基づく新しいベンチマーク、利用可能なアノテーション、および3つの新しいメトリクスクラスを提案し、それぞれがモデルパフォーマンスの異なる側面を評価するように設計されている。
本研究では,4つのSOTA予測モデルを各タスクで検証し,その性能w.r.t.メトリックと入力モダリティを比較した。
特に,様々なシナリオや文脈要因を考慮し,意図推定と行動予測タスクの違いを分析する。
最後に、これらの2つのタスク間のモデル合意について検討し、それらの相補的な役割を示す。
提案するベンチマークでは、異なるデータモダリティ、タスク、関連するデータプロパティの役割に関する新たな事実を明らかにしている。
本研究の成果を概説し,今後の研究方向性を提案する。
関連論文リスト
- About Time: Advances, Challenges, and Outlooks of Action Understanding [57.76390141287026]
この調査は、様々なタスクにおけるユニモーダルおよびマルチモーダルな行動理解の進歩を包括的にレビューする。
我々は,現在普及している課題,広く採用されているデータセットの概要,そして最近の進歩を重視したセミナー作品の調査に焦点をあてる。
論文 参考訳(メタデータ) (2024-11-22T18:09:27Z) - Human Action Anticipation: A Survey [86.415721659234]
行動予測に関する文献は、行動予測、活動予測、意図予測、目標予測など、様々なタスクにまたがる。
我々の調査は、この断片化された文献を結びつけることを目的としており、最近の技術革新とモデルトレーニングと評価のための新しい大規模データセットの開発をカバーしています。
論文 参考訳(メタデータ) (2024-10-17T21:37:40Z) - Learning Embeddings for Sequential Tasks Using Population of Agents [27.61165606165948]
強化学習におけるタスクの定次元埋め込みを学習するための情報理論フレームワークを提案する。
1つのタスクでエージェントのパフォーマンスを観察すると、もう1つのタスクでエージェントのパフォーマンスに関する不確実性が低下する。
論文 参考訳(メタデータ) (2023-06-05T23:38:31Z) - It Takes Two to Tango: Navigating Conceptualizations of NLP Tasks and
Measurements of Performance [23.609314310655886]
本研究では,タスクの概念化とモデル性能の測定方法の相違点の分類法を開発する。
我々は、NLPタスクがどのように概念化されているかを理解するために、関連する文献のメタ分析を行い、ベンチマークの妥当性に影響を与えるさまざまな要因の印象について実践者の調査を行った。
我々の分類に基づいて、ベンチマークを構築し、それらの制限を文書化するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-15T21:12:07Z) - Zero-shot Item-based Recommendation via Multi-task Product Knowledge
Graph Pre-Training [106.85813323510783]
本稿ではゼロショットアイテムベース勧告(ZSIR)タスクのための新しいパラダイムを提案する。
製品知識グラフ(PKG)のモデルを事前トレーニングして、PLMからアイテム機能を洗練します。
我々は,PKGにおける多型関係,アイテムジェネリック情報と関係のセマンティックな相違,PKGから下流ZSIRタスクへのドメイン差といった,PKG事前学習の課題を3つ挙げる。
論文 参考訳(メタデータ) (2023-05-12T17:38:24Z) - A Closer Look at the Intervention Procedure of Concept Bottleneck Models [18.222350428973343]
概念ボトルネックモデル(コンセプションボトルネックモデル、CBM)は、その高レベルな概念に基づいて与えられた入力のターゲット応答を予測する、解釈可能なニューラルネットワークモデルのクラスである。
CBMは、ドメインの専門家が予測された概念に介入し、テスト時に間違いを修正できるので、最後にもっと正確なタスク予測ができる。
本研究では,介入効果を向上させるために介入概念を選択する様々な方法を開発し,異なる状況下でどのように進化するかを詳細に分析する。
論文 参考訳(メタデータ) (2023-02-28T02:37:24Z) - Task Formulation Matters When Learning Continually: A Case Study in
Visual Question Answering [58.82325933356066]
継続的な学習は、以前の知識を忘れずに、一連のタスクでモデルを漸進的にトレーニングすることを目的としている。
本稿では,視覚的質問応答において,異なる設定がパフォーマンスに与える影響について詳細に検討する。
論文 参考訳(メタデータ) (2022-09-30T19:12:58Z) - Where's the Learning in Representation Learning for Compositional
Semantics and the Case of Thematic Fit [0.0]
意味的役割予測や主題的適合推定のような特定のNLPタスクに対して、ランダムな埋め込みは事前訓練された埋め込みと同様に機能することを観察する。
課題と学習目標との関係により, ニュアンスな回答が得られている。
論文 参考訳(メタデータ) (2022-08-09T12:37:46Z) - On the Faithfulness Measurements for Model Interpretations [100.2730234575114]
ポストホックな解釈は、自然言語処理(NLP)モデルがどのように予測を行うかを明らかにすることを目的とする。
これらの問題に取り組むために,我々は,削除基準,解釈の感度,解釈の安定性という3つの基準から始める。
これらの忠実性概念のデシデラタムに動機づけられ、敵対的領域からのテクニックを採用する新しい解釈方法のクラスを導入する。
論文 参考訳(メタデータ) (2021-04-18T09:19:44Z) - Detecting Ongoing Events Using Contextual Word and Sentence Embeddings [110.83289076967895]
本稿では,OED(Ongoing Event Detection)タスクを紹介する。
目的は、歴史、未来、仮説、あるいは新しいものでも現在のものでもない他の形式や出来事に対してのみ、進行中のイベントの言及を検出することである。
構造化されていないテキストから進行中のイベントに関する構造化情報を抽出する必要があるアプリケーションは、OEDシステムを利用することができる。
論文 参考訳(メタデータ) (2020-07-02T20:44:05Z) - On the Ambiguity of Rank-Based Evaluation of Entity Alignment or Link
Prediction Methods [27.27230441498167]
本稿では,知識グラフから情報を得る方法として,リンク予測とエンティティアライメント(Entity Alignment)の2つのファミリについて,より詳しく検討する。
特に、既存のスコアはすべて、異なるデータセット間で結果を比較するのにほとんど役に立たないことを実証する。
これは結果の解釈において様々な問題を引き起こしており、誤解を招く結論を裏付ける可能性がある。
論文 参考訳(メタデータ) (2020-02-17T12:26:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。