論文の概要: A Dynamic Spatial-temporal Attention Network for Early Anticipation of
Traffic Accidents
- arxiv url: http://arxiv.org/abs/2106.10197v1
- Date: Fri, 18 Jun 2021 15:58:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-21 16:54:05.954099
- Title: A Dynamic Spatial-temporal Attention Network for Early Anticipation of
Traffic Accidents
- Title(参考訳): 交通事故の早期予測のための動的時空間注意ネットワーク
- Authors: Muhammad Monjurul Karim, Yu Li, Ruwen Qin, Zhaozheng Yin
- Abstract要約: 本稿では,ダッシュカムビデオからの交通事故を早期に予測するための動的時空間アテンション(DSTA)ネットワークを提案する。
DTA(Dynamic Temporal Attention)と呼ばれるモジュールを用いてビデオシーケンスの識別時間セグメントを選択することを学ぶ
事故の空間的・時間的関係の特徴と景観的特徴は, Gated Recurrent Unit (GRU) ネットワークと共同で学習される。
- 参考スコア(独自算出の注目度): 12.881094474374231
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, autonomous vehicles and those equipped with an Advanced Driver
Assistance System (ADAS) are emerging. They share the road with regular ones
operated by human drivers entirely. To ensure guaranteed safety for passengers
and other road users, it becomes essential for autonomous vehicles and ADAS to
anticipate traffic accidents from natural driving scenes. The dynamic
spatial-temporal interaction of the traffic agents is complex, and visual cues
for predicting a future accident are embedded deeply in dashcam video data.
Therefore, early anticipation of traffic accidents remains a challenge. To this
end, the paper presents a dynamic spatial-temporal attention (DSTA) network for
early anticipation of traffic accidents from dashcam videos. The proposed
DSTA-network learns to select discriminative temporal segments of a video
sequence with a module named Dynamic Temporal Attention (DTA). It also learns
to focus on the informative spatial regions of frames with another module named
Dynamic Spatial Attention (DSA). The spatial-temporal relational features of
accidents, along with scene appearance features, are learned jointly with a
Gated Recurrent Unit (GRU) network. The experimental evaluation of the
DSTA-network on two benchmark datasets confirms that it has exceeded the
state-of-the-art performance. A thorough ablation study evaluates the
contributions of individual components of the DSTA-network, revealing how the
network achieves such performance. Furthermore, this paper proposes a new
strategy that fuses the prediction scores from two complementary models and
verifies its effectiveness in further boosting the performance of early
accident anticipation.
- Abstract(参考訳): 近年,高度運転支援システム(ADAS)を搭載した自動運転車が登場している。
人間ドライバーが運転する通常の車両と道路を共有している。
乗客や他の道路利用者の安全確保のためには、自動車やADASが自然運転シーンからの交通事故を予知することが不可欠である。
交通エージェントの動的時空間相互作用は複雑であり、将来の事故を予測する視覚的手がかりはダッシュカムビデオデータに深く埋め込まれている。
したがって、交通事故の早期予測は依然として課題である。
そこで本稿では,ダッシュカムビデオからの交通事故を早期に予測するための動的空間的注意(DSTA)ネットワークを提案する。
提案するDSTAネットワークは,動的テンポラルアテンション(DTA)と呼ばれるモジュールを用いて,ビデオシーケンスの識別時間セグメントを選択することを学習する。
また、動的空間注意(DSA)と呼ばれる別のモジュールを用いて、フレームの情報的空間領域に集中することを学ぶ。
事故の空間的・時間的関係の特徴と景観的特徴は, Gated Recurrent Unit (GRU) ネットワークと共同で学習される。
2つのベンチマークデータセットにおけるDSTAネットワークの実験的評価により、最先端の性能を上回ったことが確認された。
DSTAネットワークの個々のコンポーネントのコントリビューションを評価し、ネットワークがそのようなパフォーマンスを実現する方法を明らかにする。
さらに,2つの相補モデルから予測スコアを融合し,その効果を検証し,早期事故予測の性能をさらに高めるための新しい戦略を提案する。
関連論文リスト
- CRASH: Crash Recognition and Anticipation System Harnessing with Context-Aware and Temporal Focus Attentions [13.981748780317329]
カメラ映像から周囲の交通機関の事故を正確にかつ迅速に予測することは、自動運転車(AV)の安全性に不可欠である
本研究は, CRASH と呼ばれる, AV の新たな事故予測フレームワークを提案する。
オブジェクト検出、特徴抽出、オブジェクト認識モジュール、コンテキスト認識モジュール、多層融合の5つのコンポーネントをシームレスに統合する。
私たちのモデルは、平均精度(AP)や平均到達時間(mTTA)といった重要な評価指標において、既存のトップベースラインを超えています。
論文 参考訳(メタデータ) (2024-07-25T04:12:49Z) - Text-Driven Traffic Anomaly Detection with Temporal High-Frequency Modeling in Driving Videos [22.16190711818432]
本稿では,ビデオクリップをテキストプロンプトと整合させる新しい単一ステージ手法であるTHFを紹介し,交通異常検出の新しい視点を提供する。
従来の手法とは異なり、我々の手法の教師付き信号は1ホットベクトルではなく言語から派生しており、より包括的な表現を提供する。
提案したTTHFは,DoTAデータセット上で,+5.4%のAUCで,最先端の競合よりも優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-01-07T15:47:19Z) - Implicit Occupancy Flow Fields for Perception and Prediction in
Self-Driving [68.95178518732965]
自動運転車(SDV)は、周囲を認識でき、他の交通参加者の将来の行動を予測できなければならない。
既存の作業は、検出されたオブジェクトの軌跡が続くオブジェクト検出を実行するか、シーン全体の密度の高い占有とフローグリッドを予測するかのいずれかである。
これは、認識と将来の予測に対する統一されたアプローチを動機付け、単一のニューラルネットワークで時間とともに占有とフローを暗黙的に表現します。
論文 参考訳(メタデータ) (2023-08-02T23:39:24Z) - Camera-Radar Perception for Autonomous Vehicles and ADAS: Concepts,
Datasets and Metrics [77.34726150561087]
本研究の目的は、ADASおよび自動運転車のカメラおよびレーダーによる認識の現在のシナリオに関する研究を行うことである。
両センサと融合に関する概念と特徴を提示する。
本稿では、ディープラーニングに基づく検出とセグメンテーションタスクの概要と、車両の認識における主要なデータセット、メトリクス、課題、オープンな質問について説明する。
論文 参考訳(メタデータ) (2023-03-08T00:48:32Z) - Cognitive Accident Prediction in Driving Scenes: A Multimodality
Benchmark [77.54411007883962]
本研究では,視覚的観察と運転者の注意に対する人為的な文章記述の認識を効果的に活用し,モデルトレーニングを容易にする認知事故予測手法を提案する。
CAPは、注意テキスト〜ビジョンシフト融合モジュール、注意シーンコンテキスト転送モジュール、運転注意誘導事故予測モジュールによって構成される。
我々は,1,727件の事故ビデオと219万フレーム以上の大規模ベンチマークを構築した。
論文 参考訳(メタデータ) (2022-12-19T11:43:02Z) - An Attention-guided Multistream Feature Fusion Network for Localization
of Risky Objects in Driving Videos [10.674638266121574]
本稿では,ダッシュカムビデオから危険な交通エージェントをローカライズする,注意誘導型マルチストリーム機能融合ネットワーク(AM-Net)を提案する。
2つのGRU(Gated Recurrent Unit)ネットワークは、危険な交通エージェントを識別するために、連続するビデオフレームから抽出されたオブジェクトバウンディングボックスと光フロー特徴を用いている。
AM-Netは2つの機能ストリームを使用して、ビデオ内のトラフィックエージェントの危険度スコアを予測する。
論文 参考訳(メタデータ) (2022-09-16T13:36:28Z) - Safety-aware Motion Prediction with Unseen Vehicles for Autonomous
Driving [104.32241082170044]
本研究では,無人運転用無人車を用いた新しい作業,安全を意識した動作予測手法について検討する。
既存の車両の軌道予測タスクとは異なり、占有率マップの予測が目的である。
私たちのアプローチは、ほとんどの場合、目に見えない車両の存在を予測できる最初の方法です。
論文 参考訳(メタデータ) (2021-09-03T13:33:33Z) - DRIVE: Deep Reinforced Accident Anticipation with Visual Explanation [36.350348194248014]
交通事故予測は、ダッシュカムビデオから将来の事故の発生を正確にかつ迅速に予測することを目的としている。
既存のアプローチは通常、将来の事故が起こる前に、空間的および時間的文脈の手がかりを捉えることに重点を置いている。
本稿では, DRIVE という視覚表現を用いた深部強化型事故予測手法を提案する。
論文 参考訳(メタデータ) (2021-07-21T16:33:21Z) - DS-Net: Dynamic Spatiotemporal Network for Video Salient Object
Detection [78.04869214450963]
時間情報と空間情報のより効果的な融合のための新しい動的時空間ネットワーク(DSNet)を提案する。
提案手法は最先端アルゴリズムよりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-12-09T06:42:30Z) - Uncertainty-based Traffic Accident Anticipation with Spatio-Temporal
Relational Learning [30.59728753059457]
交通事故予測は、できるだけ早くダッシュカムビデオから事故を予測することを目的としている。
現在の決定論的ディープニューラルネットワークは、誤った予測では過信される可能性がある。
本稿では,関係時間学習を用いた不確実性に基づく事故予測モデルを提案する。
論文 参考訳(メタデータ) (2020-08-01T20:21:48Z) - A Spatial-Temporal Attentive Network with Spatial Continuity for
Trajectory Prediction [74.00750936752418]
空間連続性をもつ空間時間減衰ネットワーク(STAN-SC)という新しいモデルを提案する。
まず、最も有用かつ重要な情報を探るために、空間的時間的注意機構を提示する。
第2に、生成軌道の空間的連続性を維持するために、シーケンスと瞬間状態情報に基づく共同特徴系列を実行する。
論文 参考訳(メタデータ) (2020-03-13T04:35:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。