Fugu-MT 論文翻訳(概要): Exploring the Potential of Multi-Modal AI for Driving Hazard Prediction

論文の概要: Exploring the Potential of Multi-Modal AI for Driving Hazard Prediction

arxiv url: http://arxiv.org/abs/2310.04671v4
Date: Mon, 1 Jul 2024 09:29:39 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-02 17:50:16.404271
Title: Exploring the Potential of Multi-Modal AI for Driving Hazard Prediction
Title（参考訳）: 運転ハザード予測のためのマルチモーダルAIの可能性を探る
Authors: Korawat Charoenpitaks, Van-Quang Nguyen, Masanori Suganuma, Masahiro Takahashi, Ryoma Niihara, Takayuki Okatani,
Abstract要約: 本稿では,車載ダッシュカムが捉えた単一入力画像を用いて,差し迫った事故を予測するためのタスクとして定式化する。この問題は、不確実な観測に基づいて将来の出来事を予測し、推論する必要がある。この調査対象領域の研究を可能にするために、DHPRデータセットと呼ばれる新しいデータセットが作成される。
参考スコア（独自算出の注目度）: 18.285227911703977
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: This paper addresses the problem of predicting hazards that drivers may encounter while driving a car. We formulate it as a task of anticipating impending accidents using a single input image captured by car dashcams. Unlike existing approaches to driving hazard prediction that rely on computational simulations or anomaly detection from videos, this study focuses on high-level inference from static images. The problem needs predicting and reasoning about future events based on uncertain observations, which falls under visual abductive reasoning. To enable research in this understudied area, a new dataset named the DHPR (Driving Hazard Prediction and Reasoning) dataset is created. The dataset consists of 15K dashcam images of street scenes, and each image is associated with a tuple containing car speed, a hypothesized hazard description, and visual entities present in the scene. These are annotated by human annotators, who identify risky scenes and provide descriptions of potential accidents that could occur a few seconds later. We present several baseline methods and evaluate their performance on our dataset, identifying remaining issues and discussing future directions. This study contributes to the field by introducing a novel problem formulation and dataset, enabling researchers to explore the potential of multi-modal AI for driving hazard prediction.
Abstract（参考訳）: 本稿では,運転中に運転者が遭遇する危険を予知する問題に対処する。本稿では,車載ダッシュカムが捉えた単一入力画像を用いて,差し迫った事故を予測するためのタスクとして定式化する。シミュレーションやビデオからの異常検出に頼っている既存の危険予測手法とは異なり、本研究では静的画像からの高レベル推論に焦点を当てる。この問題は、視覚的誘惑的推論に該当する不確実な観測に基づいて、将来の出来事を予測し、推論する必要がある。この調査対象領域の研究を可能にするために、DHPR(Driving Hazard Prediction and Reasoning)データセットと呼ばれる新しいデータセットが作成されている。データセットは、ストリートシーンの15Kダシュカム画像で構成され、各画像は、車速、仮説上の危険記述、シーンに存在する視覚的実体を含むタプルに関連付けられている。これらのアノテーションは、危険シーンを特定し、数秒後に起こりうる潜在的な事故について記述する人間のアノテーションによって注釈付けされている。いくつかのベースライン手法を提示し、データセット上での性能を評価し、残りの問題を特定し、今後の方向性について議論する。この研究は、新しい問題定式化とデータセットを導入し、研究者がハザード予測を駆動するためのマルチモーダルAIの可能性を探ることを可能にすることにより、この分野に寄与する。

関連論文リスト

AVOID: The Adverse Visual Conditions Dataset with Obstacles for Driving Scene Understanding [48.97660297411286]
シミュレーション環境におけるリアルタイム障害物検出のための新しいデータセットであるAVOIDを紹介する。 AVOIDは、様々な天候と時間条件下で捕獲された各経路に沿って、予期せぬ道路障害物からなる。各画像は、対応するセマンティックマップと深度マップ、生およびセマンティックLiDARデータ、およびウェイポイントと結合される。
論文参考訳（メタデータ） (2025-12-29T05:34:26Z)
Leveraging Driver Field-of-View for Multimodal Ego-Trajectory Prediction [69.29802752614677]
RouteFormerは、GPSデータ、環境コンテキスト、運転者の視野を組み合わせた新しいエゴ軌道予測ネットワークである。データ不足に対処し、多様性を高めるために、同期運転場と視線データに富んだ都市運転シナリオのデータセットであるGEMを導入する。
論文参考訳（メタデータ） (2023-12-13T23:06:30Z)
Implicit Occupancy Flow Fields for Perception and Prediction in Self-Driving [68.95178518732965]
自動運転車(SDV)は、周囲を認識でき、他の交通参加者の将来の行動を予測できなければならない。既存の作業は、検出されたオブジェクトの軌跡が続くオブジェクト検出を実行するか、シーン全体の密度の高い占有とフローグリッドを予測するかのいずれかである。これは、認識と将来の予測に対する統一されたアプローチを動機付け、単一のニューラルネットワークで時間とともに占有とフローを暗黙的に表現します。
論文参考訳（メタデータ） (2023-08-02T23:39:24Z)
DeepAccident: A Motion and Accident Prediction Benchmark for V2X Autonomous Driving [76.29141888408265]
本研究では,現実の運転において頻繁に発生する多様な事故シナリオを含む大規模データセットを提案する。提案したDeepAccidentデータセットには57Kの注釈付きフレームと285Kの注釈付きサンプルが含まれており、これは大規模なnuScenesデータセットの約7倍である。
論文参考訳（メタデータ） (2023-04-03T17:37:00Z)
Cognitive Accident Prediction in Driving Scenes: A Multimodality Benchmark [77.54411007883962]
本研究では,視覚的観察と運転者の注意に対する人為的な文章記述の認識を効果的に活用し,モデルトレーニングを容易にする認知事故予測手法を提案する。 CAPは、注意テキスト〜ビジョンシフト融合モジュール、注意シーンコンテキスト転送モジュール、運転注意誘導事故予測モジュールによって構成される。我々は,1,727件の事故ビデオと219万フレーム以上の大規模ベンチマークを構築した。
論文参考訳（メタデータ） (2022-12-19T11:43:02Z)
Behavioral Intention Prediction in Driving Scenes: A Survey [70.53285924851767]
行動意図予測(BIP)は、人間の思考過程をシミュレートし、特定の行動の早期予測を満たす。この作業は、利用可能なデータセット、重要な要因と課題、歩行者中心および車両中心のBIPアプローチ、BIP対応アプリケーションからのBIPの包括的なレビューを提供する。
論文参考訳（メタデータ） (2022-11-01T11:07:37Z)
Safety-aware Motion Prediction with Unseen Vehicles for Autonomous Driving [104.32241082170044]
本研究では,無人運転用無人車を用いた新しい作業,安全を意識した動作予測手法について検討する。既存の車両の軌道予測タスクとは異なり、占有率マップの予測が目的である。私たちのアプローチは、ほとんどの場合、目に見えない車両の存在を予測できる最初の方法です。
論文参考訳（メタデータ） (2021-09-03T13:33:33Z)
Towards explainable artificial intelligence (XAI) for early anticipation of traffic accidents [8.34084323253809]
事故予測モデルは、事故が起こる前に迅速に正確に事故を予測することを目的としている。既存の人工知能(AI)モデルでは、事故の予測には、意思決定に関する人間解釈可能な説明が欠けている。本稿では,ダッシュカム映像データから交通事故の早期予測のための地図時間的特徴を学習するGated Recurrent Unit (RU) ネットワークを提案する。
論文参考訳（メタデータ） (2021-07-31T15:53:32Z)
DRIVE: Deep Reinforced Accident Anticipation with Visual Explanation [36.350348194248014]
交通事故予測は、ダッシュカムビデオから将来の事故の発生を正確にかつ迅速に予測することを目的としている。既存のアプローチは通常、将来の事故が起こる前に、空間的および時間的文脈の手がかりを捉えることに重点を置いている。本稿では, DRIVE という視覚表現を用いた深部強化型事故予測手法を提案する。
論文参考訳（メタデータ） (2021-07-21T16:33:21Z)
A system of vision sensor based deep neural networks for complex driving scene analysis in support of crash risk assessment and prevention [12.881094474374231]
本稿では,車載ダッシュカメラとディープラーニングアルゴリズムを用いたシーン解析システムを開発した。このシステムのマルチネットには、2つのマルチタスクニューラルネットワークが含まれており、シーンごとに4つのラベルを提供するシーン分類を実行する。 2つの全く新しいデータセットが開発され、一般に公開され、提案されたディープニューラルネットワークのトレーニングに有効であることが証明された。
論文参考訳（メタデータ） (2021-06-18T19:07:59Z)
Vision based Pedestrian Potential Risk Analysis based on Automated Behavior Feature Extraction for Smart and Safe City [5.759189800028578]
このような交差点に設置した道路セキュリティカメラで収集した映像を用いて,歩行者の潜在的な危険度に関する包括的分析モデルを提案する。提案システムは、車や歩行者を自動的に検知し、フレームによって軌跡を計算し、これらの物体間の潜在的危険シーンの可能性を左右する行動特徴を抽出する。韓国大山市の横断歩道で適用し,実現可能性と適用性を評価した。
論文参考訳（メタデータ） (2021-05-06T11:03:10Z)
Generating and Characterizing Scenarios for Safety Testing of Autonomous Vehicles [86.9067793493874]
最先端運転シミュレータを用いて,テストシナリオを特徴付け,生成するための効率的なメカニズムを提案する。次世代シミュレーション(NGSIM)プロジェクトにおける実運転データの特徴付けに本手法を用いる。事故回避の複雑さに基づいてメトリクスを定義してシナリオをランク付けし、事故発生の可能性を最小限に抑えるための洞察を提供します。
論文参考訳（メタデータ） (2021-03-12T17:00:23Z)
Vehicle trajectory prediction in top-view image sequences based on deep learning method [1.181206257787103]
周囲の車両の動きを推定し予測することは、自動車両と高度な安全システムにとって不可欠である。道路の空中画像から得られた画像から学習した計算複雑性の低いモデルを提案する。提案モデルでは, 対象車両とその周辺車両の移動履歴に関する画像を見るだけで, 自動車の将来の進路を予測できる。
論文参考訳（メタデータ） (2021-02-02T20:48:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。