論文の概要: Driver Assistance System Based on Multimodal Data Hazard Detection
- arxiv url: http://arxiv.org/abs/2502.03005v1
- Date: Wed, 05 Feb 2025 09:02:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-06 14:28:19.923788
- Title: Driver Assistance System Based on Multimodal Data Hazard Detection
- Title(参考訳): マルチモーダルデータハザード検出に基づくドライバ支援システム
- Authors: Long Zhouxiang, Ovanes Petrosian,
- Abstract要約: 本稿では,マルチモーダル運転支援システムを提案する。
道路状況映像、ドライバーの顔映像、音声データを統合して、インシデント認識の精度を高める。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Autonomous driving technology has advanced significantly, yet detecting driving anomalies remains a major challenge due to the long-tailed distribution of driving events. Existing methods primarily rely on single-modal road condition video data, which limits their ability to capture rare and unpredictable driving incidents. This paper proposes a multimodal driver assistance detection system that integrates road condition video, driver facial video, and audio data to enhance incident recognition accuracy. Our model employs an attention-based intermediate fusion strategy, enabling end-to-end learning without separate feature extraction. To support this approach, we develop a new three-modality dataset using a driving simulator. Experimental results demonstrate that our method effectively captures cross-modal correlations, reducing misjudgments and improving driving safety.
- Abstract(参考訳): 自動運転技術は大幅に進歩しているが、運転イベントの長期分布のため、運転異常を検出することは大きな課題である。
既存の手法は主に単一モードの道路条件のビデオデータに依存しており、これは稀で予測不可能な運転事故を捉える能力を制限している。
本稿では,道路状況映像,運転者顔映像,音声データを統合して事故認識精度を高めるマルチモーダル運転支援システムを提案する。
我々のモデルは注意に基づく中間融合戦略を採用し、特徴抽出を別途行わずにエンドツーエンドの学習を可能にする。
このアプローチを支援するために,運転シミュレータを用いた新しい3モーダリティデータセットを開発した。
実験結果から,本手法はモーダル間相関を効果的に把握し,誤判定を低減し,運転安全性を向上することが示された。
関連論文リスト
- VTD: Visual and Tactile Database for Driver State and Behavior Perception [1.6277623188953556]
本稿では,運転状態とインタラクション行動の主観的不確実性に対処する新しい視覚触覚認識手法を提案する。
疲労および散逸条件下でのマルチモーダルデータを包含する包括的データセットを開発した。
論文 参考訳(メタデータ) (2024-12-06T09:31:40Z) - Efficient Mixture-of-Expert for Video-based Driver State and Physiological Multi-task Estimation in Conditional Autonomous Driving [12.765198683804094]
道路の安全は世界中で重要な課題であり、交通事故による死者は約135万人である。
VDMoEと呼ばれる新しいマルチタスクDMSを提案し、RGBビデオ入力を利用して運転状態を非侵襲的に監視する。
論文 参考訳(メタデータ) (2024-10-28T14:49:18Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - Unsupervised Driving Event Discovery Based on Vehicle CAN-data [62.997667081978825]
本研究は,車両CANデータのクラスタリングとセグメンテーションを同時に行うことで,一般的な運転イベントを教師なしで識別する手法である。
我々は、実際のTesla Model 3車載CANデータと、異なる運転イベントをアノテートした2時間の運転セッションのデータセットを用いて、アプローチを評価した。
論文 参考訳(メタデータ) (2023-01-12T13:10:47Z) - FBLNet: FeedBack Loop Network for Driver Attention Prediction [50.936478241688114]
非客観的運転経験のモデル化は困難であり,既存手法では運転経験蓄積手順を模擬する機構が欠如している。
本稿では,運転経験蓄積手順をモデル化するFeedBack Loop Network (FBLNet)を提案する。
提案モデルでは,既存の手法に対して強い優位性を示し,2つのドライバー注意ベンチマークデータセットの性能向上を実現している。
論文 参考訳(メタデータ) (2022-12-05T08:25:09Z) - COOPERNAUT: End-to-End Driving with Cooperative Perception for Networked
Vehicles [54.61668577827041]
本稿では,車間認識を用いたエンドツーエンド学習モデルであるCOOPERNAUTを紹介する。
われわれのAutoCastSim実験は、我々の協調知覚駆動モデルが平均成功率を40%向上させることを示唆している。
論文 参考訳(メタデータ) (2022-05-04T17:55:12Z) - Learning Interactive Driving Policies via Data-driven Simulation [125.97811179463542]
データ駆動シミュレータは、ポリシー学習の駆動に高いデータ効率を約束する。
小さな基盤となるデータセットは、インタラクティブな運転を学ぶための興味深い、挑戦的なエッジケースを欠いていることが多い。
本研究では,ロバストな運転方針の学習に塗装されたアドカーを用いたシミュレーション手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T20:14:02Z) - Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。
本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文 参考訳(メタデータ) (2021-04-19T11:48:13Z) - Driver Anomaly Detection: A Dataset and Contrastive Learning Approach [17.020790792750457]
本稿では,通常の運転と異常運転を区別する指標を学習するための対照的な学習手法を提案する。
本手法はテストセットの0.9673 AUCに到達し,異常検出タスクに対する対照的な学習手法の有効性を実証した。
論文 参考訳(メタデータ) (2020-09-30T13:23:21Z) - Improved YOLOv3 Object Classification in Intelligent Transportation
System [29.002873450422083]
高速道路における車両・運転者・人の検出・分類を実現するために, YOLOv3に基づくアルゴリズムを提案する。
モデルは優れた性能を持ち、道路遮断、異なる姿勢、極端な照明に頑丈である。
論文 参考訳(メタデータ) (2020-04-08T11:45:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。