論文の概要: The Multimodal Driver Monitoring Database: A Naturalistic Corpus to
Study Driver Attention
- arxiv url: http://arxiv.org/abs/2101.04639v1
- Date: Wed, 23 Dec 2020 16:37:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-25 18:05:57.125151
- Title: The Multimodal Driver Monitoring Database: A Naturalistic Corpus to
Study Driver Attention
- Title(参考訳): multimodal driver monitoring database: a naturalistic corpus to study driver attention
- Authors: Sumit Jha, Mohamed F. Marzban, Tiancheng Hu, Mohamed H. Mahmoud,
Naofal Al-Dhahir, Carlos Busso
- Abstract要約: スマートな車両は、人間の運転者の行動や行動を監視して、必要な時に警告や介入を行う必要がある。
深層学習とコンピュータビジョンの最近の進歩は、人間の行動や活動を監視する上で大きな約束を示しています。
運転関連タスクの予測に高性能を提供するモデルのトレーニングには、ドメイン内の膨大なデータが必要である。
- 参考スコア(独自算出の注目度): 44.94118128276982
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: A smart vehicle should be able to monitor the actions and behaviors of the
human driver to provide critical warnings or intervene when necessary. Recent
advancements in deep learning and computer vision have shown great promise in
monitoring human behaviors and activities. While these algorithms work well in
a controlled environment, naturalistic driving conditions add new challenges
such as illumination variations, occlusions and extreme head poses. A vast
amount of in-domain data is required to train models that provide high
performance in predicting driving related tasks to effectively monitor driver
actions and behaviors. Toward building the required infrastructure, this paper
presents the multimodal driver monitoring (MDM) dataset, which was collected
with 59 subjects that were recorded performing various tasks. We use the Fi-
Cap device that continuously tracks the head movement of the driver using
fiducial markers, providing frame-based annotations to train head pose
algorithms in naturalistic driving conditions. We ask the driver to look at
predetermined gaze locations to obtain accurate correlation between the
driver's facial image and visual attention. We also collect data when the
driver performs common secondary activities such as navigation using a smart
phone and operating the in-car infotainment system. All of the driver's
activities are recorded with high definition RGB cameras and time-of-flight
depth camera. We also record the controller area network-bus (CAN-Bus),
extracting important information. These high quality recordings serve as the
ideal resource to train various efficient algorithms for monitoring the driver,
providing further advancements in the field of in-vehicle safety systems.
- Abstract(参考訳): スマートな車両は、人間の運転者の行動や行動を監視して、必要な時に警告や介入を行う必要がある。
ディープラーニングとコンピュータビジョンの最近の進歩は、人間の行動や活動を監視することに大きな期待を示している。
これらのアルゴリズムは制御された環境ではうまく機能するが、自然主義的な運転条件は照明のバリエーション、閉塞、極端な頭部ポーズなどの新しい課題をもたらす。
運転行動や振る舞いを効果的に監視するためには、運転に関連するタスクを予測する上で高いパフォーマンスを提供するモデルをトレーニングするために、膨大なドメイン内データが要求される。
本稿では,必要なインフラストラクチャの構築に向けて,59名の被験者で収集したマルチモーダルドライバモニタリング(mdm)データセットについて述べる。
我々は,fiducial markerを用いてドライバの頭部の動きを連続的に追跡するficapデバイスを用いて,自然な運転条件下で頭部ポーズアルゴリズムをトレーニングするためのフレームベースのアノテーションを提供する。
運転者の顔画像と視覚注意の正確な相関を得るため,運転者に所定の視線位置を見るように依頼する。
また,スマートフォンを用いたナビゲーションや車内インフォテインメントシステムの運用など,運転者が共通する二次動作を行う際にもデータを収集する。
ドライバーの活動はすべて高精細なRGBカメラと飛行時間深度カメラで記録される。
制御領域ネットワークバス(CAN-Bus)も記録し,重要な情報を抽出する。
これらの高品質記録は、運転者を監視するための様々な効率的なアルゴリズムを訓練するための理想的なリソースとなり、車内安全システムの分野でさらなる進歩をもたらす。
関連論文リスト
- Towards Infusing Auxiliary Knowledge for Distracted Driver Detection [11.816566371802802]
引き離された運転は世界中の道路事故の主要な原因である。
シーン内のエンティティ間の意味的関係とドライバのポーズの構造的構成に関する補助的知識を注入することで,運転者検出(DDD)の新たな手法であるKiD3を提案する。
具体的には、シーングラフを統合した統合フレームワークを構築し、ドライバが映像フレーム内の視覚的手がかりと情報を合成し、ドライバの行動の全体像を作成する。
論文 参考訳(メタデータ) (2024-08-29T15:28:42Z) - Improving automatic detection of driver fatigue and distraction using
machine learning [0.0]
運転者の疲労と注意をそらした運転は交通事故の重要な要因である。
本稿では,視覚に基づくアプローチと機械学習に基づくアプローチを用いて,疲労と注意をそらした運転行動の同時検出手法を提案する。
論文 参考訳(メタデータ) (2024-01-04T06:33:46Z) - Visual Saliency Detection in Advanced Driver Assistance Systems [7.455416595124159]
本稿では,ドライバの眠気検知システムと,サリエンシに基づく情景理解パイプラインを組み合わせたインテリジェントシステムを提案する。
我々は、運転者を監視するために、ハンドルに埋め込まれた革新的なバイオセンサーを使用している。
収集したPSG時系列を分類するために、専用の1D時間深部畳み込みネットワークが考案された。
論文 参考訳(メタデータ) (2023-07-26T15:41:54Z) - Vision-Language Models can Identify Distracted Driver Behavior from Naturalistic Videos [29.529768377746194]
本稿では,CLIPに基づく運転行動認識手法を提案する。
以上の結果から、このフレームワークは、ゼロショット転送における最先端のパフォーマンスと、2つの公開データセット上でドライバの状態を予測するためのビデオベースCLIPを提供する。
論文 参考訳(メタデータ) (2023-06-16T20:02:51Z) - FBLNet: FeedBack Loop Network for Driver Attention Prediction [75.83518507463226]
非客観的運転経験はモデル化が難しい。
本稿では,運転経験蓄積過程をモデル化するFeedBack Loop Network (FBLNet)を提案する。
インクリメンタルな知識の指導のもと、私たちのモデルは入力画像から抽出されたCNN特徴とトランスフォーマー特徴を融合し、ドライバーの注意を予測します。
論文 参考訳(メタデータ) (2022-12-05T08:25:09Z) - Scalable and Real-time Multi-Camera Vehicle Detection,
Re-Identification, and Tracking [58.95210121654722]
理想化されたビデオストリームやキュレートされたビデオストリームの代わりに,リアルタイムで低解像度のCCTVを処理する,リアルタイムな都市規模のマルチカメラ車両追跡システムを提案する。
私たちの手法は、公共のリーダーボードで上位5人のパフォーマーにランク付けされています。
論文 参考訳(メタデータ) (2022-04-15T12:47:01Z) - Fine-Grained Vehicle Perception via 3D Part-Guided Visual Data
Augmentation [77.60050239225086]
実画像中の車両に動的部品を付加した3次元自動車モデルによる効果的なトレーニングデータ生成プロセスを提案する。
私達のアプローチは人間の相互作用なしで完全に自動です。
VUS解析用マルチタスクネットワークとVHI解析用マルチストリームネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-15T03:03:38Z) - Driver Drowsiness Classification Based on Eye Blink and Head Movement
Features Using the k-NN Algorithm [8.356765961526955]
この研究は、ドライバー監視カメラの信号を用いて、車両内の運転者の眠気検知を拡張することを目的としている。
この目的のために、運転シミュレータ実験において、運転者の点眼行動と頭部運動に関連する35の特徴を抽出する。
最高の特徴セットの分析は、運転者の瞬き行動と頭部の動きに対する眠気の影響についての貴重な洞察を与える。
論文 参考訳(メタデータ) (2020-09-28T12:37:38Z) - DMD: A Large-Scale Multi-Modal Driver Monitoring Dataset for Attention
and Alertness Analysis [54.198237164152786]
視覚は運転監視システム(DMS)の最も豊かで費用対効果の高い技術である
十分に大規模で包括的なデータセットの欠如は、DMS開発の進展のボトルネックとなっている。
本稿では,実運転シナリオとシミュレーション運転シナリオを含む広範囲なデータセットであるドライバモニタリングデータセット(DMD)を紹介する。
論文 参考訳(メタデータ) (2020-08-27T12:33:54Z) - Driver Intention Anticipation Based on In-Cabin and Driving Scene
Monitoring [52.557003792696484]
本稿では,車内映像と交通シーン映像の両方に基づいて運転者の意図を検出する枠組みを提案する。
本フレームワークは,83.98%,F1スコア84.3%の精度で予測を行う。
論文 参考訳(メタデータ) (2020-06-20T11:56:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。