論文の概要: Addressing Out-of-Label Hazard Detection in Dashcam Videos: Insights from the COOOL Challenge
- arxiv url: http://arxiv.org/abs/2501.16037v2
- Date: Sat, 08 Feb 2025 00:11:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-11 14:25:17.497298
- Title: Addressing Out-of-Label Hazard Detection in Dashcam Videos: Insights from the COOOL Challenge
- Title(参考訳): ダッシュカムビデオにおけるラベル外ハザード検出の対応:COOOLチャレンジからの考察
- Authors: Anh-Kiet Duong, Petra Gomez-Krämer,
- Abstract要約: 本稿では,ダッシュカム映像におけるハザード解析の新しい手法を提案する。
危険物に対する運転者反応の検出、危険物の検出、説明的なキャプションの生成に対処する。
本手法は,自動運転におけるアウト・オブ・ラベルの課題において,最も高いスコアを得た。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This paper presents a novel approach for hazard analysis in dashcam footage, addressing the detection of driver reactions to hazards, the identification of hazardous objects, and the generation of descriptive captions. We first introduce a method for detecting driver reactions through speed and sound anomaly detection, leveraging unsupervised learning techniques. For hazard detection, we employ a set of heuristic rules as weak classifiers, which are combined using an ensemble method. This ensemble approach is further refined with differential privacy to mitigate overconfidence, ensuring robustness despite the lack of labeled data. Lastly, we use state-of-the-art vision-language models for hazard captioning, generating descriptive labels for the detected hazards. Our method achieved the highest scores in the Challenge on Out-of-Label in Autonomous Driving, demonstrating its effectiveness across all three tasks. Source codes are publicly available at https://github.com/ffyyytt/COOOL_2025.
- Abstract(参考訳): 本稿では,危険物に対する運転者反応の検出,危険物識別,記述キャプションの生成に対処する,ダッシュカム映像におけるハザード分析のための新しいアプローチを提案する。
まず,教師なし学習技術を活用した速度・音波異常検出による運転者反応検出手法を提案する。
リスク検出には,アンサンブル法を併用した弱い分類器として,ヒューリスティックなルールのセットを用いる。
このアンサンブルアプローチは、ラベル付きデータがないにもかかわらず、過信を緩和し、堅牢性を確保するために、差分プライバシーによってさらに洗練されている。
最後に,リスクキャプションに最先端の視覚言語モデルを使用し,検出されたハザードに対する記述ラベルを生成する。
本手法は,自動運転におけるアウト・オブ・ラベルの課題において,3つの課題にまたがってその有効性を実証し,最も高いスコアを得た。
ソースコードはhttps://github.com/ffyytt/COOOL_2025.comで公開されている。
関連論文リスト
- Semi-supervised Open-World Object Detection [74.95267079505145]
半教師付きオープンワールド検出(SS-OWOD)という,より現実的な定式化を導入する。
提案したSS-OWOD設定では,最先端OWOD検出器の性能が劇的に低下することが実証された。
我々は,MS COCO, PASCAL, Objects365, DOTAの4つのデータセットを用いた実験を行い, 提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-02-25T07:12:51Z) - Token-Level Adversarial Prompt Detection Based on Perplexity Measures
and Contextual Information [67.78183175605761]
大規模言語モデルは、敵の迅速な攻撃に影響を受けやすい。
この脆弱性は、LLMの堅牢性と信頼性に関する重要な懸念を浮き彫りにしている。
トークンレベルで敵のプロンプトを検出するための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-11-20T03:17:21Z) - Exploring the Potential of Multi-Modal AI for Driving Hazard Prediction [18.285227911703977]
本稿では,車載ダッシュカムが捉えた単一入力画像を用いて,差し迫った事故を予測するためのタスクとして定式化する。
この問題は、不確実な観測に基づいて将来の出来事を予測し、推論する必要がある。
この調査対象領域の研究を可能にするために、DHPRデータセットと呼ばれる新しいデータセットが作成される。
論文 参考訳(メタデータ) (2023-10-07T03:16:30Z) - Weakly-Supervised Video Anomaly Detection with Snippet Anomalous
Attention [22.985681654402153]
弱教師付き異常検出のための異常注意機構を提案する。
提案手法は,擬似ラベルの監督を伴わないスニペットレベルの符号化機能を考慮したものである。
論文 参考訳(メタデータ) (2023-09-28T10:03:58Z) - Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。
既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。
本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-07-31T10:22:33Z) - Cognitive Accident Prediction in Driving Scenes: A Multimodality
Benchmark [77.54411007883962]
本研究では,視覚的観察と運転者の注意に対する人為的な文章記述の認識を効果的に活用し,モデルトレーニングを容易にする認知事故予測手法を提案する。
CAPは、注意テキスト〜ビジョンシフト融合モジュール、注意シーンコンテキスト転送モジュール、運転注意誘導事故予測モジュールによって構成される。
我々は,1,727件の事故ビデオと219万フレーム以上の大規模ベンチマークを構築した。
論文 参考訳(メタデータ) (2022-12-19T11:43:02Z) - Driving Anomaly Detection Using Conditional Generative Adversarial
Network [26.45460503638333]
本研究では,条件付き生成逆数ネットワーク(GAN)を用いた運転異常の定量化手法を提案する。
この手法は、事前に観測された信号にモデルを条件付けすることで、今後の運転シナリオを予測する。
結果は知覚的評価によって検証され、アノテータは高い異常スコアで検出されたビデオのリスクと親しみやすさを評価するよう依頼される。
論文 参考訳(メタデータ) (2022-03-15T22:10:01Z) - Sample-Efficient Safety Assurances using Conformal Prediction [57.92013073974406]
早期警戒システムは、安全でない状況が差し迫ったときに警告を提供することができる。
安全性を確実に向上させるためには、これらの警告システムは証明可能な偽陰性率を持つべきである。
本稿では,共形予測と呼ばれる統計的推論手法とロボット・環境力学シミュレータを組み合わせたフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-28T23:00:30Z) - Exploiting Playbacks in Unsupervised Domain Adaptation for 3D Object
Detection [55.12894776039135]
ディープラーニングに基づく最先端の3Dオブジェクト検出器は、有望な精度を示しているが、ドメインの慣用性に過度に適合する傾向がある。
対象領域の擬似ラベルの検出器を微調整することで,このギャップを大幅に削減する新たな学習手法を提案する。
5つの自律運転データセットにおいて、これらの擬似ラベル上の検出器を微調整することで、新しい運転環境への領域ギャップを大幅に減らすことを示す。
論文 参考訳(メタデータ) (2021-03-26T01:18:11Z) - Driver Anomaly Detection: A Dataset and Contrastive Learning Approach [17.020790792750457]
本稿では,通常の運転と異常運転を区別する指標を学習するための対照的な学習手法を提案する。
本手法はテストセットの0.9673 AUCに到達し,異常検出タスクに対する対照的な学習手法の有効性を実証した。
論文 参考訳(メタデータ) (2020-09-30T13:23:21Z) - Towards Anomaly Detection in Dashcam Videos [9.558392439655012]
本稿では,ディープラーニングによるデータ駆動型異常検出のアイデアをダッシュカムビデオに適用することを提案する。
トラックダッシュカムビデオ、すなわちRetroTrucksの大規模で多様なデータセットを提示する。
本研究では, (i) クラス分類損失と (ii) 再構成に基づく損失をRetroTruckの異常検出に適用する。
論文 参考訳(メタデータ) (2020-04-11T00:10:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。