論文の概要: Zero-shot Hazard Identification in Autonomous Driving: A Case Study on the COOOL Benchmark
- arxiv url: http://arxiv.org/abs/2412.19944v1
- Date: Fri, 27 Dec 2024 22:43:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-31 16:06:42.788685
- Title: Zero-shot Hazard Identification in Autonomous Driving: A Case Study on the COOOL Benchmark
- Title(参考訳): 自動運転におけるゼロショットハザード同定 : COOOLベンチマークを事例として
- Authors: Lukas Picek, Vojtěch Čermák, Marek Hanzl,
- Abstract要約: 本稿では,自動運転におけるラベル外ハザードの検出と分類のための新しいベンチマークであるCOOOLコンペティションについて述べる。
本手法は, 運転者反応検出, (ii) 危険物識別, (iii) 危険キャプションの3つのタスクにまたがる多様な手法を統合する。
提案されたパイプラインはベースライン手法を大きなマージンで上回り、相対誤差を33%減らし、32チームからなる最終リーダーボードで2位となった。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This paper presents our submission to the COOOL competition, a novel benchmark for detecting and classifying out-of-label hazards in autonomous driving. Our approach integrates diverse methods across three core tasks: (i) driver reaction detection, (ii) hazard object identification, and (iii) hazard captioning. We propose kernel-based change point detection on bounding boxes and optical flow dynamics for driver reaction detection to analyze motion patterns. For hazard identification, we combined a naive proximity-based strategy with object classification using a pre-trained ViT model. At last, for hazard captioning, we used the MOLMO vision-language model with tailored prompts to generate precise and context-aware descriptions of rare and low-resolution hazards. The proposed pipeline outperformed the baseline methods by a large margin, reducing the relative error by 33%, and scored 2nd on the final leaderboard consisting of 32 teams.
- Abstract(参考訳): 本稿では,自動運転におけるラベル外ハザードの検出と分類のための新しいベンチマークであるCOOOLコンペティションについて述べる。
このアプローチは3つのコアタスクにまたがる多様なメソッドを統合する。
(i)ドライバ反応検出
(二)危険物識別、及び
(三)ハザードキャプション
本研究では,ドライバの動作パターンを解析するために,境界ボックス上のカーネルベースの変化点検出と光フローダイナミクスを提案する。
リスク同定のために,事前訓練したViTモデルを用いて,近距離戦略と対象分類を併用した。
最後に,MOLMO視覚言語モデルを用いて,レアおよび低解像度のハザードを正確に,文脈に適応した記述を生成する。
提案されたパイプラインはベースライン手法を大きなマージンで上回り、相対誤差を33%減らし、32チームからなる最終リーダーボードで2位となった。
関連論文リスト
- Cross-Camera Distracted Driver Classification through Feature Disentanglement and Contrastive Learning [13.613407983544427]
車両内のカメラ位置の変化に耐えられるような頑健なモデルを導入する。
我々のドライバ行動監視ネットワーク(DBMNet)は軽量なバックボーンに依存し、アンタングルメントモジュールを統合する。
100-Driverデータセットの夜間および夜間のサブセットで行った実験は、我々のアプローチの有効性を検証した。
論文 参考訳(メタデータ) (2024-11-20T10:27:12Z) - Online Collision Risk Estimation via Monocular Depth-Aware Object Detectors and Fuzzy Inference [6.856508678236828]
このフレームワークは、異なるアルゴリズムによって生成される予測を2つ受け取り、不整合とファジィ推論による衝突リスクを関連付ける。
IoU(Intersection-over-Union)と深度差測定(deep discrepancy measure)に基づいて,2組の予測の不一致が3次元物体検出器の安全性関連誤差と強く相関していることを実験的に検証した。
論文 参考訳(メタデータ) (2024-11-09T20:20:36Z) - Token-Level Adversarial Prompt Detection Based on Perplexity Measures
and Contextual Information [67.78183175605761]
大規模言語モデルは、敵の迅速な攻撃に影響を受けやすい。
この脆弱性は、LLMの堅牢性と信頼性に関する重要な懸念を浮き彫りにしている。
トークンレベルで敵のプロンプトを検出するための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-11-20T03:17:21Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - ReMAV: Reward Modeling of Autonomous Vehicles for Finding Likely Failure
Events [1.84926694477846]
本稿では、まず、オフライン軌道を用いて、既存の自動運転車の挙動を分析するブラックボックステストフレームワークを提案する。
実験の結果,車両衝突,道路物体衝突,歩行者衝突,オフロードステアリング事故の発生率は35,23,48,50%増加した。
論文 参考訳(メタデータ) (2023-08-28T13:09:00Z) - Probabilistic Risk Assessment of an Obstacle Detection System for GoA 4
Freight Trains [0.0]
本稿では,低速貨物列車の障害物検出機能設計のための定量的リスク評価手法について論じる。
一定の不合理な仮定の下では、結果として生じるハザード率は特定のアプリケーション設定で許容される。
畳み込みニューラルネットワークと従来の画像処理ソフトウェアにおける誤分類の残留リスクを評価する統計的アプローチは、安全クリティカルな障害物検出機能に高い信頼性を配置できることを示唆している。
論文 参考訳(メタデータ) (2023-06-26T16:18:20Z) - Exploring Active 3D Object Detection from a Generalization Perspective [58.597942380989245]
不確実性に基づくアクティブな学習ポリシーは、ポイントクラウドの情報性とボックスレベルのアノテーションコストの間のトレードオフのバランスを取れません。
冗長な3次元境界ボックスラベルの点群を階層的にフィルタリングするtextscCrbを提案する。
実験により,提案手法が既存のアクティブラーニング戦略より優れていることが示された。
論文 参考訳(メタデータ) (2023-01-23T02:43:03Z) - Real-Time Driver Monitoring Systems through Modality and View Analysis [28.18784311981388]
ドライバーの気晴らしが道路事故の主要な原因であることが知られている。
State-of-the-artメソッドはレイテンシを無視しながら精度を優先する。
本稿では,ビデオフレーム間の時間的関係を無視した時間効率な検出モデルを提案する。
論文 参考訳(メタデータ) (2022-10-17T21:22:41Z) - GLENet: Boosting 3D Object Detectors with Generative Label Uncertainty Estimation [70.75100533512021]
本稿では,対象物の潜在的可算有界箱の多様性として,ラベルの不確実性問題を定式化する。
本稿では,条件付き変分オートエンコーダを応用した生成フレームワークであるGLENetを提案する。
GLENetが生成するラベルの不確実性はプラグアンドプレイモジュールであり、既存のディープ3D検出器に便利に統合することができる。
論文 参考訳(メタデータ) (2022-07-06T06:26:17Z) - OW-DETR: Open-world Detection Transformer [90.56239673123804]
オープンワールドオブジェクト検出のための新しいエンドツーエンドトランスフォーマーベースのフレームワークOW-DETRを提案する。
OW-DETRは3つの専用コンポーネント、すなわち注目駆動の擬似ラベル、新規性分類、オブジェクトネススコアから構成される。
我々のモデルは、最近導入されたOWODアプローチであるOREよりも優れており、リコールの度合いは1.8%から3.3%である。
論文 参考訳(メタデータ) (2021-12-02T18:58:30Z) - Can Autonomous Vehicles Identify, Recover From, and Adapt to
Distribution Shifts? [104.04999499189402]
トレーニング外の配布(OOD)シナリオは、デプロイ時にエージェントを学ぶ上で一般的な課題である。
インプロバスト模倣計画(RIP)と呼ばれる不確実性を考慮した計画手法を提案する。
提案手法は,OODシーンにおける過信および破滅的な外挿を低減し,分布変化を検知し,回復することができる。
分散シフトを伴うタスク群に対する駆動エージェントのロバスト性を評価するために,自動走行車ノベルシーンベンチマークであるtexttCARNOVEL を導入する。
論文 参考訳(メタデータ) (2020-06-26T11:07:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。