論文の概要: Segment-Level Road Obstacle Detection Using Visual Foundation Model Priors and Likelihood Ratios
- arxiv url: http://arxiv.org/abs/2412.05707v2
- Date: Sun, 19 Jan 2025 00:37:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:16:32.716540
- Title: Segment-Level Road Obstacle Detection Using Visual Foundation Model Priors and Likelihood Ratios
- Title(参考訳): Visual Foundation Model Priors と Likelihood Ratios を用いたセグメントレベル道路障害物検出
- Authors: Youssef Shoeb, Nazir Nayal, Azarm Nowzard, Fatma Güney, Hanno Gottschalk,
- Abstract要約: 現在の道路障害物検出方法は各画素にスコアを割り当て、しきい値を適用して最終的な予測を生成する。
道路障害物を直接予測するために,視覚基盤モデルと確率比からセグメントレベルの特徴を利用する新しい手法を提案する。
個々の画素ではなくセグメントに注目することにより,検出精度を高め,偽陽性を低減し,シーンの変動性にロバスト性を高める。
- 参考スコア(独自算出の注目度): 4.578773000079989
- License:
- Abstract: Detecting road obstacles is essential for autonomous vehicles to navigate dynamic and complex traffic environments safely. Current road obstacle detection methods typically assign a score to each pixel and apply a threshold to generate final predictions. However, selecting an appropriate threshold is challenging, and the per-pixel classification approach often leads to fragmented predictions with numerous false positives. In this work, we propose a novel method that leverages segment-level features from visual foundation models and likelihood ratios to predict road obstacles directly. By focusing on segments rather than individual pixels, our approach enhances detection accuracy, reduces false positives, and offers increased robustness to scene variability. We benchmark our approach against existing methods on the RoadObstacle and LostAndFound datasets, achieving state-of-the-art performance without needing a predefined threshold.
- Abstract(参考訳): 道路障害物の検出は、自動運転車がダイナミックで複雑な交通環境を安全にナビゲートするために不可欠である。
現在の道路障害物検出法は、通常、各ピクセルにスコアを割り当て、しきい値を適用して最終的な予測を生成する。
しかし、適切なしきい値を選択することは困難であり、画素ごとの分類アプローチは、多くの偽陽性を持つ断片化された予測につながることが多い。
本研究では,道路障害物を直接予測するために,視覚基盤モデルと確率比からセグメントレベルの特徴を利用する新しい手法を提案する。
個々の画素ではなくセグメントに注目することにより,検出精度を高め,偽陽性を低減し,シーンの変動性にロバスト性を高める。
RoadObstacleおよびLostAndFoundデータセット上の既存のメソッドに対するアプローチをベンチマークし、事前定義されたしきい値を必要としない最先端のパフォーマンスを実現する。
関連論文リスト
- A Multi-Loss Strategy for Vehicle Trajectory Prediction: Combining Off-Road, Diversity, and Directional Consistency Losses [68.68514648185828]
軌道予測は、自動運転車における計画の安全性と効率に不可欠である。
現在のモデルでは、複雑な交通規則と潜在的な車両の動きを完全に捉えることができないことが多い。
本研究は, オフロード損失, 方向整合誤差, ダイバーシティ損失の3つの新しい損失関数を紹介する。
論文 参考訳(メタデータ) (2024-11-29T14:47:08Z) - REG: Refined Generalized Focal Loss for Road Asset Detection on Thai Highways Using Vision-Based Detection and Segmentation Models [0.0]
本稿では,タイの高速道路における重要道路資産の検出・分断のための新しい枠組みを提案する。
提案手法は,最先端の視覚に基づく検出・セグメンテーションモデルに統合され,クラス不均衡と,未表現の道路要素の局所化の課題に効果的に対処する。
論文 参考訳(メタデータ) (2024-09-15T22:04:33Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - View Consistent Purification for Accurate Cross-View Localization [59.48131378244399]
本稿では,屋外ロボットのための微細な自己局在化手法を提案する。
提案手法は,既存のクロスビューローカライゼーション手法の限界に対処する。
これは、動的環境における知覚を増強する初めての疎視のみの手法である。
論文 参考訳(メタデータ) (2023-08-16T02:51:52Z) - Improving Online Lane Graph Extraction by Object-Lane Clustering [106.71926896061686]
本稿では,局所レーングラフの推定精度を向上させるために,アーキテクチャと損失の定式化を提案する。
提案手法は,中心線をクラスタ中心とすることで,対象を中心線に割り当てることを学ぶ。
提案手法は既存の3次元オブジェクト検出手法の出力を用いて,大幅な性能向上を実現することができることを示す。
論文 参考訳(メタデータ) (2023-07-20T15:21:28Z) - Unsupervised Adaptation from Repeated Traversals for Autonomous Driving [54.59577283226982]
自動運転車はエンドユーザー環境に一般化し、確実に動作させなければならない。
潜在的な解決策の1つは、エンドユーザの環境から収集されたラベルのないデータを活用することである。
適応過程を監督する信頼性のある信号はターゲット領域に存在しない。
この単純な仮定は、ターゲット領域上の3次元物体検出器の反復的自己学習を可能にする強力な信号を得るのに十分であることを示す。
論文 参考訳(メタデータ) (2023-03-27T15:07:55Z) - Spatio-Temporal Context Modeling for Road Obstacle Detection [12.464149169670735]
トレーニングデータのレイアウトを用いて、駆動シーンのデータ駆動コンテキスト時間モデルを構築する。
障害物は最先端のオブジェクト検出アルゴリズムによって検出され、結果は生成されたシーンと組み合わせられる。
論文 参考訳(メタデータ) (2023-01-19T07:06:35Z) - Perspective Aware Road Obstacle Detection [104.57322421897769]
道路障害物検出技術は,車間距離が大きくなるにつれて障害物の見かけの規模が減少するという事実を無視することを示す。
画像位置毎に仮想物体の見かけの大きさを符号化したスケールマップを演算することでこれを活用できる。
次に、この視点マップを利用して、遠近法に対応する大きさの道路合成物体に注入することで、トレーニングデータを生成する。
論文 参考訳(メタデータ) (2022-10-04T17:48:42Z) - An Active and Contrastive Learning Framework for Fine-Grained Off-Road
Semantic Segmentation [7.035838394813961]
自動運転車が運転シーンを理解するためには、詳細なラベル付きオフロードセマンティックセマンティックセマンティックセマンティクスが必要である。
オフロードシーンにおける微粒なセマンティックセグメンテーションは通常、あいまいな自然環境のために統一されたカテゴリ定義を持たない。
本研究では,画素単位のラベルに依存しない能動的かつ対照的な学習手法を提案する。
論文 参考訳(メタデータ) (2022-02-18T03:16:31Z) - Domain Adaptation for Outdoor Robot Traversability Estimation from RGB
data with Safety-Preserving Loss [12.697106921197701]
本稿では,車載RGBカメラの視野内で異なる経路のトラバーススコアを推定し,予測する深層学習に基づくアプローチを提案する。
次に、勾配反転非教師付き適応によるドメインシフトに対処することで、モデルの能力を向上する。
実験結果から,本手法は移動可能領域を良好に同定し,目に見えない場所に一般化できることが示唆された。
論文 参考訳(メタデータ) (2020-09-16T09:19:33Z) - Unsupervised Pixel-level Road Defect Detection via Adversarial
Image-to-Frequency Transform [8.644679871804872]
本稿では,AIFT(Adversarial Image-to-Frequency Transform)を用いた道路欠陥検出のための教師なし手法を提案する。
AIFTは、欠陥検出モデルの導出において、教師なしの方法と敵対的な学習を採用するため、道路舗装欠陥に対するアノテーションは不要である。
論文 参考訳(メタデータ) (2020-01-30T04:50:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。