論文の概要: Road Obstacle Video Segmentation
- arxiv url: http://arxiv.org/abs/2509.13181v1
- Date: Tue, 16 Sep 2025 15:34:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 17:50:53.152953
- Title: Road Obstacle Video Segmentation
- Title(参考訳): 道路障害物ビデオセグメンテーション
- Authors: Shyam Nandan Rai, Shyamgopal Karthik, Mariana-Iuliana Georgescu, Barbara Caputo, Carlo Masone, Zeynep Akata,
- Abstract要約: 連続フレームのセグメンテーションマップは強く相関しているため,道路・障害物のセグメンテーションタスクは本質的に時間的であることを示す。
提案手法は、長距離ビデオシーケンスのための道路障害物ビデオセグメント化における最先端技術を確立している。
- 参考スコア(独自算出の注目度): 71.92123495914892
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the growing deployment of autonomous driving agents, the detection and segmentation of road obstacles have become critical to ensure safe autonomous navigation. However, existing road-obstacle segmentation methods are applied on individual frames, overlooking the temporal nature of the problem, leading to inconsistent prediction maps between consecutive frames. In this work, we demonstrate that the road-obstacle segmentation task is inherently temporal, since the segmentation maps for consecutive frames are strongly correlated. To address this, we curate and adapt four evaluation benchmarks for road-obstacle video segmentation and evaluate 11 state-of-the-art image- and video-based segmentation methods on these benchmarks. Moreover, we introduce two strong baseline methods based on vision foundation models. Our approach establishes a new state-of-the-art in road-obstacle video segmentation for long-range video sequences, providing valuable insights and direction for future research.
- Abstract(参考訳): 自律運転エージェントの展開が進むにつれて、道路障害物の検出とセグメンテーションが、安全な自律走行を保証するために重要になっている。
しかし、既存の道路-障害物分割法は個々のフレームに適用され、問題の時間的性質を見落とし、連続するフレーム間の不整合予測マップとなる。
本研究では,連続フレームのセグメント化マップが強く相関していることから,道路・障害物分割作業が本質的に時間的であることを示す。
そこで我々は,道路障害物ビデオセグメンテーションのための4つの評価ベンチマークをキュレートし,これらのベンチマーク上で11の最先端画像および映像ベースのセグメンテーション手法を評価する。
さらに,視覚基盤モデルに基づく2つの強力なベースライン手法を提案する。
我々のアプローチは、長距離ビデオシーケンスのための道路障害物ビデオセグメンテーションにおける新しい最先端技術を確立し、将来の研究に有用な洞察と方向性を提供する。
関連論文リスト
- TopoStreamer: Temporal Lane Segment Topology Reasoning in Autonomous Driving [52.25176274203747]
TopoStreamerは、レーンセグメントトポロジー推論のためのエンドツーエンドの時間知覚モデルである。
TopoStreamerは、ストリーミング属性制約、動的レーン境界位置エンコーディング、およびレーンセグメントのデノイングという3つの重要な改善点を紹介している。
Open-Lane-V2データセットでは、TopoStreamerが最先端のメソッドよりも大幅に改善されている。
論文 参考訳(メタデータ) (2025-07-01T12:10:46Z) - LaneTCA: Enhancing Video Lane Detection with Temporal Context Aggregation [87.71768494466959]
LaneTCAは個々のビデオフレームをブリッジし、時間的コンテキストを効果的に集約する方法を探る。
本研究では,長期的・短期的文脈を抽象化するアキュマティブアテンションモジュールと隣接アテンションモジュールを開発する。
2つのモジュールは、トランスフォーマーアーキテクチャに基づいて慎重に設計されている。
論文 参考訳(メタデータ) (2024-08-25T14:46:29Z) - Homography Guided Temporal Fusion for Road Line and Marking Segmentation [73.47092021519245]
道路線やマーキングは、移動車両、影、グレアの存在下でしばしば閉鎖される。
本稿では,映像フレームを補足的に利用するHomography Guided Fusion (HomoFusion) モジュールを提案する。
カメラ固有のデータと地上平面の仮定をクロスフレーム対応に利用することにより,高速・高精度性能が向上した軽量ネットワークの実現が期待できることを示す。
論文 参考訳(メタデータ) (2024-04-11T10:26:40Z) - PaRK-Detect: Towards Efficient Multi-Task Satellite Imagery Road
Extraction via Patch-Wise Keypoints Detection [12.145321599949236]
我々は、マルチタスク衛星画像道路抽出のための新しい手法、パッチワイド道路キーポイント検出(PaRK-Detect)を提案する。
筆者らのフレームワークは,パッチワイド道路キーポイントの位置と,それら間の近接関係を予測し,道路グラフを単一パスで構築する。
我々は,DeepGlobe, Massachusetts Roads, RoadTracerの既存の最先端手法に対するアプローチを評価し,競争力やより良い結果を得る。
論文 参考訳(メタデータ) (2023-02-26T08:26:26Z) - Motion-supervised Co-Part Segmentation [88.40393225577088]
本稿では,コパートセグメンテーションのための自己教師型ディープラーニング手法を提案する。
提案手法は,映像から推定される動き情報を有効活用して意味のある物体の発見を可能にする。
論文 参考訳(メタデータ) (2020-04-07T09:56:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。