論文の概要: Temporally Consistent Unsupervised Segmentation for Mobile Robot Perception
- arxiv url: http://arxiv.org/abs/2507.22194v1
- Date: Tue, 29 Jul 2025 19:41:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-31 16:14:17.840144
- Title: Temporally Consistent Unsupervised Segmentation for Mobile Robot Perception
- Title(参考訳): 移動ロボット知覚のための時間的一貫した教師なしセグメンテーション
- Authors: Christian Ellis, Maggie Wigness, Craig Lennon, Lance Fiondella,
- Abstract要約: 本稿では,移動ロボットのビデオストリームから,時間的に一貫した地形のセグメンテーションを行うFrontier-Segを紹介する。
我々は、RUGDやRELLIS-3Dを含む様々なベンチマークデータセットに基づいてFrontier-Segを評価し、非構造化オフロード環境における教師なしセグメンテーションを実行する能力を実証した。
- 参考スコア(独自算出の注目度): 1.1749564892273827
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rapid progress in terrain-aware autonomous ground navigation has been driven by advances in supervised semantic segmentation. However, these methods rely on costly data collection and labor-intensive ground truth labeling to train deep models. Furthermore, autonomous systems are increasingly deployed in unrehearsed, unstructured environments where no labeled data exists and semantic categories may be ambiguous or domain-specific. Recent zero-shot approaches to unsupervised segmentation have shown promise in such settings but typically operate on individual frames, lacking temporal consistency-a critical property for robust perception in unstructured environments. To address this gap we introduce Frontier-Seg, a method for temporally consistent unsupervised segmentation of terrain from mobile robot video streams. Frontier-Seg clusters superpixel-level features extracted from foundation model backbones-specifically DINOv2-and enforces temporal consistency across frames to identify persistent terrain boundaries or frontiers without human supervision. We evaluate Frontier-Seg on a diverse set of benchmark datasets-including RUGD and RELLIS-3D-demonstrating its ability to perform unsupervised segmentation across unstructured off-road environments.
- Abstract(参考訳): 地形を意識した自動地表面ナビゲーションの急速な進歩は、教師付きセマンティックセグメンテーションの進歩によって推進されている。
しかし、これらの手法は、深層モデルのトレーニングに費用がかかるデータ収集と労働集約的な真実ラベルに依存している。
さらに、ラベル付きデータが存在しず、セマンティックなカテゴリが曖昧あるいはドメイン固有であるような、リハーサルのない非構造化環境で、自律的なシステムがますます展開される。
教師なしセグメンテーションに対する最近のゼロショットアプローチは、そのような設定では有望であるが、通常は個々のフレームで動作し、時間的一貫性が欠如している。
このギャップに対処するために,移動ロボットのビデオストリームから時間的に一貫した地形のセグメンテーションを行うFrontier-Segを導入する。
Frontier-Segクラスタ 超ピクセルレベルの特徴は、ファンデーションモデルバックボーン(特にDINOv2)から抽出され、フレーム間の時間的一貫性を強制し、人間の監督なしに永続的な地形境界やフロンティアを特定する。
我々は、RUGDやRELLIS-3Dを含む様々なベンチマークデータセットに基づいてFrontier-Segを評価し、非構造化オフロード環境における教師なしセグメンテーションを実行する能力を実証した。
関連論文リスト
- Embodied-RAG: General Non-parametric Embodied Memory for Retrieval and Generation [69.01029651113386]
Embodied-RAGは、非パラメトリックメモリシステムによるエンボディエージェントのモデルを強化するフレームワークである。
コアとなるEmbodied-RAGのメモリはセマンティックフォレストとして構成され、言語記述を様々なレベルで詳細に保存する。
Embodied-RAGがRAGをロボット領域に効果的にブリッジし、250以上の説明とナビゲーションクエリをうまく処理できることを実証する。
論文 参考訳(メタデータ) (2024-09-26T21:44:11Z) - OoDIS: Anomaly Instance Segmentation and Detection Benchmark [57.89836988990543]
この作業は、インスタンスセグメンテーションとオブジェクト検出タスクを含むために、よく使われる異常セグメンテーションベンチマークを拡張します。
異常セグメンテーションおよびオブジェクト検出手法の評価は,これらの課題が未解決問題のままであることを示す。
論文 参考訳(メタデータ) (2024-06-17T17:59:56Z) - Outlier-Robust Long-Term Robotic Mapping Leveraging Ground Segmentation [1.7948767405202701]
箱から出られる堅牢な長期ロボットマッピングシステムを提案する。
i) 外れ値の存在を否定する高速で頑健な接地分割を提案する。
粗悪なアウトリールの存在を包含する地盤セグメンテーションによるロバストな登録を提案する。
論文 参考訳(メタデータ) (2024-05-18T04:56:15Z) - Semi-Supervised Active Learning for Semantic Segmentation in Unknown
Environments Using Informative Path Planning [27.460481202195012]
ロボットの視力を改善するために、自己監督的で完全に教師された能動学習手法が出現した。
セマンティックセグメンテーションの半教師付き能動学習のための計画法を提案する。
我々は、モデル不確実性の高い未探索空間のフロンティアに向けて導かれた適応地図ベースのプランナーを活用する。
論文 参考訳(メタデータ) (2023-12-07T16:16:47Z) - A Threefold Review on Deep Semantic Segmentation: Efficiency-oriented,
Temporal and Depth-aware design [77.34726150561087]
我々は、自動運転車のビジョンの文脈において、Deep Semanticの最も関連性があり最近の進歩について調査を行う。
私たちの主な目的は、それぞれの視点で直面している主要な方法、利点、制限、結果、課題に関する包括的な議論を提供することです。
論文 参考訳(メタデータ) (2023-03-08T01:29:55Z) - Temporal Perceiver: A General Architecture for Arbitrary Boundary
Detection [48.33132632418303]
ジェネリック境界検出(GBD)は、動画をセマンティック・コヒーレントと分類なしの単位に分割する一般的な境界を特定することを目的としている。
従来の研究では、単純なCNNからLSTMまでの複雑なディープネットワークの設計で、これらの異なるレベルの汎用境界を別々に扱っていた。
本稿では,Transformer を用いた汎用アーキテクチャである Temporal Perceiver について述べる。
論文 参考訳(メタデータ) (2022-03-01T09:31:30Z) - Robust Object Detection via Instance-Level Temporal Cycle Confusion [89.1027433760578]
物体検出器の分布外一般化を改善するための補助的自己監視タスクの有効性を検討する。
最大エントロピーの原理に触発されて,新しい自己監督タスクであるインスタンスレベル時間サイクル混乱(cycconf)を導入する。
それぞれのオブジェクトに対して、タスクは、ビデオ内の隣接するフレームで最も異なるオブジェクトの提案を見つけ、自己スーパービジョンのために自分自身にサイクルバックすることです。
論文 参考訳(メタデータ) (2021-04-16T21:35:08Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。