論文の概要: DesertFormer: Transformer-Based Semantic Segmentation for Off-Road Desert Terrain Classification in Autonomous Navigation Systems
- arxiv url: http://arxiv.org/abs/2603.17056v1
- Date: Tue, 17 Mar 2026 18:42:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.353544
- Title: DesertFormer: Transformer-Based Semantic Segmentation for Off-Road Desert Terrain Classification in Autonomous Navigation Systems
- Title(参考訳): DesertFormer: 自動ナビゲーションシステムにおけるオフロードデザート分類のためのトランスフォーマーに基づくセマンティックセマンティックセグメンテーション
- Authors: Yasaswini Chebolu,
- Abstract要約: オフロード砂漠地形解析のためのセマンティックセグメンテーションパイプラインであるデザートホルダーについて述べる。
このシステムは地形を10の生態学的意味のあるカテゴリーに分類する。
平均インターセクションオーバーユニオン(mIoU)は64.4%、ピクセル精度は86.1%である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reliable terrain perception is a fundamental requirement for autonomous navigation in unstructured, off-road environments. Desert landscapes present unique challenges due to low chromatic contrast between terrain categories, extreme lighting variability, and sparse vegetation that defy the assumptions of standard road-scene segmentation models. We present DesertFormer, a semantic segmentation pipeline for off-road desert terrain analysis based on SegFormer B2 with a hierarchical Mix Transformer (MiT-B2) backbone. The system classifies terrain into ten ecologically meaningful categories -- Trees, Lush Bushes, Dry Grass, Dry Bushes, Ground Clutter, Flowers, Logs, Rocks, Landscape, and Sky -- enabling safety-aware path planning for ground robots and autonomous vehicles. Trained on a purpose-built dataset of 4,176 annotated off-road images at 512x512 resolution, DesertFormer achieves a mean Intersection-over-Union (mIoU) of 64.4% and pixel accuracy of 86.1%, representing a +24.2% absolute improvement over a DeepLabV3 MobileNetV2 baseline (41.0% mIoU). We further contribute a systematic failure analysis identifying the primary confusion patterns -- Ground Clutter to Landscape and Dry Grass to Landscape -- and propose class-weighted training and copy-paste augmentation for rare terrain categories. Code, checkpoints, and an interactive inference dashboard are released at https://github.com/Yasaswini-ch/Vision-based-Desert-Terrain-Segmentation-using-SegFormer.
- Abstract(参考訳): 信頼性の高い地形認識は、非構造、オフロード環境における自律的なナビゲーションの基本的な要件である。
砂漠の景観は、地形カテゴリー間の色調の低いコントラスト、極端な照明の変動、標準道路シーンのセグメンテーションモデルの仮定に反するスパース植生により、固有の課題を呈している。
本研究では, 階層型混合変圧器(MiT-B2)バックボーンを用いたSegFormer B2に基づくオフロード砂漠地形解析のためのセマンティックセマンティックセマンティックセマンティックパイプラインであるDavardFormerを提案する。
このシステムは、地形を10の生態学的に意味のあるカテゴリー(木、ラッシュブッシュ、ドライグラス、ドライブッシュ、グラウンド・クラッター、フラワーズ、ログ、ロックス、ランドスケープ、スカイ)に分類する。
512x512解像度で4,176枚のオフロード画像のアノテートされたデータセットに基づいて、デザートホルダーは64.4%のインターセクション・オーバー・ユニオン(mIoU)、86.1%のピクセル精度を達成し、DeepLabV3 MobileNetV2ベースライン(41.0% mIoU)を+24.2%改善した。
さらに, ランドスケープからランドスケープへ, ドライグラスからランドスケープへ, およびランドスケープへ, ランドスケープへ, ランドスケープへ, ランドスケープへ, ランドスケープへ, ランドスケープへ, ランドスケープへ, ランドスケープへ, クラス重み付きトレーニングと, コピー・ペースト拡張を提案する。
コード、チェックポイント、インタラクティブな推論ダッシュボードはhttps://github.com/Yasaswini-ch/Vision-based-Desert-Terrain-using-SegFormerで公開されている。
関連論文リスト
- Geodiffussr: Generative Terrain Texturing with Elevation Fidelity [48.82552523546255]
テキスト誘導テクスチャマップを合成するフローマッチングパイプラインであるGeodiffussrを紹介する。
マルチスケールコンテンツアグリゲーション(MCA): DEM機能は、複数の解像度でUNetブロックに注入され、グローバルからローカライズされた高度の一貫性が強制される。
Geodiffussrを訓練し,評価するために,SRTM由来のDEMとSentinel-2画像と視覚接地型自然出現キャプションを組み合わせた三重項のグローバル分布,バイオメ-および気候成層コーパスを組み立てた。
論文 参考訳(メタデータ) (2025-11-28T09:52:44Z) - Vision-Based Perception for Autonomous Vehicles in Off-Road Environment Using Deep Learning [0.27412662946127764]
低レイテンシなインテリジェントシステムは、オープンピット鉱山や発展途上国の非均一な地形での自動運転に必要である。
本研究では,未舗装道路やオフロード環境における自動運転車の認識システムを提案する。
本研究は,学習領域を明示的なトラック境界なしに検出するための深層学習の適用,可視性障害下でのアルゴリズムの挙動,および実時間セマンティックセグメンテーションによるフィールドテストについて検討した。
論文 参考訳(メタデータ) (2025-09-20T03:34:07Z) - Few-shot Semantic Learning for Robust Multi-Biome 3D Semantic Mapping in Off-Road Environments [4.106846770364469]
オフロード環境は、高速自律航法において重要な認識課題をもたらす。
本稿では,500枚の画像,スパース,粗いラベル付き(30%ピクセル)マルチバイオームデータセットを微調整し,事前学習したビジョントランスフォーマー(ViT)を活用するアプローチを提案する。
これらのクラスは、新しいレンジベースの計量によって時間とともに融合され、3Dセマンティックなボクセルマップに集約される。
論文 参考訳(メタデータ) (2024-11-10T23:52:24Z) - Neural Semantic Map-Learning for Autonomous Vehicles [85.8425492858912]
本稿では,道路環境のコヒーレントな地図を作成するために,車両群から収集した局所部分写像を中心インスタンスに融合するマッピングシステムを提案する。
本手法は,シーン特異的なニューラルサイン距離場を用いて,雑音と不完全局所部分写像を併用する。
我々は,記憶効率の高いスパース機能グリッドを活用して大規模にスケールし,シーン再構築における不確実性をモデル化するための信頼スコアを導入する。
論文 参考訳(メタデータ) (2024-10-10T10:10:03Z) - OpenLane-V2: A Topology Reasoning Benchmark for Unified 3D HD Mapping [84.65114565766596]
交通シーン構造を考慮したトポロジ推論のための最初のデータセットであるOpenLane-V2を提案する。
OpenLane-V2は2000のアノテートされた道路シーンで構成され、交通要素と車線との関係を記述している。
様々な最先端手法を評価し,OpenLane-V2の定量的,定性的な結果を示し,交通現場におけるトポロジ推論の今後の道筋を示す。
論文 参考訳(メタデータ) (2023-04-20T16:31:22Z) - Monocular BEV Perception of Road Scenes via Front-to-Top View Projection [57.19891435386843]
本稿では,鳥の目視で道路配置と車両占有率によって形成された局所地図を再構築する新しい枠組みを提案する。
我々のモデルは1つのGPU上で25FPSで動作し、リアルタイムパノラマHDマップの再構築に有効である。
論文 参考訳(メタデータ) (2022-11-15T13:52:41Z) - Self-Supervised Traversability Prediction by Learning to Reconstruct
Safe Terrain [11.879448207836038]
高速な自動運転車でオフロードを走行するには、トラバース可能な地形と非トラバース可能な地形を区別する堅牢な認識システムに依存する。
これは人間の時間に多大な投資をし、正確な専門家の分類を仮定し、小さな詳細が誤分類につながる可能性がある。
本研究では,過去の車両経験から高リスク・低リスク地形を自己管理的に予測する手法を提案する。
論文 参考訳(メタデータ) (2022-08-02T09:24:39Z) - Polyline Based Generative Navigable Space Segmentation for Autonomous
Visual Navigation [57.3062528453841]
ロボットが教師なしの方法で移動可能な空間分割を学習できるようにするための表現学習ベースのフレームワークを提案する。
提案するPSV-Netは,単一のラベルを使わずとも,高精度で視覚ナビゲーション可能な空間を学習可能であることを示す。
論文 参考訳(メタデータ) (2021-10-29T19:50:48Z) - SPIN Road Mapper: Extracting Roads from Aerial Images via Spatial and
Interaction Space Graph Reasoning for Autonomous Driving [64.10636296274168]
道路抽出は、自律航法システムを構築するための重要なステップである。
この問題に対して単に畳み込みニューラルネットワーク(ConvNets)を使用することは、画像内の道路セグメント間の遠い依存関係をキャプチャする非効率であるため、効果がない。
本研究では,ConvNetに接続した時,特徴写像から投影された空間空間および相互作用空間上に構築されたグラフの推論を行う空間空間グラフ推論(SPIN)モジュールを提案する。
論文 参考訳(メタデータ) (2021-09-16T03:52:17Z) - OFFSEG: A Semantic Segmentation Framework For Off-Road Driving [6.845371503461449]
OFFSEGと呼ばれるオフロードセマンティックセグメンテーションのためのフレームワークを提案する。
オフロードセマンティクスセグメンテーションは、不均一な地形、非構造なクラス境界、不規則な特徴、強いテクスチャが存在するため、困難である。
論文 参考訳(メタデータ) (2021-03-23T09:45:41Z) - Learning to Drive Off Road on Smooth Terrain in Unstructured
Environments Using an On-Board Camera and Sparse Aerial Images [32.77027811714963]
本研究では,屋外環境とオフロード環境と非構造環境の衝突を同時に回避しながら,滑らかな地形での走行を学習する手法を提案する。
本手法は,地形の粗さや衝突のラベル付けに完全に自己制御されたモデルベースおよびモデルフリー強化学習手法をオンボードセンサで適用する。
論文 参考訳(メタデータ) (2020-04-09T17:27:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。