論文の概要: A Cross-Scale Decoder with Token Refinement for Off-Road Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2603.27931v1
- Date: Mon, 30 Mar 2026 00:59:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.182753
- Title: A Cross-Scale Decoder with Token Refinement for Off-Road Semantic Segmentation
- Title(参考訳): オフロードセマンティックセマンティックセグメンテーションのためのトケリファインメント付きクロススケールデコーダ
- Authors: Seongkyu Choi Jhonghyun An,
- Abstract要約: オフロードセマンティックセグメンテーションは、不規則な地形、植生の散らばり、および固有のアノテーションのあいまいさによって根本的に挑戦されている。
既存のデコーダの設計は、細部が細かな構造を誇張する低スケールのボトルネックに依存しているか、あるいは高精細な特徴を何度も融合させるかのいずれかである。
本稿では,3つの相補的なメカニズムにより,これらの課題に明示的に対処するクロススケールデコーダを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Off-road semantic segmentation is fundamentally challenged by irregular terrain, vegetation clutter, and inherent annotation ambiguity. Unlike urban scenes with crisp object boundaries, off-road environments exhibit strong class-level similarity among terrain categories, resulting in thick and uncertain transition regions that degrade boundary coherence and destabilize training. Rare or thin structures, such as narrow traversable gaps or isolated obstacles, further receive sparse and unreliable supervision and are easily overwhelmed by dominant background textures. Existing decoder designs either rely on low-scale bottlenecks that oversmooth fine structural details, or repeatedly fuse high-detail features, which tends to amplify annotation noise and incur substantial computational cost. We present a cross-scale decoder that explicitly addresses these challenges through three complementary mechanisms. First, a global--local token refinement module consolidates semantic context on a compact bottleneck lattice, guided by boundary-aware regularization to remain robust under ambiguous supervision. Second, a gated detail bridge selectively injects fine-scale structural cues only once through cross-scale attention, preserving boundary and texture information while avoiding noise accumulation. Third, an uncertainty-guided class-aware point refinement selectively updates the least reliable pixels, improving rare and ambiguous structures with minimal computational overhead. The resulting framework achieves noise-robust and boundary-preserving segmentation tailored to off-road environments, recovering fine structural details while maintaining deployment-friendly efficiency. Experimental results on standard off-road benchmarks demonstrate consistent improvements over prior approaches without resorting to heavy dense feature fusion.
- Abstract(参考訳): オフロードセマンティックセグメンテーションは、不規則な地形、植生の散らばり、および固有のアノテーションのあいまいさによって根本的に挑戦されている。
狭い物体境界を持つ都市景観とは異なり、オフロード環境は地形カテゴリー間で強い階級レベルの類似性を示し、境界コヒーレンスを低下させ、訓練を不安定にする、厚く不確実な遷移領域をもたらす。
狭い移動可能な隙間や孤立した障害物のような希少または薄い構造は、さらに疎密で信頼性の低い監督を受け、支配的な背景のテクスチャに圧倒される。
既存のデコーダの設計は、細かな構造の詳細を平滑にする低スケールのボトルネックに依存するか、あるいはアノテーションノイズを増幅し、相当な計算コストを発生させるような高精細な特徴を何度も融合させるかのどちらかである。
本稿では,3つの相補的なメカニズムにより,これらの課題に明示的に対処するクロススケールデコーダを提案する。
まず、グローバルな局所トークン精錬モジュールは、境界認識正規化によって導かれるコンパクトなボトルネック格子上に意味的コンテキストを集約し、曖昧な監視の下で頑健に維持する。
第2に、ゲートディテールブリッジは、音の蓄積を回避しつつ、境界情報やテクスチャ情報を保存しながら、クロススケールの注意を通して、微細な構造的手がかりを選択的に1回だけ注入する。
第三に、不確実性誘導型クラス認識点修正は、最小の計算オーバーヘッドで希少かつ曖昧な構造を改善し、最も信頼性の低いピクセルを選択的に更新する。
このフレームワークは、オフロード環境に適したノイズロストとバウンダリ保存のセグメンテーションを実現し、デプロイメントフレンドリーな効率を維持しながら、詳細な構造的詳細を回復する。
標準オフロードベンチマークの実験結果は、高密度な特徴融合に頼ることなく、以前のアプローチよりも一貫した改善を示す。
関連論文リスト
- Weakly supervised multimodal segmentation of acoustic borehole images with depth-aware cross-attention [0.0]
学習モデルを用いて閾値誘導擬似ラベルを洗練する弱教師付きマルチモーダルセグメンテーションフレームワークを導入する。
しきい値誘導学習による改善が、生のしきい値よりも最も堅牢な改善をもたらすことを確認します。
最強のモデルである自信付き深度対応クロスアテンション(CG-DCA)は、しきい値ベース、画像のみ、および初期のマルチモーダルベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2026-03-21T09:28:05Z) - Rethinking Vector Field Learning for Generative Segmentation [50.08025820235397]
生成的セグメンテーションのためのモデリング拡散モデルが注目されている。
ベクトル場学習の観点から拡散セグメンテーションを再考する。
本稿では,学習した消滅速度場を距離認識補正項で拡張するベクトル場再構成手法を提案する。
この補正は、誘引的相互作用と反発的相互作用の両方を導入し、元の拡散訓練フレームワークを保ちながら、セントロイド付近の勾配等級を増大させる。
論文 参考訳(メタデータ) (2026-03-19T17:58:19Z) - CroBIM-U: Uncertainty-Driven Referring Remote Sensing Image Segmentation [8.834663340762562]
リモートセンシング画像セグメンテーションの参照は、複雑なオーバーヘッド画像内に自然言語で記述された特定のターゲットをローカライズすることを目的としている。
既存の手法では、画像全体にわたって均一な融合と精錬戦略を用いるのが一般的である。
本稿では,適応推論のオーケストレーションに先立って,画素単位の参照不確実性マップを空間として明示的に活用する,テキストbfuncertainty-guidedフレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-07T01:02:39Z) - Lightweight Transformer Framework for Weakly Supervised Semantic Segmentation [0.45880283710344055]
弱い教師付きセマンティックセマンティックセグメンテーション(WSSS)は、ノイズの多い未特定の手がかりから密集したマスクを学習しなければならない。
3つの小さな相乗的変化は、MiTバックボーンを変更することなく、弱い監督を著しく効果的にすることを示した。
提案手法であるCrispFormerは,(1)軽量エッジヘッドと境界認識損失を用いて細い物体の輪郭を監督する境界分岐,(2)画素ごとの不確かさを予測し,重み付けとセグメント化ログの残差補正に使用する不確実性誘導型精細化器,(3)静的結合を置き換える動的マルチスケール融合層をデコーダに拡張する。
論文 参考訳(メタデータ) (2025-11-24T22:40:57Z) - MetaDCSeg: Robust Medical Image Segmentation via Meta Dynamic Center Weighting [77.31583168890633]
医用画像のセグメンテーションは臨床応用に欠かせないが,うるさいアノテーションやあいまいな解剖学的境界によってしばしば破壊される。
そこで我々は,雑音の多い接地トラスラベルの影響を抑えるために,最適な画素単位の重みを学習する頑健なフレームワークであるMetaDCSegを提案する。
提案手法は, 前景, 背景, 境界中心の重み付き特徴距離を利用して, 曖昧な境界付近の重み付き画素にモデルを向ける。
論文 参考訳(メタデータ) (2025-11-24T08:51:02Z) - Terrain-Enhanced Resolution-aware Refinement Attention for Off-Road Segmentation [0.7734726150561086]
低解像度のぼかしエッジのみをヒューズし、局所的なエラーを伝播する設計。
我々は,不完全な監督の下で,グローバルな意味論,局所的な一貫性,境界の忠実さのバランスをとる,分解能を考慮したトークンデコーダを導入する。
論文 参考訳(メタデータ) (2025-11-03T10:36:57Z) - Temporally Consistent Unsupervised Segmentation for Mobile Robot Perception [1.1749564892273827]
本稿では,移動ロボットのビデオストリームから,時間的に一貫した地形のセグメンテーションを行うFrontier-Segを紹介する。
我々は、RUGDやRELLIS-3Dを含む様々なベンチマークデータセットに基づいてFrontier-Segを評価し、非構造化オフロード環境における教師なしセグメンテーションを実行する能力を実証した。
論文 参考訳(メタデータ) (2025-07-29T19:41:37Z) - PFSD: A Multi-Modal Pedestrian-Focus Scene Dataset for Rich Tasks in Semi-Structured Environments [73.80718037070773]
本稿では, 半構造化シーンに, nuScenesの形式を付加したマルチモーダルなPedestrian-Focused Sceneデータセットを提案する。
また,密集・隠蔽シナリオにおける歩行者検出のためのHMFN(Hybrid Multi-Scale Fusion Network)を提案する。
論文 参考訳(メタデータ) (2025-02-21T09:57:53Z) - Mesh Denoising Transformer [104.5404564075393]
Mesh Denoisingは、入力メッシュからノイズを取り除き、特徴構造を保存することを目的としている。
SurfaceFormerはTransformerベースのメッシュDenoisingフレームワークのパイオニアだ。
局所曲面記述子(Local Surface Descriptor)として知られる新しい表現は、局所幾何学的複雑さをキャプチャする。
Denoising Transformerモジュールは、マルチモーダル情報を受信し、効率的なグローバル機能アグリゲーションを実現する。
論文 参考訳(メタデータ) (2024-05-10T15:27:43Z) - Progressive Feature Self-reinforcement for Weakly Supervised Semantic
Segmentation [55.69128107473125]
Weakly Supervised Semantic (WSSS) のイメージレベルラベルを用いたシングルステージアプローチを提案する。
我々は、画像内容が決定論的領域(例えば、自信ある前景と背景)と不確実領域(例えば、オブジェクト境界と誤分類されたカテゴリ)に適応的に分割して、別々の処理を行う。
そこで我々は,これらの自信のある領域と同一のクラスラベルを持つ拡張画像とのセマンティック一貫性を制約する補完的な自己強調手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T13:21:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。