論文の概要: Terrain-Enhanced Resolution-aware Refinement Attention for Off-Road Segmentation
- arxiv url: http://arxiv.org/abs/2511.01434v1
- Date: Mon, 03 Nov 2025 10:36:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:27.223335
- Title: Terrain-Enhanced Resolution-aware Refinement Attention for Off-Road Segmentation
- Title(参考訳): オフロードセグメンテーションにおけるテランの高分解能化
- Authors: Seongkyu Choi, Jhonghyun An,
- Abstract要約: 低解像度のぼかしエッジのみをヒューズし、局所的なエラーを伝播する設計。
我々は,不完全な監督の下で,グローバルな意味論,局所的な一貫性,境界の忠実さのバランスをとる,分解能を考慮したトークンデコーダを導入する。
- 参考スコア(独自算出の注目度): 0.7734726150561086
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Off-road semantic segmentation suffers from thick, inconsistent boundaries, sparse supervision for rare classes, and pervasive label noise. Designs that fuse only at low resolution blur edges and propagate local errors, whereas maintaining high-resolution pathways or repeating high-resolution fusions is costly and fragile to noise. We introduce a resolutionaware token decoder that balances global semantics, local consistency, and boundary fidelity under imperfect supervision. Most computation occurs at a low-resolution bottleneck; a gated cross-attention injects fine-scale detail, and only a sparse, uncertainty-selected set of pixels is refined. The components are co-designed and tightly integrated: global self-attention with lightweight dilated depthwise refinement restores local coherence; a gated cross-attention integrates fine-scale features from a standard high-resolution encoder stream without amplifying noise; and a class-aware point refinement corrects residual ambiguities with negligible overhead. During training, we add a boundary-band consistency regularizer that encourages coherent predictions in a thin neighborhood around annotated edges, with no inference-time cost. Overall, the results indicate competitive performance and improved stability across transitions.
- Abstract(参考訳): オフロードセマンティックセグメンテーションは、太く、一貫性のない境界線、希少なクラスに対するまばらな監督、広汎なラベルノイズに悩まされている。
低解像度のぼかしエッジのみを融合させ、局所的な誤差を伝播させる設計では、高解像度の経路を維持したり、高解像度の融合を繰り返したりする設計は、コストがかかり、ノイズに弱い。
我々は,不完全な監督の下で,グローバルな意味論,局所的な一貫性,境界の忠実さのバランスをとる,分解能を考慮したトークンデコーダを導入する。
殆どの計算は低解像度のボトルネックで行われ、ゲートのクロスアテンションは細かな詳細を注入し、スパースで不確実性に選択されたピクセルのみを洗練する。
軽量な拡張深度改善によるグローバル自己認識は局所コヒーレンスを復元し、ゲートクロスアテンションはノイズを増幅することなく標準の高解像度エンコーダストリームから微細な特徴を統合する。
トレーニング中に境界帯域整合正則化器を追加し,アノテートエッジ付近の細い領域におけるコヒーレントな予測を推論時間なしで促進する。
全体としては、競争性能が向上し、移行間の安定性が向上したことを示している。
関連論文リスト
- Scale-DiT: Ultra-High-Resolution Image Generation with Hierarchical Local Attention [50.391914489898774]
Scale-DiTは、階層的な局所的注意を低解像度のグローバルガイダンスで導入する新しい拡散フレームワークである。
軽量なLoRA適応は、デノナイズ中のグローバルパスとローカルパスをブリッジし、構造と詳細の整合性を確保する。
実験によると、Scale-DiTは2ドル以上の高速な推論とメモリ使用量の削減を実現している。
論文 参考訳(メタデータ) (2025-10-18T03:15:26Z) - DENet: Dual-Path Edge Network with Global-Local Attention for Infrared Small Target Detection [5.672707725914493]
災害警報や海上監視といったリモートセンシングアプリケーションには、赤外線小目標検出が不可欠である。
このタスクの深層モデルの設計における根本的な課題は、微小目標に対する高解像度の空間的詳細を捉えることと、より大きな目標に対する堅牢な意味的コンテキストを抽出することの相違にある。
既存の手法は、低コントラストと高雑音下でターゲットエッジを正確に抽出するには不十分な、固定勾配演算子や単純な注意機構に頼っていることが多い。
本稿では,エッジ拡張とセマンティックモデリングを2つの補完処理経路に分離することで,この課題に対処する新しいDual-Path Edge Networkを提案する。
論文 参考訳(メタデータ) (2025-09-25T03:08:26Z) - Edge-Aware Normalized Attention for Efficient and Detail-Preserving Single Image Super-Resolution [27.3322913419539]
単一高分解能超解像(SISR)は、単一の低分解能観測から構造的に忠実な高周波成分を回収することが曖昧であるため、非常に不明瞭である。
既存のエッジ対応の手法では、エッジ先行または注意枝をますます複雑なバックボーンにアタッチすることが多いが、アドホック融合は冗長性、不安定な最適化、あるいは限られた構造的利得をもたらすことが多い。
このギャップには, エッジ特徴量と中間特徴量から適応変調マップを導出するエッジ誘導型アテンション機構を用いて対処し, それらを正規化および再重み付けに応用し, 微妙なテクスチャを抑えつつ, 構造的に健全な領域を選択的に増幅する。
論文 参考訳(メタデータ) (2025-09-18T02:31:24Z) - TinyDef-DETR: A Transformer-Based Framework for Defect Detection in Transmission Lines from UAV Imagery [12.48571944931548]
TinyDef-DETRは、UAVが取得した画像から伝送路欠陥の正確かつ効率的な検出を実現するためのフレームワークである。
このモデルは、4つの主要なコンポーネントを統合している: エッジ強化されたResNetバックボーンで境界に敏感な表現を強化する、ストライドフリーなスペース・トゥ・ディープス・モジュールで詳細保存可能なダウンサンプリングを可能にする、Focler-Wise-SIoUレグレッション・ロスにより、小さくて難しいオブジェクトのローカライゼーションが向上する。
論文 参考訳(メタデータ) (2025-09-07T12:36:33Z) - Progressive Feature Self-reinforcement for Weakly Supervised Semantic
Segmentation [55.69128107473125]
Weakly Supervised Semantic (WSSS) のイメージレベルラベルを用いたシングルステージアプローチを提案する。
我々は、画像内容が決定論的領域(例えば、自信ある前景と背景)と不確実領域(例えば、オブジェクト境界と誤分類されたカテゴリ)に適応的に分割して、別々の処理を行う。
そこで我々は,これらの自信のある領域と同一のクラスラベルを持つ拡張画像とのセマンティック一貫性を制約する補完的な自己強調手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T13:21:52Z) - Calibrating Undisciplined Over-Smoothing in Transformer for Weakly Supervised Semantic Segmentation [51.14107156747967]
弱教師付きセマンティックセマンティックセマンティクス(WSSS)は、完全な教師付きアプローチよりもアノテーションが少ないため、かなりの注目を集めている。
本研究では,非学際的な過密化に対する深い注意を抑えるための適応的再活性化機構 (AReAM) を提案する。
AReAMは既存のWSSS手法と比較してセグメンテーション性能を大幅に改善し、ノイズを低減し、関連するセマンティック領域に焦点を絞る。
論文 参考訳(メタデータ) (2023-05-04T19:11:33Z) - Boundary Corrected Multi-scale Fusion Network for Real-time Semantic
Segmentation [15.879949436633021]
既存のセマンティックセグメンテーション法は高い精度を達成するために高解像度の入力に依存しており、推論時間の要件を満たしていない。
設計した低分解能多スケール核融合モジュールを用いて意味情報を抽出する境界補正多スケール核融合ネットワークを提案する。
本手法は,リアルタイムセマンティックセグメンテーションの精度と速度の最先端バランスを実現する。
論文 参考訳(メタデータ) (2022-03-01T13:31:01Z) - Learning to Estimate Hidden Motions with Global Motion Aggregation [71.12650817490318]
閉塞は、局所的な証拠に依存する光学フローアルゴリズムに重大な課題をもたらす。
最初の画像でピクセル間の長距離依存性を見つけるために,グローバルモーションアグリゲーションモジュールを導入する。
遮蔽領域における光流量推定が非遮蔽領域における性能を損なうことなく大幅に改善できることを実証した。
論文 参考訳(メタデータ) (2021-04-06T10:32:03Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。