論文の概要: A Dual-Branch Local-Global Framework for Cross-Resolution Land Cover Mapping
- arxiv url: http://arxiv.org/abs/2512.19990v1
- Date: Tue, 23 Dec 2025 02:32:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-24 19:17:49.716876
- Title: A Dual-Branch Local-Global Framework for Cross-Resolution Land Cover Mapping
- Title(参考訳): クロスリゾリューション土地被覆マッピングのための2分岐ローカル・グローバル・フレームワーク
- Authors: Peng Gao, Ke Li, Di Wang, Yongshan Zhu, Yiming Zhang, Xuemei Luo, Yifeng Wang,
- Abstract要約: クロスレゾリューション・ランドカバーマッピングは、粗いまたは低解像度の監視から高解像度なセマンティック・予測を生成することを目的としている。
既存の弱教師付きアプローチは、細粒度空間構造を粗いラベルで整列させるのにしばしば苦労する。
本稿では,グローバルな文脈的推論から局所的な意味的洗練を明示的に分離する,二分岐弱教師付きフレームワークDDTMを提案する。
- 参考スコア(独自算出の注目度): 16.429154404656412
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-resolution land cover mapping aims to produce high-resolution semantic predictions from coarse or low-resolution supervision, yet the severe resolution mismatch makes effective learning highly challenging. Existing weakly supervised approaches often struggle to align fine-grained spatial structures with coarse labels, leading to noisy supervision and degraded mapping accuracy. To tackle this problem, we propose DDTM, a dual-branch weakly supervised framework that explicitly decouples local semantic refinement from global contextual reasoning. Specifically, DDTM introduces a diffusion-based branch to progressively refine fine-scale local semantics under coarse supervision, while a transformer-based branch enforces long-range contextual consistency across large spatial extents. In addition, we design a pseudo-label confidence evaluation module to mitigate noise induced by cross-resolution inconsistencies and to selectively exploit reliable supervisory signals. Extensive experiments demonstrate that DDTM establishes a new state-of-the-art on the Chesapeake Bay benchmark, achieving 66.52\% mIoU and substantially outperforming prior weakly supervised methods. The code is available at https://github.com/gpgpgp123/DDTM.
- Abstract(参考訳): クロスレゾリューション・ランドカバーマッピングは、粗い監視や低解像度の監視から高解像度なセマンティック・予測を生成することを目的としているが、高解像度なミスマッチは効果的な学習を非常に困難にしている。
既存の弱い教師付きアプローチは、粗いラベルできめ細かな空間構造を整列するのに苦労することが多く、ノイズの多い監督と分解されたマッピング精度をもたらす。
この問題に対処するために,グローバルな文脈的推論から局所的な意味的洗練を明示的に分離する,二重ブランチ弱教師付きフレームワークDDTMを提案する。
具体的には、DDTMは拡散に基づく分岐を導入し、粗い監督の下で局所的セマンティクスを段階的に洗練し、トランスフォーマーベースの分岐は広い空間範囲にわたって長距離の文脈整合を強制する。
さらに,クロスレゾリューションの不整合によるノイズを低減し,信頼性の高い監視信号を選択的に活用するための疑似ラベル信頼度評価モジュールを設計する。
大規模な実験により、DDTMはチェサピーク湾のベンチマークで新たな最先端技術を確立し、66.52\% mIoUを達成し、以前の弱い監督手法よりもかなり優れていることが示されている。
コードはhttps://github.com/gpgpgp123/DDTMで公開されている。
関連論文リスト
- Terrain-Enhanced Resolution-aware Refinement Attention for Off-Road Segmentation [0.7734726150561086]
低解像度のぼかしエッジのみをヒューズし、局所的なエラーを伝播する設計。
我々は,不完全な監督の下で,グローバルな意味論,局所的な一貫性,境界の忠実さのバランスをとる,分解能を考慮したトークンデコーダを導入する。
論文 参考訳(メタデータ) (2025-11-03T10:36:57Z) - TinyDef-DETR: A Transformer-Based Framework for Defect Detection in Transmission Lines from UAV Imagery [12.48571944931548]
TinyDef-DETRは、UAVが取得した画像から伝送路欠陥の正確かつ効率的な検出を実現するためのフレームワークである。
このモデルは、4つの主要なコンポーネントを統合している: エッジ強化されたResNetバックボーンで境界に敏感な表現を強化する、ストライドフリーなスペース・トゥ・ディープス・モジュールで詳細保存可能なダウンサンプリングを可能にする、Focler-Wise-SIoUレグレッション・ロスにより、小さくて難しいオブジェクトのローカライゼーションが向上する。
論文 参考訳(メタデータ) (2025-09-07T12:36:33Z) - Adaptive Dual Uncertainty Optimization: Boosting Monocular 3D Object Detection under Test-Time Shifts [80.32933059529135]
TTA(Test-Time Adaptation)メソッドが出現し、推論中にターゲット分布に適応する。
我々は、堅牢なM3ODの両不確実性を共同で最小化するために設計された、最初のTTAフレームワークであるDual Uncertainity Optimization (DUO)を提案する。
並列に,明瞭な意味的手がかりを持つ領域における幾何学的コヒーレンスを保存する意味認識型正規場制約を設計する。
論文 参考訳(メタデータ) (2025-08-28T07:09:21Z) - Graph-Based Uncertainty Modeling and Multimodal Fusion for Salient Object Detection [12.743278093269325]
動的不確実性伝播とマルチモーダル協調推論ネットワーク(DUP-MCRNet)を提案する。
DUGCは空間意味距離に基づいて構築されたスパースグラフを通じて層間の不確実性を伝播するように設計されている。
MCFは学習可能なモダリティゲーティングウェイトを使用して、RGB、深さ、エッジの特徴の注意マップを重み付けする。
論文 参考訳(メタデータ) (2025-08-28T04:31:48Z) - VFM-Guided Semi-Supervised Detection Transformer under Source-Free Constraints for Remote Sensing Object Detection [9.029534000674388]
VG-DETRは、Vision Foundation Model(VFM)を「フリーランチ」方法でトレーニングパイプラインに統合する。
擬似ラベルの信頼性を評価するために,VFMのセマンティックな事前情報を利用した擬似ラベルマイニング手法を提案する。
さらに,デュアルレベルのVFM誘導アライメント手法を提案し,インスタンスレベルと画像レベルでのVFM埋め込みと検出器特性を一致させる。
論文 参考訳(メタデータ) (2025-08-15T02:35:56Z) - SARD: Segmentation-Aware Anomaly Synthesis via Region-Constrained Diffusion with Discriminative Mask Guidance [4.65786322515141]
SARD (Segmentation-Aware anomaly synthesis via Region-constrained Diffusion with discriminative mask Guidance) は, 異常生成に特化して設計された新しい拡散型フレームワークである。
SARDは、セグメンテーションの精度と視覚的品質において既存の手法を超越し、ピクセルレベルの異常合成のための新しい最先端技術を確立している。
論文 参考訳(メタデータ) (2025-08-05T06:43:01Z) - Robust Distribution Alignment for Industrial Anomaly Detection under Distribution Shift [51.24522135151649]
異常検出は産業アプリケーションの品質管理において重要な役割を担っている。
既存の方法は、一般化可能なモデルをトレーニングすることで、ドメインシフトに対処しようとする。
提案手法は,最先端の異常検出法や領域適応法と比較して,優れた結果を示す。
論文 参考訳(メタデータ) (2025-03-19T05:25:52Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - DiffusionAD: Norm-guided One-step Denoising Diffusion for Anomaly Detection [80.20339155618612]
DiffusionADは、再構成サブネットワークとセグメンテーションサブネットワークからなる、新しい異常検出パイプラインである。
高速なワンステップデノゲーションパラダイムは、同等の再現品質を維持しながら、数百倍の加速を達成する。
異常の出現の多様性を考慮し、複数のノイズスケールの利点を統合するためのノルム誘導パラダイムを提案する。
論文 参考訳(メタデータ) (2023-03-15T16:14:06Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。