論文の概要: Prototype-Driven Structure Synergy Network for Remote Sensing Images Segmentation
- arxiv url: http://arxiv.org/abs/2508.04022v1
- Date: Wed, 06 Aug 2025 02:29:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-07 20:09:22.505679
- Title: Prototype-Driven Structure Synergy Network for Remote Sensing Images Segmentation
- Title(参考訳): リモートセンシング画像セグメンテーションのためのプロトタイプ駆動構造相似ネットワーク
- Authors: Junyi Wang, Jinjiang Li, Guodong Fan, Yakun Ju, Xiang Fang, Alex C. Kot,
- Abstract要約: 本稿では,PDSSNet(Prototype-Driven Structure Synergy Network)を提案する。
PDSSNetの設計はコア概念に基づいており、完全な基底オブジェクトは不変クラスセマンティクスとその不変空間構造によって共同で定義される。
PDSSNetは最先端の手法よりも優れています。
- 参考スコア(独自算出の注目度): 36.11399269900789
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the semantic segmentation of remote sensing images, acquiring complete ground objects is critical for achieving precise analysis. However, this task is severely hindered by two major challenges: high intra-class variance and high inter-class similarity. Traditional methods often yield incomplete segmentation results due to their inability to effectively unify class representations and distinguish between similar features. Even emerging class-guided approaches are limited by coarse class prototype representations and a neglect of target structural information. Therefore, this paper proposes a Prototype-Driven Structure Synergy Network (PDSSNet). The design of this network is based on a core concept, a complete ground object is jointly defined by its invariant class semantics and its variant spatial structure. To implement this, we have designed three key modules. First, the Adaptive Prototype Extraction Module (APEM) ensures semantic accuracy from the source by encoding the ground truth to extract unbiased class prototypes. Subsequently, the designed Semantic-Structure Coordination Module (SSCM) follows a hierarchical semantics-first, structure-second principle. This involves first establishing a global semantic cognition, then leveraging structural information to constrain and refine the semantic representation, thereby ensuring the integrity of class information. Finally, the Channel Similarity Adjustment Module (CSAM) employs a dynamic step-size adjustment mechanism to focus on discriminative features between classes. Extensive experiments demonstrate that PDSSNet outperforms state-of-the-art methods. The source code is available at https://github.com/wangjunyi-1/PDSSNet.
- Abstract(参考訳): リモートセンシング画像のセマンティックセマンティックセグメンテーションでは、完全な地上オブジェクトの取得が正確な解析を実現するために重要である。
しかし、この課題は、高いクラス内分散と高いクラス間類似性という2つの大きな課題によって著しく妨げられている。
伝統的なメソッドは、クラス表現を効果的に統一し、類似した特徴を区別できないために、不完全なセグメンテーション結果をもたらすことが多い。
新たなクラス誘導アプローチでさえ、粗いクラスプロトタイプ表現とターゲット構造情報の無視によって制限される。
そこで本稿では,PDSSNet(Prototype-Driven Structure Synergy Network)を提案する。
このネットワークの設計はコアの概念に基づいており、完全な基底オブジェクトは不変クラス意味論と不変空間構造によって共同で定義される。
これを実装するために、我々は3つの重要なモジュールを設計した。
まず、アダプティブプロトタイプ抽出モジュール(APEM)は、基底真理を符号化して、未バイアスのクラスプロトタイプを抽出することで、ソースからのセマンティックな精度を保証する。
その後、設計されたSemantic-Structure Coordination Module (SSCM) は階層的セマンティクス第一構造第二原理に従っている。
これはまずグローバルな意味認識を確立し、次に構造情報を活用して意味表現を制約し洗練させ、クラス情報の整合性を確保する。
最後に、Channel similarity Adjustment Module (CSAM)は、クラス間の識別機能にフォーカスするために動的ステップサイズ調整機構を使用している。
PDSSNetは最先端の手法よりも優れています。
ソースコードはhttps://github.com/wangjunyi-1/PDSSNetで公開されている。
関連論文リスト
- Center-guided Classifier for Semantic Segmentation of Remote Sensing Images [2.803715177543843]
CenterSegはリモートセンシング画像のセマンティックセグメンテーションのための新しい分類器である。
複数のプロトタイプ、グラスマン多様体の直接監督、解釈可能性戦略の問題を解決する。
優れたパフォーマンスに加えて、CenterSegにはシンプルさ、軽量さ、互換性、解釈可能性という利点がある。
論文 参考訳(メタデータ) (2025-03-21T09:21:37Z) - Hunting Attributes: Context Prototype-Aware Learning for Weakly
Supervised Semantic Segmentation [22.591512454923883]
我々は、インスタンスとコンテキスト間の知識バイアスが、インスタンスのセマンティクスを十分に理解するプロトタイプの能力に影響を与えると主張している。
プロトタイプ学習理論に触発された本研究では,インスタンスの多種多様かつきめ細かな特徴を捉えるために,プロトタイプ認識を活用することを提案する。
本稿では,コンテキスト型認識学習(CPAL:Context Prototype-Aware Learning)戦略を提案する。
論文 参考訳(メタデータ) (2024-03-12T13:11:58Z) - SEER-ZSL: Semantic Encoder-Enhanced Representations for Generalized Zero-Shot Learning [0.6792605600335813]
Zero-Shot Learning (ZSL)は、トレーニング中に見えないカテゴリを特定するという課題を示す。
ゼロショット学習のためのセマンティック強化表現(SEER-ZSL)を提案する。
まず,確率的エンコーダを用いて意味のある意味情報を抽出し,意味的一貫性とロバスト性を高めることを目的とする。
第2に、学習したデータ分布を逆向きに訓練した発電機で利用することにより、視覚空間を蒸留し、第3に、未確認なカテゴリを真のデータ多様体にマッピングできるようにする。
論文 参考訳(メタデータ) (2023-12-20T15:18:51Z) - Beyond Prototypes: Semantic Anchor Regularization for Better
Representation Learning [82.29761875805369]
表現学習の最終的な目標の1つは、クラス内のコンパクトさとクラス間の十分な分離性を達成することである。
本稿では,機能セントロイドとして機能する事前定義されたクラスアンカーを用いて,特徴学習を一方向ガイドする新しい視点を提案する。
提案したSemantic Anchor Regularization (SAR) は,既存モデルのプラグアンドプレイ方式で使用することができる。
論文 参考訳(メタデータ) (2023-12-19T05:52:38Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z) - Semantic Feature Integration network for Fine-grained Visual
Classification [5.182627302449368]
本稿では,これらの課題に対処するためにセマンティック・フィーチャー・インテグレーション・ネットワーク(SFI-Net)を提案する。
不要な特徴を排除し、識別的特徴間の意味関係を再構築することにより、SFI-Netは満足な性能を実現した。
論文 参考訳(メタデータ) (2023-02-13T07:32:25Z) - Beyond the Prototype: Divide-and-conquer Proxies for Few-shot
Segmentation [63.910211095033596]
少ないショットのセグメンテーションは、少数の濃密なラベル付けされたサンプルのみを与えられた、目に見えないクラスオブジェクトをセグメンテーションすることを目的としている。
分割・分散の精神において, 単純かつ多目的な枠組みを提案する。
提案手法は、DCP(disvision-and-conquer proxies)と呼ばれるもので、適切な信頼性のある情報の開発を可能にする。
論文 参考訳(メタデータ) (2022-04-21T06:21:14Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Dual Prototypical Contrastive Learning for Few-shot Semantic
Segmentation [55.339405417090084]
本稿では,FSSタスクに適合する2つの特徴的コントラスト学習手法を提案する。
第一の考え方は、プロトタイプの特徴空間におけるクラス内距離を減少させながら、クラス間距離を増やすことで、プロトタイプをより差別的にすることである。
提案手法は,PASCAL-5iおよびCOCO-20iデータセット上で,最先端のFSS手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-09T08:14:50Z) - SSA: Semantic Structure Aware Inference for Weakly Pixel-Wise Dense
Predictions without Cost [36.27226683586425]
The semantic structure aware inference (SSA) was proposed to explore the semantic structure information hidden in different stage of the CNN-based network to generate high-quality CAM in the model inference。
提案手法はパラメータを含まない利点があり,訓練は不要である。したがって,弱教師付き画素ワイド予測タスクにも適用可能である。
論文 参考訳(メタデータ) (2021-11-05T11:07:21Z) - Aligning Pretraining for Detection via Object-Level Contrastive Learning [57.845286545603415]
画像レベルのコントラスト表現学習は、伝達学習の汎用モデルとして非常に有効であることが証明されている。
我々は、これは準最適である可能性があり、従って、自己教師付きプレテキストタスクと下流タスクのアライメントを促進する設計原則を提唱する。
Selective Object Contrastive Learning (SoCo) と呼ばれる本手法は,COCO検出における伝達性能の最先端化を実現する。
論文 参考訳(メタデータ) (2021-06-04T17:59:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。