論文の概要: CP2M: Clustered-Patch-Mixed Mosaic Augmentation for Aerial Image Segmentation
- arxiv url: http://arxiv.org/abs/2501.15389v1
- Date: Sun, 26 Jan 2025 04:03:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-28 13:56:35.252152
- Title: CP2M: Clustered-Patch-Mixed Mosaic Augmentation for Aerial Image Segmentation
- Title(参考訳): CP2M: 空中画像分割のためのクラスタ・パッチ・ミキシングモザイク拡張
- Authors: Yijie Li, Hewei Wang, Jinfeng Xu, Zixiao Ma, Puzhen Wu, Shaofan Wang, Soumyabrata Dev,
- Abstract要約: 本稿では,新たな拡張戦略であるClustered-Patch-Mixed Mosaic(CP2M)を提案する。
CP2Mは、Mosaic拡張フェーズとクラスタ化されたパッチミックスフェーズを統合する。
ISPRS Potsdamデータセットの実験では、CP2Mはオーバーフィッティングを著しく軽減している。
- 参考スコア(独自算出の注目度): 9.625982455419306
- License:
- Abstract: Remote sensing image segmentation is pivotal for earth observation, underpinning applications such as environmental monitoring and urban planning. Due to the limited annotation data available in remote sensing images, numerous studies have focused on data augmentation as a means to alleviate overfitting in deep learning networks. However, some existing data augmentation strategies rely on simple transformations that may not sufficiently enhance data diversity or model generalization capabilities. This paper proposes a novel augmentation strategy, Clustered-Patch-Mixed Mosaic (CP2M), designed to address these limitations. CP2M integrates a Mosaic augmentation phase with a clustered patch mix phase. The former stage constructs a new sample from four random samples, while the latter phase uses the connected component labeling algorithm to ensure the augmented data maintains spatial coherence and avoids introducing irrelevant semantics when pasting random patches. Our experiments on the ISPRS Potsdam dataset demonstrate that CP2M substantially mitigates overfitting, setting new benchmarks for segmentation accuracy and model robustness in remote sensing tasks.
- Abstract(参考訳): リモートセンシング画像セグメンテーションは、環境モニタリングや都市計画など、地球観測の基盤となる。
リモートセンシング画像のアノテーションデータに制限があるため、深層学習ネットワークにおける過度な適合を軽減する手段として、データ拡張に多くの研究が注がれている。
しかし、既存のデータ拡張戦略のいくつかは、データの多様性やモデルの一般化能力を十分に強化しない単純な変換に依存している。
本稿では,これらの制約に対処する新しい拡張戦略であるClustered-Patch-Mixed Mosaic (CP2M)を提案する。
CP2Mは、Mosaic拡張フェーズとクラスタ化されたパッチミックスフェーズを統合する。
前段階は4つのランダムサンプルから新しいサンプルを構築するが、後者段階は接続されたコンポーネントラベリングアルゴリズムを用いて、拡張データが空間的コヒーレンスを維持することを保証するとともに、ランダムパッチをペーストする際に無関係な意味論を導入することを避ける。
ISPRS Potsdam データセットを用いた実験により,CP2M は重み付けを著しく軽減し,セグメンテーション精度とリモートセンシングタスクのロバスト性に関する新しいベンチマークを設定できることを示した。
関連論文リスト
- PolSAM: Polarimetric Scattering Mechanism Informed Segment Anything Model [76.95536611263356]
PolSARデータは、そのリッチで複雑な特徴のために、ユニークな課題を提示する。
複素数値データ、偏光特性、振幅画像などの既存のデータ表現が広く使われている。
PolSARのほとんどの機能抽出ネットワークは小さく、機能を効果的にキャプチャする能力を制限している。
本稿では,ドメイン固有の散乱特性と新規なプロンプト生成戦略を統合したSegment Anything Model (SAM) であるPolarimetric Scattering Mechanism-Informed SAM (PolSAM)を提案する。
論文 参考訳(メタデータ) (2024-12-17T09:59:53Z) - Direct Cardiac Segmentation from Undersampled K-space Using Transformers [10.079819435628579]
変換器(DiSK)を用いたスパースk空間サンプルから分割を導出する新しい手法を提案する。
我々のモデルは、示されるすべてのサンプリングレートに対して、Dice と Hausdorff の距離の基底線を常に上回る。
論文 参考訳(メタデータ) (2024-05-31T20:54:12Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Mutual Information-driven Triple Interaction Network for Efficient Image
Dehazing [54.168567276280505]
画像デハージングのための相互情報駆動型トリプルインタラクションネットワーク(MITNet)を提案する。
振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。
第2段階は位相誘導構造が洗練され、位相スペクトルの変換と微細化を学ぶことに尽力した。
論文 参考訳(メタデータ) (2023-08-14T08:23:58Z) - MixReorg: Cross-Modal Mixed Patch Reorganization is a Good Mask Learner
for Open-World Semantic Segmentation [110.09800389100599]
セマンティックセグメンテーションのための新鮮で簡単な事前学習パラダイムであるMixReorgを提案する。
我々のアプローチは、パッチとテキストの対応を保ちながら、画像パッチを混合することで、きめ細かいパッチテキストペアデータを生成することである。
マスク学習者としてMixReorgを使用することで、従来のテキスト教師付きセマンティックセマンティックセマンティックモデルは、非常に一般化可能なピクセル・セマンティックアライメントを実現することができる。
論文 参考訳(メタデータ) (2023-08-09T09:35:16Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - Unseen Object Instance Segmentation with Fully Test-time RGB-D
Embeddings Adaptation [14.258456366985444]
最近では、大規模な合成データのRGB-D機能を活用し、実世界のシナリオにモデルを適用するのが一般的である。
本稿では,Sim2Realドメイン間の適応プロセスを再強調する。
本稿では,BatchNorm層のパラメータに基づいて,完全テスト時間RGB-D埋め込み適応(FTEA)を行うフレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-21T02:35:20Z) - Double Similarity Distillation for Semantic Image Segmentation [18.397968199629215]
本稿では,既存のコンパクトネットワークの分類精度を向上させるために,DSD(Double similarity distillation)と呼ばれる知識蒸留フレームワークを提案する。
具体的には,より詳細な空間依存性を捉えるために,残像マップを用いたPSD(Pixel-wise similarity distillation)モジュールを提案する。
セグメンテーションタスクとコンピュータビジョンタスクの特徴の違いを考慮し,カテゴリワイド類似度蒸留(CSD)モジュールを提案する。
論文 参考訳(メタデータ) (2021-07-19T02:45:13Z) - Robust Unsupervised Small Area Change Detection from SAR Imagery Using
Deep Learning [23.203687716051697]
合成開口レーダ(SAR)画像から小さな領域変化検出のための頑健な教師なし手法を提案する。
差分画像(DI)を生成するマルチスケールスーパーピクセル再構成法を開発した。
二段階中心拘束型ファジィc平均クラスタリングアルゴリズムを提案し、DIの画素を変化・変化・中間クラスに分割する。
論文 参考訳(メタデータ) (2020-11-22T12:50:08Z) - Improving Scalability of Contrast Pattern Mining for Network Traffic
Using Closed Patterns [27.321487770162495]
コントラストパターンマイニング(CPM)は、ターゲットデータセットと比較して背景データセットからサポートが大幅に増加するパターンを発見することを目的としている。
本稿では,2つのデータセット間の有意な変化を発見するために,最も具体的なCPの集合を抽出することに焦点を当てる。
提案アルゴリズムは,ネットワークトラフィックデータに対する既存のCPMのアプローチよりも100倍高速である。
論文 参考訳(メタデータ) (2020-11-16T08:52:47Z) - Deep Semantic Matching with Foreground Detection and Cycle-Consistency [103.22976097225457]
深層ネットワークに基づく弱い教師付きセマンティックマッチングに対処する。
本研究では,背景乱れの影響を抑えるために,前景領域を明示的に推定する。
複数の画像にまたがって予測変換を強制し、幾何的に可視かつ一貫したサイクル一貫性の損失を発生させる。
論文 参考訳(メタデータ) (2020-03-31T22:38:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。