論文の概要: Multi-task SAR Image Processing via GAN-based Unsupervised Manipulation
- arxiv url: http://arxiv.org/abs/2408.01553v1
- Date: Fri, 2 Aug 2024 19:49:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-06 19:40:03.129991
- Title: Multi-task SAR Image Processing via GAN-based Unsupervised Manipulation
- Title(参考訳): GANに基づく教師なしマニピュレーションによるマルチタスクSAR画像処理
- Authors: Xuran Hu, Mingzhe Zhu, Ziqiang Xu, Zhenpeng Feng, Ljubisa Stankovic,
- Abstract要約: GAN(Generative Adversarial Networks)は、多数の現実的なSAR画像の合成において、大きな可能性を秘めている。
本稿では、GANベースのUnsupervised Editing (GUE)と呼ばれる新しいSAR画像処理フレームワークを提案する。
- 参考スコア(独自算出の注目度): 6.154796320245652
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative Adversarial Networks (GANs) have shown tremendous potential in synthesizing a large number of realistic SAR images by learning patterns in the data distribution. Some GANs can achieve image editing by introducing latent codes, demonstrating significant promise in SAR image processing. Compared to traditional SAR image processing methods, editing based on GAN latent space control is entirely unsupervised, allowing image processing to be conducted without any labeled data. Additionally, the information extracted from the data is more interpretable. This paper proposes a novel SAR image processing framework called GAN-based Unsupervised Editing (GUE), aiming to address the following two issues: (1) disentangling semantic directions in the GAN latent space and finding meaningful directions; (2) establishing a comprehensive SAR image processing framework while achieving multiple image processing functions. In the implementation of GUE, we decompose the entangled semantic directions in the GAN latent space by training a carefully designed network. Moreover, we can accomplish multiple SAR image processing tasks (including despeckling, localization, auxiliary identification, and rotation editing) in a single training process without any form of supervision. Extensive experiments validate the effectiveness of the proposed method.
- Abstract(参考訳): GAN(Generative Adversarial Networks)は、データ分布の学習パターンにより、多数の現実的なSAR画像を合成する大きな可能性を示している。
一部のGANは遅延コードを導入して画像編集を実現し、SAR画像処理において大きな可能性を証明している。
従来のSAR画像処理法と比較して、GAN遅延空間制御に基づく編集は完全に教師なしであり、ラベル付きデータなしで画像処理を行うことができる。
さらに、データから抽出された情報はより解釈可能である。
本稿では,GANをベースとしたUnsupervised Editing (GUE) と呼ばれる新しいSAR画像処理フレームワークを提案し,(1)GANラテント空間における意味的方向の分離と意味的方向の発見,(2)複数の画像処理機能を実現しつつ総合的なSAR画像処理フレームワークの構築,という2つの課題に対処する。
GUEの実装において、慎重に設計されたネットワークをトレーニングすることで、GANラテント空間における絡み合った意味方向を分解する。
さらに,複数のSAR画像処理タスク(非特定,ローカライゼーション,補助識別,回転編集など)を1つのトレーニングプロセスで行うことができる。
大規模実験により提案手法の有効性が検証された。
関連論文リスト
- Seg-CycleGAN : SAR-to-optical image translation guided by a downstream task [12.1644771398574]
本文は,GANに基づくSAR-to-optical image translation法であるSeeg-CycleGANを提案する。
本手法は,船の標的セマンティックセグメンテーションの下流タスクを利用して,画像翻訳ネットワークのトレーニングを指導する。
SAR-to-optical Translationタスクにおける基礎モデルアノテーション付きデータセットの可能性を明らかにする。
論文 参考訳(メタデータ) (2024-08-11T14:01:21Z) - Trustworthy Image Semantic Communication with GenAI: Explainablity, Controllability, and Efficiency [59.15544887307901]
画像意味コミュニケーション(ISC)は,高効率な映像コンテンツ伝送を実現する可能性に注目されている。
既存のISCシステムは、解釈可能性、操作性、互換性の課題に直面している。
我々は、複数の下流推論タスクにGenerative Artificial Intelligence(GenAI)を利用する新しい信頼できるISCフレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-07T14:32:36Z) - Exploring Text-Guided Single Image Editing for Remote Sensing Images [30.23541304590692]
本稿では,テキスト誘導型RSI編集手法を提案する。
大規模なベンチマークデータセットのトレーニングを必要とせずに、一貫性を維持するために、マルチスケールのトレーニングアプローチを採用している。
論文 参考訳(メタデータ) (2024-05-09T13:45:04Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Layered Rendering Diffusion Model for Zero-Shot Guided Image Synthesis [60.260724486834164]
本稿では,テキストクエリに依存する拡散モデルにおける空間制御性向上のための革新的な手法を提案する。
視覚誘導(Vision Guidance)とレイヤーレンダリング拡散(Layered Rendering Diffusion)フレームワーク(Layered Diffusion)という2つの重要なイノベーションを提示します。
本稿では,ボックス・ツー・イメージ,セマンティック・マスク・ツー・イメージ,画像編集の3つの実践的応用に適用する。
論文 参考訳(メタデータ) (2023-11-30T10:36:19Z) - A Dual-fusion Semantic Segmentation Framework With GAN For SAR Images [10.147351262526282]
合成開口レーダ(SAR)画像セグメンテーションを実現するために,広く使用されているエンコーダデコーダアーキテクチャに基づくネットワークを提案する。
光画像のより優れた表現能力により、多数のSARおよび光画像によって訓練された生成反転ネットワーク(GAN)を介して生成された光画像とSAR画像を統合することを提案する。
論文 参考訳(メタデータ) (2022-06-02T15:22:29Z) - Transformer-based SAR Image Despeckling [53.99620005035804]
本稿では,SAR画像復号化のためのトランスフォーマーネットワークを提案する。
提案する非特定ネットワークは、トランスフォーマーベースのエンコーダにより、異なる画像領域間のグローバルな依存関係を学習することができる。
実験により,提案手法は従来型および畳み込み型ニューラルネットワークに基づく解法よりも大幅に改善されていることが示された。
論文 参考訳(メタデータ) (2022-01-23T20:09:01Z) - DSRGAN: Detail Prior-Assisted Perceptual Single Image Super-Resolution
via Generative Adversarial Networks [24.197669641270892]
GAN(Generative Adversarial Network)は、知覚単一画像超解像(SISR)の研究に成功している。
我々は、この問題を緩和し、より現実的な詳細を回復する上で、GANを支援するための新しい事前知識、詳細を提案する。
実験の結果,DSRGANは知覚的指標において最先端のSISR法より優れており,同時に忠実度指標の点で同等の結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-12-25T06:23:52Z) - Learning by Planning: Language-Guided Global Image Editing [53.72807421111136]
あいまいな編集言語要求を一連の編集操作にマッピングするテキスト・ツー・オペレーティング・モデルを開発した。
タスクの唯一の監督はターゲットイメージであり、シーケンシャルな決定の安定したトレーニングには不十分である。
本研究では,対象画像から可能な編集シーケンスを疑似基底真理として生成する,新たな操作計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-24T16:30:03Z) - PeaceGAN: A GAN-based Multi-Task Learning Method for SAR Target Image
Generation with a Pose Estimator and an Auxiliary Classifier [50.17500790309477]
SARターゲット画像生成のための新しいGANベースのマルチタスク学習(MTL)手法であるPeaceGANを提案する。
PeaceGANはポーズ角とターゲットクラス情報の両方を使用し、目的のポーズ角で所望のターゲットクラスのSARターゲット画像を作成することができる。
論文 参考訳(メタデータ) (2021-03-29T10:03:09Z) - RDAnet: A Deep Learning Based Approach for Synthetic Aperture Radar
Image Formation [0.0]
我々は、画像形成と画像処理の両方を行うディープニューラルネットワークを訓練し、SAR処理パイプラインを統合する。
その結果,従来のアルゴリズムと同等の画質のSAR画像を精度良く出力できることが示唆された。
論文 参考訳(メタデータ) (2020-01-22T18:44:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。