論文の概要: Analytical Interpretation of Latent Codes in InfoGAN with SAR Images
- arxiv url: http://arxiv.org/abs/2205.13294v1
- Date: Thu, 26 May 2022 12:13:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-27 23:56:38.040504
- Title: Analytical Interpretation of Latent Codes in InfoGAN with SAR Images
- Title(参考訳): SAR画像を用いたInfoGANにおける潜時符号の解析的解釈
- Authors: Zhenpeng Feng, Milos Dakovic, Hongbing Ji, Mingzhe Zhu, Ljubisa
Stankovic
- Abstract要約: 遅延符号は非線形な方法でSAR画像の特性に影響を与えることが示される。
特性は潜時符号で計算でき、逆に満足な潜時符号は所望の特性から推定できる。
- 参考スコア(独自算出の注目度): 13.916484647299988
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative Adversarial Networks (GANs) can synthesize abundant
photo-realistic synthetic aperture radar (SAR) images. Some recent GANs (e.g.,
InfoGAN), are even able to edit specific properties of the synthesized images
by introducing latent codes. It is crucial for SAR image synthesis since the
targets in real SAR images are with different properties due to the imaging
mechanism. Despite the success of InfoGAN in manipulating properties, there
still lacks a clear explanation of how these latent codes affect synthesized
properties, thus editing specific properties usually relies on empirical
trials, unreliable and time-consuming. In this paper, we show that latent codes
are disentangled to affect the properties of SAR images in a non-linear manner.
By introducing some property estimators for latent codes, we are able to
provide a completely analytical nonlinear model to decompose the entangled
causality between latent codes and different properties. The qualitative and
quantitative experimental results further reveal that the properties can be
calculated by latent codes, inversely, the satisfying latent codes can be
estimated given desired properties. In this case, properties can be manipulated
by latent codes as we expect.
- Abstract(参考訳): GAN(Generative Adversarial Networks)は、豊富な光リアル合成開口レーダ(SAR)画像を合成することができる。
最近のgan(例えばinfogan)の中には、潜在コードを導入することで合成画像の特定の特性を編集できるものもある。
実際のSAR画像のターゲットは、撮像機構によって異なる性質を持つため、SAR画像合成には重要である。
InfoGANのプロパティ操作の成功にもかかわらず、これらの潜伏コードがどのように合成されたプロパティに影響を及ぼすかについては明確に説明されていない。
本稿では,非線形な方法でSAR画像の特性に影響を与えるために,遅延符号が絡み合っていることを示す。
潜在コードに対する特性推定子を導入することで、潜在コードと異なる特性の間の絡み合った因果関係を分解する完全に解析的な非線形モデルを提供できる。
さらに, 定性的, 定量的な実験結果から, 特性は潜在符号で計算でき, 逆に, 満足できる潜在符号は所望の性質から推定できることがわかった。
この場合、プロパティは期待どおりに潜在コードで操作できる。
関連論文リスト
- AI-based Density Recognition [7.106165417217771]
本稿では、関連画像を用いて物体に物理的特性を割り当てるAIベースの概念を提案する。
ニューラルネットワークを用いて2次元画像から特定のパターンを抽出し、ボリューム、材料、密度などのさらなる情報を抽出する。
論文 参考訳(メタデータ) (2024-07-24T07:45:37Z) - When Synthetic Traces Hide Real Content: Analysis of Stable Diffusion Image Laundering [18.039034362749504]
近年、高度にリアルな合成画像を作成する方法が大幅に進歩している。
SDオートエンコーダを介して画像を渡すことで、画像の合成コピーを高いリアリズムで再現することができ、視覚的アーティファクトはほとんどない。
このプロセスはSD画像ロンダリング(SD image laundering)と呼ばれ、実際の画像を見た目の合成画像に変換することができ、コンテンツ認証のための法医学的分析を複雑にするリスクがある。
論文 参考訳(メタデータ) (2024-07-15T14:01:35Z) - Rethinking the Up-Sampling Operations in CNN-based Generative Network
for Generalizable Deepfake Detection [86.97062579515833]
我々は、アップサンプリング操作から生じる一般化された構造的アーティファクトをキャプチャし、特徴付ける手段として、NPR(Neighboring Pixel Relationships)の概念を紹介した。
tft28の異なる生成モデルによって生成されたサンプルを含む、オープンワールドデータセット上で包括的な分析を行う。
この分析は、新しい最先端のパフォーマンスを確立し、既存の手法よりも優れたtft11.6%の向上を示している。
論文 参考訳(メタデータ) (2023-12-16T14:27:06Z) - Alchemist: Parametric Control of Material Properties with Diffusion
Models [51.63031820280475]
本手法は,フォトリアリズムで知られているテキスト・イメージ・モデルの生成先行に乗じる。
我々は,NeRFの材料化へのモデルの適用の可能性を示す。
論文 参考訳(メタデータ) (2023-12-05T18:58:26Z) - In-Domain GAN Inversion for Faithful Reconstruction and Editability [132.68255553099834]
ドメイン誘導型ドメイン正規化とエンコーダで構成されたドメイン内GANインバージョンを提案し、事前学習されたGANモデルのネイティブ潜在空間における反転コードを正規化する。
エンコーダ構造,開始反転点,および逆パラメータ空間の効果を総合的に解析し,再構成品質と編集特性とのトレードオフを観察する。
論文 参考訳(メタデータ) (2023-09-25T08:42:06Z) - Additive Decoders for Latent Variables Identification and
Cartesian-Product Extrapolation [27.149540844056023]
本稿では,表現学習における潜在変数識別とサポート外画像生成の問題に取り組む。
どちらも、加算と呼ばれるデコーダのクラスで可能であることを示す。
本稿では,新しい方法で観測された変化要因を再結合することにより,加算デコーダが新たな画像を生成することを理論的に示す。
論文 参考訳(メタデータ) (2023-07-05T18:48:20Z) - GH-Feat: Learning Versatile Generative Hierarchical Features from GANs [61.208757845344074]
画像合成から学習した生成機能は、幅広いコンピュータビジョンタスクを解く上で大きな可能性を秘めていることを示す。
まず,事前学習したStyleGANジェネレータを学習損失関数として考慮し,エンコーダを訓練する。
GH-Feat(Generative Hierarchical Features)と呼ばれるエンコーダが生成する視覚的特徴は、階層的なGAN表現と高度に一致している。
論文 参考訳(メタデータ) (2023-01-12T21:59:46Z) - SIAN: Style-Guided Instance-Adaptive Normalization for Multi-Organ
Histopathology Image Synthesis [63.845552349914186]
本研究では,異なる臓器に対して,現実的な色分布とテクスチャを合成するためのスタイル誘導型インスタンス適応正規化(SIAN)を提案する。
4つのフェーズは一緒に動作し、生成ネットワークに統合され、イメージセマンティクス、スタイル、インスタンスレベルのバウンダリを埋め込む。
論文 参考訳(メタデータ) (2022-09-02T16:45:46Z) - Generative Hierarchical Features from Synthesizing Images [65.66756821069124]
画像合成の学習は、広範囲のアプリケーションにまたがって一般化可能な顕著な階層的な視覚的特徴をもたらす可能性があることを示す。
生成的階層的特徴(Generative Hierarchical Feature, GH-Feat)と呼ばれるエンコーダが生成する視覚的特徴は、生成的タスクと識別的タスクの両方に強い伝達性を有する。
論文 参考訳(メタデータ) (2020-07-20T18:04:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。