論文の概要: xAI-CycleGAN, a Cycle-Consistent Generative Assistive Network
- arxiv url: http://arxiv.org/abs/2306.15760v1
- Date: Tue, 27 Jun 2023 19:26:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-29 16:54:48.050441
- Title: xAI-CycleGAN, a Cycle-Consistent Generative Assistive Network
- Title(参考訳): xAI-CycleGAN - サイクル持続型生成支援ネットワーク
- Authors: Tibor Sloboda, Luk\'a\v{s} Hudec, Wanda Bene\v{s}ov\'a
- Abstract要約: CycleGANは画像から画像への変換に適したアーキテクチャとなっている。
本研究では,判別器による説明可能性を用いて生成モデルの収束速度を高速化する。
この新しいアーキテクチャは、ベースラインのCycleGANアーキテクチャよりもはるかに高い収束率を持つ。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the domain of unsupervised image-to-image transformation using generative
transformative models, CycleGAN has become the architecture of choice. One of
the primary downsides of this architecture is its relatively slow rate of
convergence. In this work, we use discriminator-driven explainability to speed
up the convergence rate of the generative model by using saliency maps from the
discriminator that mask the gradients of the generator during backpropagation,
based on the work of Nagisetty et al., and also introducing the saliency map on
input, added onto a Gaussian noise mask, by using an interpretable latent
variable based on Wang M.'s Mask CycleGAN. This allows for an explainability
fusion in both directions, and utilizing the noise-added saliency map on input
as evidence-based counterfactual filtering. This new architecture has much
higher rate of convergence than a baseline CycleGAN architecture while
preserving the image quality.
- Abstract(参考訳): 生成的変換モデルを用いた教師なし画像変換の領域では、CycleGANが選択のアーキテクチャとなっている。
このアーキテクチャの主な欠点の1つは、収束速度が比較的遅いことである。
そこで本研究では,Nagisettyらの業績に基づき,逆プロパゲーション中の発電機の勾配を隠蔽する判別器からの塩分マップと,Wang M.のMask CycleGANに基づく解釈可能な潜時変数を用いて,ガウスノイズマスクに付加された入力に対する塩分マップを導入することにより,生成モデルの収束率の向上を図る。
これにより、両方向に説明可能性の融合が可能となり、入力にノイズ付加塩分マップを証拠に基づく反事実フィルタリングとして利用することができる。
この新しいアーキテクチャは、画像の品質を維持しながら、ベースラインのCycleGANアーキテクチャよりも収束率が高い。
関連論文リスト
- Reconstructing Richtmyer-Meshkov instabilities from noisy radiographs using low dimensional features and attention-based neural networks [3.6270672925388263]
トレーニングされた注意に基づくトランスフォーマーネットワークは、Richtmyer-Meshkoff不安定性によって与えられる複雑なトポロジーを確実に回復することができる。
このアプローチは、ICFのような二重貝殻流体力学シミュレーションで実証される。
論文 参考訳(メタデータ) (2024-08-02T03:02:39Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - In-Domain GAN Inversion for Faithful Reconstruction and Editability [132.68255553099834]
ドメイン誘導型ドメイン正規化とエンコーダで構成されたドメイン内GANインバージョンを提案し、事前学習されたGANモデルのネイティブ潜在空間における反転コードを正規化する。
エンコーダ構造,開始反転点,および逆パラメータ空間の効果を総合的に解析し,再構成品質と編集特性とのトレードオフを観察する。
論文 参考訳(メタデータ) (2023-09-25T08:42:06Z) - WavePaint: Resource-efficient Token-mixer for Self-supervised Inpainting [2.3014300466616078]
本稿では、計算効率の良いWaveMixベースの完全畳み込みアーキテクチャであるWavePaintを用いて、視覚変換器から分岐する。
2次元離散ウェーブレット変換(DWT)を用いて、畳み込み層とともに、空間的および多重解像度のトークン混合を行う。
我々のモデルは、CelebA-HQデータセットの現在のGANアーキテクチャよりも優れている。
論文 参考訳(メタデータ) (2023-07-01T18:41:34Z) - Riesz-Quincunx-UNet Variational Auto-Encoder for Satellite Image
Denoising [0.0]
衛星画像のノイズ低減に使用される画像および時系列分解のためのハイブリッドRQUNet-VAE方式を提案する。
また,本手法をマルチバンド衛星画像に適用し,画像の分解,画像分割,拡散による時系列分解,画像分割などを行う。
論文 参考訳(メタデータ) (2022-08-25T19:51:07Z) - TFill: Image Completion via a Transformer-Based Architecture [69.62228639870114]
画像補完を無方向性シーケンス対シーケンス予測タスクとして扱うことを提案する。
トークン表現には,小かつ重複しないRFを持つ制限型CNNを用いる。
第2フェーズでは、可視領域と発生領域の外観整合性を向上させるために、新しい注意認識層(aal)を導入する。
論文 参考訳(メタデータ) (2021-04-02T01:42:01Z) - Generating Attribution Maps with Disentangled Masked Backpropagation [22.065454879517326]
モデル関数を異なる線形写像に分解するために、DMBP(Disentangled Masked Backpropagation)を導入する。
DMBPは従来の手法よりも視覚的に解釈可能な属性マップを生成する。
提案手法により生成された地図は,最終的なネットワーク出力に対する各画素の真の寄与とより一致していることを示す。
論文 参考訳(メタデータ) (2021-01-17T20:32:14Z) - Image-to-image Mapping with Many Domains by Sparse Attribute Transfer [71.28847881318013]
教師なし画像と画像の変換は、2つの領域間の一対のマッピングを、ポイント間の既知のペアワイズ対応なしで学習することで構成される。
現在の慣例は、サイクル一貫性のあるGANでこのタスクにアプローチすることです。
そこで本研究では,ジェネレータを直接,潜在層における単純なスパース変換に制限する代替手法を提案する。
論文 参考訳(メタデータ) (2020-06-23T19:52:23Z) - Kullback-Leibler Divergence-Based Fuzzy $C$-Means Clustering
Incorporating Morphological Reconstruction and Wavelet Frames for Image
Segmentation [152.609322951917]
そこで我々は,厳密なウェーブレットフレーム変換と形態的再構成操作を組み込むことで,Kulback-Leibler (KL) 発散に基づくFuzzy C-Means (FCM) アルゴリズムを考案した。
提案アルゴリズムはよく機能し、他の比較アルゴリズムよりもセグメンテーション性能が優れている。
論文 参考訳(メタデータ) (2020-02-21T05:19:10Z) - Residual-Sparse Fuzzy $C$-Means Clustering Incorporating Morphological
Reconstruction and Wavelet frames [146.63177174491082]
Fuzzy $C$-Means (FCM)アルゴリズムは、形態的再構成操作とタイトウェーブレットフレーム変換を組み込んでいる。
特徴集合とその理想値の間の残差に対して$ell_0$正規化項を付与することにより、改良されたFCMアルゴリズムを提案する。
合成, 医用, カラー画像に対する実験結果から, 提案アルゴリズムは効率的かつ効率的であり, 他のアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2020-02-14T10:00:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。