論文の概要: On Unsupervised Image-to-image translation and GAN stability
- arxiv url: http://arxiv.org/abs/2403.09646v1
- Date: Wed, 18 Oct 2023 04:00:43 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-25 08:06:28.793235
- Title: On Unsupervised Image-to-image translation and GAN stability
- Title(参考訳): 教師なし画像画像変換とGAN安定性について
- Authors: BahaaEddin AlAila, Zahra Jandaghi, Abolfazl Farahani, Mohammad Ziad Al-Saad,
- Abstract要約: 本研究では,基礎研究の失敗事例であるCycleGANについて検討する。
これらの問題を緩和する2つの一般的なモデルを提案する。
- 参考スコア(独自算出の注目度): 0.5523170464803535
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The problem of image-to-image translation is one that is intruiging and challenging at the same time, for the impact potential it can have on a wide variety of other computer vision applications like colorization, inpainting, segmentation and others. Given the high-level of sophistication needed to extract patterns from one domain and successfully applying them to another, especially, in a completely unsupervised (unpaired) manner, this problem has gained much attention as of the last few years. It is one of the first problems where successful applications to deep generative models, and especially Generative Adversarial Networks achieved astounding results that are actually of realworld impact, rather than just a show of theoretical prowess; the such that has been dominating the GAN world. In this work, we study some of the failure cases of a seminal work in the field, CycleGAN [1] and hypothesize that they are GAN-stability related, and propose two general models to try to alleviate these problems. We also reach the same conclusion of the problem being ill-posed that has been also circulating in the literature lately.
- Abstract(参考訳): イメージ・ツー・イメージ翻訳の問題は、カラー化、インペイント、セグメンテーションなど、他の様々なコンピュータビジョンアプリケーションに影響を及ぼす可能性に対して、同時に介入し、挑戦している問題である。
あるドメインからパターンを抽出し、特に完全に教師なし(未対応)な方法で他のドメインに適用するために必要な高度な技術を考えれば、この問題はここ数年で注目されている。
これは、深層生成モデル、特にジェネレーティブ・アドベラル・ネットワークが、理論的な技巧の表れというよりは、実際に現実世界に影響を与えている驚くべき結果を得た最初の問題の一つであり、それがガンの世界を支配してきた。
本研究では,その分野における基礎研究であるCycleGAN [1] の失敗事例について検討し,それらが GAN-stability 関連であると仮定し,これらの問題を緩和するための2つの一般的なモデルを提案する。
また,最近文献に流布されている問題と同じ結論に達している。
関連論文リスト
- A Preliminary Exploration Towards General Image Restoration [48.02907312223344]
本稿では、これらの課題を統一モデル内で解決することを目的とした、一般画像復元(GIR)と呼ばれる新しい問題を提案する。
GIRは個々の画像復元タスク(例えば、画像のデノイング、デブロイング、デライニング、超解像)とそれらの組み合わせを汎用的にカバーしている。
我々は、GIR課題に対処するための既存のアプローチを包括的に評価し、その強みと実用的課題を明らかにする。
論文 参考訳(メタデータ) (2024-08-27T15:31:45Z) - DualAnoDiff: Dual-Interrelated Diffusion Model for Few-Shot Anomaly Image Generation [40.257604426546216]
製造業における異常検査の性能は異常データの不足によって制約される。
既存の異常発生法は、生成した異常の多様性が限られている。
本稿では,新しい拡散型少数ショット画像生成モデルであるDualAnoDiffを提案する。
論文 参考訳(メタデータ) (2024-08-24T08:09:32Z) - Separate-and-Enhance: Compositional Finetuning for Text2Image Diffusion
Models [58.46926334842161]
この研究は、注意力の低いアクティベーションスコアとマスクオーバーラップに関連する問題を指摘し、このような不一致の根本的な理由を照らしている。
本稿では,物体マスクの重なりを低減し,注目度を最大化する2つの新しい目的,分離損失とエンハンス損失を提案する。
提案手法は従来のテスト時間適応手法と異なり,拡張性と一般化性を高める重要なパラメータの微調整に重点を置いている。
論文 参考訳(メタデータ) (2023-12-10T22:07:42Z) - GAN-based Algorithm for Efficient Image Inpainting [0.0]
世界的なパンデミックは、人々がマスクを着用し始める顔認識の新しい次元に課題を提起している。
このような条件下では,画像の塗り絵に機械学習を応用して問題に対処することを検討する。
特に、オートエンコーダは、画像の重要で一般的な特徴を維持する大きな可能性を秘めている。
論文 参考訳(メタデータ) (2023-09-13T20:28:54Z) - Causal Triplet: An Open Challenge for Intervention-centric Causal
Representation Learning [98.78136504619539]
Causal Tripletは、視覚的に複雑なシーンを特徴とする因果表現学習ベンチマークである。
この結果から,不整合表現やオブジェクト中心表現の知識によって構築されたモデルが,分散表現よりもはるかに優れていることを示す。
論文 参考訳(メタデータ) (2023-01-12T17:43:38Z) - Generative Adversarial Networks [43.10140199124212]
GAN(Generative Adversarial Networks)は、高品質なデータを生成するための非常に人気のあるフレームワークである。
この章では、GANの原則を議論し、トレーニングと評価中に固有の問題をいくつか提示することで、GANを紹介します。
論文 参考訳(メタデータ) (2022-03-01T18:37:48Z) - Beyond ImageNet Attack: Towards Crafting Adversarial Examples for
Black-box Domains [80.11169390071869]
敵対的な例は、転送可能な性質のため、ディープニューラルネットワークに深刻な脅威をもたらしている。
ブラックボックス領域への転送可能性を調べるために,Beyond ImageNet Attack (BIA)を提案する。
提案手法は, 最先端手法を最大7.71%(粗粒領域)と25.91%(細粒領域)で平均的に上回っている。
論文 参考訳(メタデータ) (2022-01-27T14:04:27Z) - Unsupervised Image Generation with Infinite Generative Adversarial
Networks [24.41144953504398]
無限条件GANまたはMIC-GANを混合した非教師なし非パラメトリック手法を提案する。
MIC-GANは潜伏空間の構造化やモード崩壊の回避に有効であることを示す。
論文 参考訳(メタデータ) (2021-08-18T05:03:19Z) - Heterogeneous Face Frontalization via Domain Agnostic Learning [74.86585699909459]
本研究では, 視覚領域における正面視を, ポーズのバリエーションで合成できるドメイン非依存学習型生成逆数ネットワーク(DAL-GAN)を提案する。
DAL-GANは、補助分類器を備えたジェネレータと、より優れた合成のために局所的およびグローバルなテクスチャ識別をキャプチャする2つの識別器から構成される。
論文 参考訳(メタデータ) (2021-07-17T20:41:41Z) - Rethinking conditional GAN training: An approach using geometrically
structured latent manifolds [58.07468272236356]
条件付きGAN(cGAN)は、生成された出力の多様性の欠如などの重大な欠点に悩まされる。
本稿では,バニラcGANの多様性と視覚的品質を両立させる新しいトレーニング機構を提案する。
論文 参考訳(メタデータ) (2020-11-25T22:54:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。