論文の概要: HingeRLC-GAN: Combating Mode Collapse with Hinge Loss and RLC Regularization
- arxiv url: http://arxiv.org/abs/2503.19074v1
- Date: Mon, 24 Mar 2025 19:00:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-26 16:51:31.527562
- Title: HingeRLC-GAN: Combating Mode Collapse with Hinge Loss and RLC Regularization
- Title(参考訳): HingeRLC-GAN: Hinge Loss と RLC 正規化による燃焼モード崩壊
- Authors: Osman Goni, Himadri Saha Arka, Mithun Halder, Mir Moynuddin Ahmed Shibly, Swakkhar Shatabda,
- Abstract要約: RLC正規化とヒンジ損失関数を組み合わせた新しい手法であるHingeRLC-GANを導入する。
FIDスコアは18で、KIDスコアは0.001であり、トレーニング安定性と多様性の増大を効果的にバランスさせることで既存の手法よりも優れている。
- 参考スコア(独自算出の注目度): 1.2058600649065618
- License:
- Abstract: Recent advances in Generative Adversarial Networks (GANs) have demonstrated their capability for producing high-quality images. However, a significant challenge remains mode collapse, which occurs when the generator produces a limited number of data patterns that do not reflect the diversity of the training dataset. This study addresses this issue by proposing a number of architectural changes aimed at increasing the diversity and stability of GAN models. We start by improving the loss function with Wasserstein loss and Gradient Penalty to better capture the full range of data variations. We also investigate various network architectures and conclude that ResNet significantly contributes to increased diversity. Building on these findings, we introduce HingeRLC-GAN, a novel approach that combines RLC Regularization and the Hinge loss function. With a FID Score of 18 and a KID Score of 0.001, our approach outperforms existing methods by effectively balancing training stability and increased diversity.
- Abstract(参考訳): GAN(Generative Adversarial Networks)の最近の進歩は、高品質な画像を作成する能力を示している。
しかし、これはジェネレータがトレーニングデータセットの多様性を反映しない限られた数のデータパターンを生成するときに発生するモード崩壊のままである。
本研究は、GANモデルの多様性と安定性を高めることを目的とした、多くのアーキテクチャ変更を提案することにより、この問題に対処する。
まず、Wassersteinの損失とGradient Penaltyによる損失関数の改善から始めます。
また、様々なネットワークアーキテクチャについても検討し、ResNetが多様性の向上に大きく貢献していると結論づける。
これらの知見に基づいて,RLC正則化とヒンジ損失関数を組み合わせた新しいアプローチであるHingeRLC-GANを導入する。
FIDスコアは18で、KIDスコアは0.001であり、トレーニング安定性と多様性の増大を効果的にバランスさせることで既存の手法よりも優れている。
関連論文リスト
- Chain-of-Retrieval Augmented Generation [72.06205327186069]
本稿では,o1-like RAGモデルを学習し,最終回答を生成する前に段階的に関連情報を抽出・推論する手法を提案する。
提案手法であるCoRAGは,進化状態に基づいて動的にクエリを再構成する。
論文 参考訳(メタデータ) (2025-01-24T09:12:52Z) - MS$^3$D: A RG Flow-Based Regularization for GAN Training with Limited Data [16.574346252357653]
物理における再正規化群(RG)の考え方に基づく新しい正規化法を提案する。
本手法は,限られたデータシナリオ下でのGANの性能と安定性を効果的に向上できることを示す。
論文 参考訳(メタデータ) (2024-08-20T18:37:37Z) - DiveR-CT: Diversity-enhanced Red Teaming Large Language Model Assistants with Relaxing Constraints [68.82294911302579]
DiveR-CTを導入し、目的と意味の報酬に対する従来の制約を緩和し、多様性を高める政策により大きな自由を与える。
実験では,1)様々な攻撃成功率の多様な多様性指標において優れたデータを生成すること,2)収集したデータに基づく安全性チューニングによる青チームモデルのレジリエンスの向上,3)信頼性と制御可能な攻撃成功率に対する目標重みの動的制御,3)報酬過大化に対する感受性の低下など,ベースラインよりも優れたDiveR-CTの顕著な優位性を実証した。
論文 参考訳(メタデータ) (2024-05-29T12:12:09Z) - MCGAN: Enhancing GAN Training with Regression-Based Generator Loss [5.7645234295847345]
高忠実度データを生成する強力なツールとして,GAN(Generative Adversarial Network)が登場している。
既存のアプローチの主なボトルネックは、ジェネレータトレーニングの監督の欠如である。
我々はモンテカルロガン(MCGAN)と呼ばれるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-27T14:15:52Z) - The Risk of Federated Learning to Skew Fine-Tuning Features and
Underperform Out-of-Distribution Robustness [50.52507648690234]
フェデレートされた学習は、微調整された特徴をスキイングし、モデルの堅牢性を損なうリスクがある。
3つのロバスト性指標を導入し、多様なロバストデータセットで実験を行う。
提案手法は,パラメータ効率のよい微調整手法を含む多種多様なシナリオにまたがるロバスト性を著しく向上させる。
論文 参考訳(メタデータ) (2024-01-25T09:18:51Z) - DifAugGAN: A Practical Diffusion-style Data Augmentation for GAN-based
Single Image Super-resolution [88.13972071356422]
本稿では,DifAugGAN として知られる GAN ベースの画像超解像法(SR) のための拡散型データ拡張手法を提案する。
それは、訓練中の判別器の校正を改善するために、生成拡散モデルに拡散過程を適用することを含む。
我々のDifAugGANは、現在のGANベースのSISR手法のプラグ・アンド・プレイ戦略であり、判別器の校正を改善し、SR性能を向上させることができる。
論文 参考訳(メタデータ) (2023-11-30T12:37:53Z) - FakeCLR: Exploring Contrastive Learning for Solving Latent Discontinuity
in Data-Efficient GANs [24.18718734850797]
Data-Efficient GAN(DE-GAN)は、限られたトレーニングデータで生成モデルを学習することを目的としている。
対照的な学習は、DE-GANの合成品質を高める大きな可能性を示している。
偽のサンプルに対してのみ対照的な学習を行うFakeCLRを提案する。
論文 参考訳(メタデータ) (2022-07-18T14:23:38Z) - A Closer Look at Few-shot Image Generation [38.83570296616384]
訓練済みのGANを小さなターゲットデータで転送する場合、ジェネレータはトレーニングサンプルを複製する傾向がある。
この数ショットの画像生成に対処するいくつかの方法が提案されているが、それらを統一されたフレームワークで分析する努力が不足している。
適応中に既存の手法を解析するためのフレームワークを提案する。
第2のコントリビューションは、ソースドメインのリッチなマルチレベル多様性情報をターゲットドメインジェネレータに保持するために、相互情報(MI)を適用することを提案する。
論文 参考訳(メタデータ) (2022-05-08T07:46:26Z) - Complexity Controlled Generative Adversarial Networks [3.1798318618973362]
低複雑性ニューラルネットワーク(LCNN)を用いて,低複雑性のモデルを学習するための代替アーキテクチャを提案する。
LCNN損失関数をGAN、DCGAN(Deep Convolutional GAN)、SNGAN(Spectral Normalized GAN)に組み込む。
様々な大規模なベンチマーク画像データセットにおいて,提案したモデルを用いることで,モード崩壊の問題を回避しつつ,安定したトレーニングを行うことができることを示す。
論文 参考訳(メタデータ) (2020-11-20T05:35:55Z) - When Relation Networks meet GANs: Relation GANs with Triplet Loss [110.7572918636599]
GAN(Generative Adversarial Network)の学習安定性はいまだに悩みの種である
本稿では,判別器のための関係ネットワークアーキテクチャについて検討し,より優れた一般化と安定性を実現する三重項損失を設計する。
ベンチマークデータセットの実験により、提案された関係判別器と新たな損失は、可変視覚タスクに大幅な改善をもたらすことが示された。
論文 参考訳(メタデータ) (2020-02-24T11:35:28Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。