論文の概要: Semi-Supervised StyleGAN for Disentanglement Learning
- arxiv url: http://arxiv.org/abs/2003.03461v3
- Date: Wed, 25 Nov 2020 23:06:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 00:52:24.111185
- Title: Semi-Supervised StyleGAN for Disentanglement Learning
- Title(参考訳): 絡み合い学習のための半教師付きスタイルGAN
- Authors: Weili Nie, Tero Karras, Animesh Garg, Shoubhik Debnath, Anjul Patney,
Ankit B. Patel, Anima Anandkumar
- Abstract要約: 現在の解離法は、いくつかの固有の制限に直面している。
半教師付き高分解能ディスタングル学習のためのStyleGANに基づく新しいアーキテクチャと損失関数を設計する。
- 参考スコア(独自算出の注目度): 79.01988132442064
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Disentanglement learning is crucial for obtaining disentangled
representations and controllable generation. Current disentanglement methods
face several inherent limitations: difficulty with high-resolution images,
primarily focusing on learning disentangled representations, and
non-identifiability due to the unsupervised setting. To alleviate these
limitations, we design new architectures and loss functions based on StyleGAN
(Karras et al., 2019), for semi-supervised high-resolution disentanglement
learning. We create two complex high-resolution synthetic datasets for
systematic testing. We investigate the impact of limited supervision and find
that using only 0.25%~2.5% of labeled data is sufficient for good
disentanglement on both synthetic and real datasets. We propose new metrics to
quantify generator controllability, and observe there may exist a crucial
trade-off between disentangled representation learning and controllable
generation. We also consider semantic fine-grained image editing to achieve
better generalization to unseen images.
- Abstract(参考訳): 解離学習は、解離表現と制御可能な生成を得るために不可欠である。
現在の非絡み合わせ法は、主に非教師なし設定による非識別性を学ぶことに焦点を当てた高解像度画像の難しさという、いくつかの固有の制限に直面している。
これらの制約を緩和するため、我々はStyleGAN (Karras et al., 2019) に基づいた新しいアーキテクチャと損失関数を設計する。
システムテストのための2つの複雑な高分解能合成データセットを作成する。
限定的な監視の影響を調査し,0.25%~2.5%のラベル付きデータを使用することで,合成データセットと実データセットの両方に十分な絡み合いがあることがわかった。
本稿では,生成元制御可能性の定量化のための新しい指標を提案し,異種表現学習と制御可能生成との間に重大なトレードオフが存在することを観察する。
また, 意味的細粒画像編集により, 画像の一般化が向上すると考えられる。
関連論文リスト
- InfRS: Incremental Few-Shot Object Detection in Remote Sensing Images [11.916941756499435]
本稿では,リモートセンシング画像におけるインクリメンタルな数ショット物体検出の複雑な課題について検討する。
本稿では,新しい授業の漸進的な学習を促進するために,InfRSと呼ばれる先駆的な微調整技術を導入する。
我々はワッサーシュタイン距離に基づく原型校正戦略を開発し、破滅的な忘れ問題を軽減する。
論文 参考訳(メタデータ) (2024-05-18T13:39:50Z) - Towards Improved Semiconductor Defect Inspection for high-NA EUVL based on SEMI-SuperYOLO-NAS [0.9997798039664684]
本研究の目的は、画像のスケールアップが可能なスケール不変ADCDフレームワークを提案することである。
ベースラインのYOLO-NASアーキテクチャ上に構築されたSEMI-SuperYOLO-NASとして、即興ADCDフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-08T20:51:30Z) - Bilevel Fast Scene Adaptation for Low-Light Image Enhancement [50.639332885989255]
低照度シーンにおける画像の強調は、コンピュータビジョンにおいて難しいが、広く懸念されている課題である。
主な障害は、異なるシーンにまたがる分散の相違によるモデリングの混乱にある。
上述の潜在対応をモデル化するための双レベルパラダイムを導入する。
エンコーダのシーン非関連な一般化を多様なシーンにもたらすために、双方向学習フレームワークを構築した。
論文 参考訳(メタデータ) (2023-06-02T08:16:21Z) - Generative Modeling Helps Weak Supervision (and Vice Versa) [87.62271390571837]
本稿では,弱い監督と生成的敵ネットワークを融合したモデルを提案する。
弱い監督によるラベル推定と並行して、データの離散変数をキャプチャする。
これは、弱い教師付き合成画像と擬似ラベルによるデータ拡張を可能にする最初のアプローチである。
論文 参考訳(メタデータ) (2022-03-22T20:24:21Z) - Railroad is not a Train: Saliency as Pseudo-pixel Supervision for Weakly
Supervised Semantic Segmentation [16.560870740946275]
EPS (Explicit Pseudo-Pixel Supervision) は2つの弱い監督と組み合わせることでピクセルレベルのフィードバックから学習する。
両情報間の補完関係を完全に活用するための共同学習戦略を考案する。
提案手法は, 正確なオブジェクト境界を求め, 共起画素を破棄することにより, 擬似マスクの品質を大幅に向上させることができる。
論文 参考訳(メタデータ) (2021-05-19T07:31:11Z) - Mixed supervision for surface-defect detection: from weakly to fully
supervised learning [5.69361786082969]
本研究では,教師あり学習手法の重い要件を緩和し,高度に詳細なアノテーションの必要性を低減した。
ディープラーニングアーキテクチャを提案することにより、混合監視による弱い(画像レベル)ラベルから表面欠陥検出タスクの完全な(ピクセルレベル)アノテーションまで、さまざまな詳細のアノテーションの使用を検討する。
提案手法は,すべての関連手法を完全監督設定で上回るとともに,画像レベルラベルのみを利用可能な場合の弱監督方式を上回る。
論文 参考訳(メタデータ) (2021-04-13T10:00:10Z) - Data-Uncertainty Guided Multi-Phase Learning for Semi-Supervised Object
Detection [66.10057490293981]
半監視対象検出のためのデータ不確実性誘導多相学習法を提案する。
本手法は,ベースライン手法と比較して異常に動作し,大きなマージンで性能を向上する。
論文 参考訳(メタデータ) (2021-03-29T09:27:23Z) - Towards Unsupervised Deep Image Enhancement with Generative Adversarial
Network [92.01145655155374]
監視されていない画像強調生成ネットワーク(UEGAN)を提案する。
教師なしの方法で所望の特性を持つ画像の集合から、対応する画像と画像のマッピングを学習する。
その結果,提案モデルは画像の美的品質を効果的に向上することがわかった。
論文 参考訳(メタデータ) (2020-12-30T03:22:46Z) - ErGAN: Generative Adversarial Networks for Entity Resolution [8.576633582363202]
学習ベースのエンティティ解決の大きな課題は、トレーニングのラベルコストを削減する方法です。
そこで本研究では,erganと呼ばれる新しい深層学習手法を提案する。
ErGANのラベリングと学習効率を実証的に検証するための広範な実験を実施しました。
論文 参考訳(メタデータ) (2020-12-18T01:33:58Z) - High-Fidelity Synthesis with Disentangled Representation [60.19657080953252]
本稿では,不整合学習と高忠実度合成のためのID-GAN(Information-Distillation Generative Adrial Network)を提案する。
提案手法は, VAEモデルを用いて非交叉表現を学習し, 高忠実度合成のためのGAN生成器に追加のニュアンス変数で学習表現を蒸留する。
単純さにもかかわらず,提案手法は高効率であり,不整合表現を用いた最先端の手法に匹敵する画像生成品質を実現する。
論文 参考訳(メタデータ) (2020-01-13T14:39:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。