論文の概要: Exploring Incompatible Knowledge Transfer in Few-shot Image Generation
- arxiv url: http://arxiv.org/abs/2304.07574v1
- Date: Sat, 15 Apr 2023 14:57:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-18 18:26:24.729375
- Title: Exploring Incompatible Knowledge Transfer in Few-shot Image Generation
- Title(参考訳): 画像生成における非互換な知識伝達の探索
- Authors: Yunqing Zhao, Chao Du, Milad Abdollahzadeh, Tianyu Pang, Min Lin,
Shuicheng Yan, Ngai-Man Cheung
- Abstract要約: 少ないショット画像生成は、いくつかの参照サンプルを使用して、ターゲットドメインから多彩で高忠実な画像を生成することを学習する。
既存のF SIGメソッドは、ソースジェネレータから事前の知識を選択し、保存し、転送し、ターゲットジェネレータを学習する。
本稿では,知識保存を補完する操作であり,軽量プルーニング方式で実装した知識トランケーションを提案する。
- 参考スコア(独自算出の注目度): 107.81232567861117
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot image generation (FSIG) learns to generate diverse and high-fidelity
images from a target domain using a few (e.g., 10) reference samples. Existing
FSIG methods select, preserve and transfer prior knowledge from a source
generator (pretrained on a related domain) to learn the target generator. In
this work, we investigate an underexplored issue in FSIG, dubbed as
incompatible knowledge transfer, which would significantly degrade the
realisticness of synthetic samples. Empirical observations show that the issue
stems from the least significant filters from the source generator. To this
end, we propose knowledge truncation to mitigate this issue in FSIG, which is a
complementary operation to knowledge preservation and is implemented by a
lightweight pruning-based method. Extensive experiments show that knowledge
truncation is simple and effective, consistently achieving state-of-the-art
performance, including challenging setups where the source and target domains
are more distant. Project Page: yunqing-me.github.io/RICK.
- Abstract(参考訳): Few-shot Image Generation (FSIG)は、いくつかの参照サンプル(例:10)を使用して、ターゲットドメインから多彩で高忠実な画像を生成することを学習する。
既存のFSIGメソッドは、ソースジェネレータから事前の知識を選択し、保存し、転送し、ターゲットジェネレータを学習する。
本研究では, FSIGにおける非互換な知識伝達問題について検討し, 合成標本の現実性を著しく低下させる可能性について検討した。
実験的な観察により、問題はソースジェネレータからの最も重要なフィルタに由来することが示されている。
そこで我々は,知識保存を補完する操作であり,軽量プルーニング方式で実装されたFSIGにおいて,この問題を軽減するための知識トランケーションを提案する。
大規模な実験により、知識の切り離しはシンプルで効果的であり、常に最先端のパフォーマンスを達成することを示し、ソースとターゲットドメインがより遠くにある挑戦的なセットアップを含む。
プロジェクトページ: Yunqing-me.github.io/RICK
関連論文リスト
- Contrasting Deepfakes Diffusion via Contrastive Learning and Global-Local Similarities [88.398085358514]
Contrastive Deepfake Embeddings (CoDE)は、ディープフェイク検出に特化した新しい埋め込み空間である。
CoDEは、グローバルローカルな類似性をさらに強化することで、対照的な学習を通じて訓練される。
論文 参考訳(メタデータ) (2024-07-29T18:00:10Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Generator Born from Classifier [66.56001246096002]
データサンプルに頼ることなく、イメージジェネレータを再構築することを目指している。
本稿では,ネットワークパラメータの収束条件を満たすために,ジェネレータを訓練する新しい学習パラダイムを提案する。
論文 参考訳(メタデータ) (2023-12-05T03:41:17Z) - Confidence-based Visual Dispersal for Few-shot Unsupervised Domain
Adaptation [39.112032738643656]
教師なしのドメイン適応は、完全にラベル付けされたソースドメインからラベル付けされていないターゲットドメインに知識を転送することを目的としています。
FUDAのための信頼度に基づく視覚分散変換学習法(C-VisDiT)を提案する。
我々はOffice-31、Office-Home、VisDA-C、DomainNetのベンチマークデータセットを広範囲に実験し、提案したC-VisDiTが最先端のFUDA手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2023-09-27T11:16:51Z) - Adaptive Semantic Consistency for Cross-domain Few-shot Classification [27.176106714652327]
クロスドメイン・ショット分類(CD-FSC)は、いくつかのサンプルを用いて新規なターゲットクラスを特定することを目的としている。
本稿では,ドメイン間の堅牢性を向上する,シンプルなプラグアンドプレイ適応セマンティック一貫性フレームワークを提案する。
提案したASCは、ソースドメインの知識を明示的に伝達することで、モデルがターゲットドメインに過度に適合しないようにする。
論文 参考訳(メタデータ) (2023-08-01T15:37:19Z) - AdAM: Few-Shot Image Generation via Adaptation-Aware Kernel Modulation [71.58154388819887]
F SIG(Few-shot Image Generation)は、少数のトレーニングサンプル(例:10)が与えられた新しい多様な画像を生成することを目的としている。
最近の研究は、大規模ソースドメインで事前訓練されたGANを活用し、ターゲットドメインに適応することで、F SIGに対処している。
本稿では、異なるソース・ターゲット領域近傍の一般F SIGに対してAdaptation-Aware kernel Modulation (AdAM)を提案する。
論文 参考訳(メタデータ) (2023-07-04T03:56:43Z) - SF-FSDA: Source-Free Few-Shot Domain Adaptive Object Detection with
Efficient Labeled Data Factory [94.11898696478683]
ドメイン適応オブジェクト検出は、ラベル付きソースドメインから学んだ知識を活用し、ラベルなしのターゲットドメインのパフォーマンスを改善することを目的としています。
本研究では,SF-FSDA という名称のソースフリーおよび少数ショット条件下で,より実用的で困難な領域適応型オブジェクト検出問題を提案し,検討する。
論文 参考訳(メタデータ) (2023-06-07T12:34:55Z) - D3T-GAN: Data-Dependent Domain Transfer GANs for Few-shot Image
Generation [17.20913584422917]
少数のサンプルを与えられたGANモデルをトレーニングすることで、現実的な画像を生成することを目的としている。
数ショット生成の典型的な解決策は、よく訓練されたGANモデルをデータ豊富なソースドメインからデータ不足のターゲットドメインに転送することである。
本稿では,D3T-GANと呼ばれる自己監督型転送方式を提案する。
論文 参考訳(メタデータ) (2022-05-12T11:32:39Z) - A Novel Generator with Auxiliary Branch for Improving GAN Performance [7.005458308454871]
本稿では、2つの異なるブランチから得られた特徴を組み合わせることで、画像を生成する新しいジェネレータアーキテクチャを紹介する。
メインブランチの目標は、複数の残留ブロックを通り抜けて画像を生成することであり、補助ブランチは、前のレイヤの粗い情報を後層に伝達することである。
提案手法の優位性を証明するため, 各種標準データセットを用いた広範囲な実験を行った。
論文 参考訳(メタデータ) (2021-12-30T08:38:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。