論文の概要: DAWSON: A Domain Adaptive Few Shot Generation Framework
- arxiv url: http://arxiv.org/abs/2001.00576v1
- Date: Thu, 2 Jan 2020 00:59:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-16 04:02:49.812127
- Title: DAWSON: A Domain Adaptive Few Shot Generation Framework
- Title(参考訳): DAWSON: ドメイン適応型Fewショット生成フレームワーク
- Authors: Weixin Liang, Zixuan Liu and Can Liu
- Abstract要約: メタ学習に基づくGANのためのドメイン適応FewShot生成フレームワーク。
Dawsonは、幅広いメタ学習アルゴリズムとアーキテクチャのバリエーションを持つ様々なGANをサポートするプラグイン・アンド・プレイフレームワークである。
DAWSONをベースとして,最初の数ショット音楽生成モデルであるMUSIC MATINEEを提案する。
- 参考スコア(独自算出の注目度): 8.864750946112894
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Training a Generative Adversarial Networks (GAN) for a new domain from
scratch requires an enormous amount of training data and days of training time.
To this end, we propose DAWSON, a Domain Adaptive FewShot Generation
FrameworkFor GANs based on meta-learning. A major challenge of applying
meta-learning GANs is to obtain gradients for the generator from evaluating it
on development sets due to the likelihood-free nature of GANs. To address this
challenge, we propose an alternative GAN training procedure that naturally
combines the two-step training procedure of GANs and the two-step training
procedure of meta-learning algorithms. DAWSON is a plug-and-play framework that
supports a broad family of meta-learning algorithms and various GANs with
architectural-variants. Based on DAWSON, We also propose MUSIC MATINEE, which
is the first few-shot music generation model. Our experiments show that MUSIC
MATINEE could quickly adapt to new domains with only tens of songs from the
target domains. We also show that DAWSON can learn to generate new digits with
only four samples in the MNIST dataset. We release source codes implementation
of DAWSON in both PyTorch and Tensorflow, generated music samples on two genres
and the lightning video.
- Abstract(参考訳): 新たなドメインをゼロからGAN(Generative Adversarial Networks)にトレーニングするには,膨大な量のトレーニングデータとトレーニング期間が必要です。
そこで本稿では,メタ学習に基づくドメイン適応FewShot生成フレームワークであるDAWSONを提案する。
メタラーニング GAN を適用する上での大きな課題は、GAN の可能性が低いため、開発セット上での評価から、ジェネレータの勾配を得ることである。
この課題に対処するために、GANの2段階の訓練手順とメタ学習アルゴリズムの2段階の訓練手順を自然に組み合わせた代替的なGAN訓練手順を提案する。
DAWSONは、幅広いメタ学習アルゴリズムとアーキテクチャのバリエーションを持つ様々なGANをサポートするプラグイン・アンド・プレイフレームワークである。
DAWSONをベースとして,最初の数ショット音楽生成モデルであるMUSIC MATINEEを提案する。
実験の結果,MUSIC MATINEEは対象ドメインから数十曲しか歌わない新しいドメインに迅速に適応できることがわかった。
また、DAWSONは、MNISTデータセットに4つのサンプルだけで新しい桁を生成することができることを示す。
我々は、PyTorchとTensorflowの両方でDAWSONのソースコード実装を公開し、2つのジャンルの楽曲サンプルとLightningビデオを生成した。
関連論文リスト
- Incremental Open-set Domain Adaptation [27.171935835686117]
破滅的な忘れは、視覚領域を連続的に学習する際にニューラルネットワークモデルを不安定にする。
我々は、画像分類のための忘れやすい漸進的学習戦略を開発する。
論文 参考訳(メタデータ) (2024-08-31T19:37:54Z) - Exploring User Retrieval Integration towards Large Language Models for Cross-Domain Sequential Recommendation [66.72195610471624]
Cross-Domain Sequential Recommendationは、異なるドメイン間でユーザのシーケンシャルな好みをマイニングし、転送することを目的としている。
本稿では,ユーザ検索手法を探索し,CDSRの性能向上を目的とした URLLM という新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-05T09:19:54Z) - DGInStyle: Domain-Generalizable Semantic Segmentation with Image Diffusion Models and Stylized Semantic Control [68.14798033899955]
大規模で事前訓練された潜伏拡散モデル(LDM)は、創造的コンテンツを生成できる異常な能力を示した。
しかし、それらは例えば、セマンティックセグメンテーションのような知覚スタックのタスクを改善するために、大規模なデータジェネレータとして使用できますか?
自律運転の文脈でこの疑問を考察し、「はい」という言い換えで答える。
論文 参考訳(メタデータ) (2023-12-05T18:34:12Z) - Spider GAN: Leveraging Friendly Neighbors to Accelerate GAN Training [20.03447539784024]
本稿では,画像を入力とするGANの学習手法を提案する。
このプロセスは、密接に関連するデータセットや、ターゲット分布のフレンドリーな近所'を識別することで、効率的に行うことができる。
我々は、スパイダーガンの定式化がより高速な収束をもたらすことを示し、ジェネレータは、一見無関係なデータセットでさえ対応を発見できることを示した。
論文 参考訳(メタデータ) (2023-05-12T17:03:18Z) - Exploring Distributional Shifts in Large Language Models for Code
Analysis [36.73114441988879]
コード機能を持つ3つの大規模言語モデルがどのようにドメイン外データに一般化するかを検討する。
コード要約とコード生成という,2つの基本的なアプリケーションについて検討する。
複数のドメインに適応したモデルが同時に、単一のドメインに適応したモデルと同等に動作していることが分かりました。
論文 参考訳(メタデータ) (2023-03-16T07:45:46Z) - ME-D2N: Multi-Expert Domain Decompositional Network for Cross-Domain
Few-Shot Learning [95.78635058475439]
クロスドメインのFew-Shot Learningは、異なるドメインにわたるFew-Shot Learning問題に対処することを目的としている。
本稿では,ME-D2N(Multi-Expert Domain Decompositional Network)を技術的に貢献する。
本稿では,学生モデルを2つの領域関連部分に分解する新しい領域分解モジュールを提案する。
論文 参考訳(メタデータ) (2022-10-11T09:24:47Z) - Learning Phone Recognition from Unpaired Audio and Phone Sequences Based
on Generative Adversarial Network [58.82343017711883]
そこで本研究では,不適切な音声系列や発話から直接学習する方法について検討する。
GAN訓練を第1段階に導入し,無声音声と音声シーケンスのマッピング関係を求める。
第2段階では、発電機の出力からトレーニングするために別のHMMモデルが導入され、性能が向上する。
論文 参考訳(メタデータ) (2022-07-29T09:29:28Z) - Meta-FDMixup: Cross-Domain Few-Shot Learning Guided by Labeled Target
Data [95.47859525676246]
最近の研究では、ソースドメインで訓練された既存の数発の学習手法が、ドメインギャップが観測されると、新しいターゲットドメインに一般化できないことが判明している。
本稿では,クロスドメインFew-Shot Learningにおけるラベル付き目標データが,学習プロセスを支援するために利用されていないことに気付いた。
論文 参考訳(メタデータ) (2021-07-26T06:15:45Z) - MineGAN++: Mining Generative Models for Efficient Knowledge Transfer to
Limited Data Domains [77.46963293257912]
本稿では,特定の対象領域に最も有益である知識をマイニングした生成モデルのための新しい知識伝達手法を提案する。
これは、各事前訓練されたGANの生成分布のどの部分が対象領域に最も近いサンプルを出力しているかを識別するマイカネットワークを用いて行われる。
提案手法はMineGANと呼ばれ,ターゲット画像が少ない領域に効果的に知識を伝達し,既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-28T13:10:56Z) - Domain Adaptation in Dialogue Systems using Transfer and Meta-Learning [12.64591916699374]
現在の生成ベースの対話システムは、少量のターゲットデータしか利用できない場合、新しい未知のドメインに適応できない。
トランスファーとメタラーニングを組み合わせることにより,未知の領域に適応する手法を提案する。
論文 参考訳(メタデータ) (2021-02-22T16:16:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。