論文の概要: Phased data augmentation for training PixelCNNs with VQ-VAE-2 and
limited data
- arxiv url: http://arxiv.org/abs/2305.12681v1
- Date: Mon, 22 May 2023 03:38:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-23 18:35:32.862536
- Title: Phased data augmentation for training PixelCNNs with VQ-VAE-2 and
limited data
- Title(参考訳): vq-vae-2と限定データを用いたpixelcnns訓練のための位相データ拡張
- Authors: Yuta Mimura
- Abstract要約: そこで本研究では,PC-VQ2をスクラッチから限られたデータで学習するためのトレーニング戦略を提案する。
この戦略により、限られたデータを持つモデルでは、多様性に十分なデータを持つモデルと競合する画像を生成し、忠実さで性能を向上することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With development of deep learning, researchers have developed generative
models in generating realistic images. One of such generative models, a
PixelCNNs model with Vector Quantized Variational AutoEncoder 2 (VQ-VAE-2), can
generate more various images than other models. However, a PixelCNNs model with
VQ-VAE-2, I call it PC-VQ2, requires sufficiently much training data like other
deep learning models. Its practical applications are often limited in domains
where collecting sufficient data is not difficult. To solve the problem,
researchers have recently proposed more data-efficient methods for training
generative models with limited unlabeled data from scratch. However, no such
methods in PC-VQ2s have been researched. This study provides the first step in
this direction, considering generation of images using PC-VQ2s and limited
unlabeled data. In this study, I propose a training strategy for training a
PC-VQ2 with limited data from scratch, phased data augmentation. In the
strategy, ranges of parameters of data augmentation is narrowed in phases
through learning. Quantitative evaluation shows that the phased data
augmentation enables the model with limited data to generate images competitive
with the one with sufficient data in diversity and outperforming it in
fidelity. The evaluation suggests that the proposed method should be useful for
training a PC-VQ2 with limited data efficiently to generate various and natural
images.
- Abstract(参考訳): ディープラーニングの発展に伴い、研究者は現実的な画像を生成するための生成モデルを開発した。
そのような生成モデルの1つ、ベクトル量子化された変分オートエンコーダ2(vq-vae-2)を持つpixelcnnsモデルは、他のモデルよりも多様な画像を生成することができる。
しかし、VQ-VAE-2を備えたPixelCNNsモデルは、PC-VQ2と呼ばれ、他のディープラーニングモデルのような十分なトレーニングデータを必要とする。
その実用的応用は、十分なデータを集めることが難しくない領域でしばしば制限される。
この問題を解決するために、研究者たちは、ラベルなしデータをスクラッチから制限した生成モデルのトレーニングのための、よりデータ効率のよい方法を提案している。
しかし、PC-VQ2ではそのような手法は研究されていない。
本研究は,PC-VQ2と制限付き未ラベルデータを用いた画像生成を考慮し,この方向への第一歩を提供する。
本研究では,PC-VQ2をスクラッチから限られたデータで学習するための学習戦略を提案する。
この戦略では、データ拡張のパラメータの範囲は学習を通じて段階的に狭められる。
定量的評価により、位相データ拡張により、限られたデータを持つモデルが、多様性に十分なデータを持つモデルと競合する画像を生成し、忠実さで性能を向上できることが示された。
評価の結果,提案手法は,限られたデータを用いたPC-VQ2の訓練に有用であることが示唆された。
関連論文リスト
- Data-efficient Large Vision Models through Sequential Autoregression [58.26179273091461]
限られたデータセットに基づいて,効率的な自己回帰に基づく視覚モデルを構築する。
このモデルは,高レベル・低レベルのセマンティック理解の両方にまたがる視覚的タスクにおいて,その習熟度をいかに達成するかを実証する。
我々の経験的評価は、モデルが様々なタスクに適応する際の機敏さを強調し、パラメータフットプリントの大幅な削減を図った。
論文 参考訳(メタデータ) (2024-02-07T13:41:53Z) - Federated Learning with Projected Trajectory Regularization [65.6266768678291]
フェデレーション学習は、ローカルデータを共有せずに、分散クライアントから機械学習モデルの共同トレーニングを可能にする。
連合学習における重要な課題の1つは、クライアントにまたがる識別できない分散データを扱うことである。
本稿では,データ問題に対処するための予測軌道正則化(FedPTR)を備えた新しいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-22T02:12:08Z) - One-Shot Federated Learning with Classifier-Guided Diffusion Models [44.604485649167216]
ワンショット・フェデレーション・ラーニング (OSFL) は, 通信コストの低さから近年注目されている。
本稿では,OSFLに拡散モデルがもたらす新たな機会を探求し,FedCADOを提案する。
FedCADOはクライアントのディストリビューションに準拠したデータを生成し、その後、サーバ上で集約されたモデルをトレーニングします。
論文 参考訳(メタデータ) (2023-11-15T11:11:25Z) - Data-Centric Long-Tailed Image Recognition [49.90107582624604]
ロングテールモデルは高品質なデータに対する強い需要を示している。
データ中心のアプローチは、モデルパフォーマンスを改善するために、データの量と品質の両方を強化することを目的としています。
現在、情報強化の有効性を説明するメカニズムに関する研究が不足している。
論文 参考訳(メタデータ) (2023-11-03T06:34:37Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - Phoenix: A Federated Generative Diffusion Model [6.09170287691728]
大規模な集中型データセットで生成モデルをトレーニングすることで、データのプライバシやセキュリティ、アクセシビリティといった面での課題が発生する可能性がある。
本稿では,フェデレートラーニング(FL)技術を用いて,複数のデータソースにまたがる拡散確率モデル(DDPM)の学習手法を提案する。
論文 参考訳(メタデータ) (2023-06-07T01:43:09Z) - Instance-Conditioned GAN Data Augmentation for Representation Learning [29.36473147430433]
DA_IC-GANは、学習可能なデータ拡張モジュールで、ほとんどの最先端のトレーニングレシピと組み合わせて、棚外で使用することができる。
DA_IC-GAN は最大容量モデルで 1%p から 2%p の精度を向上できることを示す。
また,DA_IC-GANを自己指導型トレーニングレシピと組み合わせることで,いくつかの設定で1%pの精度向上が達成できることを示す。
論文 参考訳(メタデータ) (2023-03-16T22:45:43Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Exploring the Efficacy of Automatically Generated Counterfactuals for
Sentiment Analysis [17.811597734603144]
本稿では,データ拡張と説明のためのデファクトデータの自動生成手法を提案する。
いくつかの異なるデータセットに対する包括的な評価と、さまざまな最先端ベンチマークの使用により、我々のアプローチがモデルパフォーマンスを大幅に改善できることを示す。
論文 参考訳(メタデータ) (2021-06-29T10:27:01Z) - Regularizing Generative Adversarial Networks under Limited Data [88.57330330305535]
本研究は、限られたデータ上で堅牢なGANモデルをトレーニングするための正規化手法を提案する。
正規化損失とLeCam-divergenceと呼ばれるf-divergenceの関連性を示す。
論文 参考訳(メタデータ) (2021-04-07T17:59:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。