Fugu-MT 論文翻訳(概要): Forgetting Data from Pre-trained GANs

論文の概要: Forgetting Data from Pre-trained GANs

arxiv url: http://arxiv.org/abs/2206.14389v1
Date: Wed, 29 Jun 2022 03:46:16 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-30 19:38:59.093349
Title: Forgetting Data from Pre-trained GANs
Title（参考訳）: 事前訓練されたGANからのデータの収集
Authors: Zhifeng Kong and Kamalika Chaudhuri
Abstract要約: 特定の種類のサンプルを忘れないように、トレーニング後にモデルを後編集する方法について検討する。我々は,GANに対して,忘れるべきサンプルの表現方法が異なる3つの異なるアルゴリズムを提供する。我々のアルゴリズムは、完全再トレーニングのコストのごく一部で、高品質を維持しながらデータを忘れることができる。
参考スコア（独自算出の注目度）: 28.326418377665345
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Large pre-trained generative models are known to occasionally provide samples that may be undesirable for various reasons. The standard way to mitigate this is to re-train the models differently. In this work, we take a different, more compute-friendly approach and investigate how to post-edit a model after training so that it forgets certain kinds of samples. We provide three different algorithms for GANs that differ on how the samples to be forgotten are described. Extensive evaluations on real-world image datasets show that our algorithms are capable of forgetting data while retaining high generation quality at a fraction of the cost of full re-training.
Abstract（参考訳）: 大規模な事前訓練された生成モデルは、様々な理由で望ましくないサンプルを提供することが知られている。これを緩和する標準的な方法は、モデルを異なる方法で再トレーニングすることです。本研究では、より計算に優しいアプローチを採用し、トレーニング後にモデルを後編集する方法を調べ、特定の種類のサンプルを忘れるようにする。我々は,GANに対して,忘れるべきサンプルの表現方法が異なる3つの異なるアルゴリズムを提供する。実世界の画像データセットの大規模な評価は、我々のアルゴリズムがデータを再トレーニングするコストのごく一部で高画質を維持しながら、データを忘れることができることを示している。

関連論文リスト

Learning Augmentation Policies from A Model Zoo for Time Series Forecasting [58.66211334969299]
本稿では,強化学習に基づく学習可能なデータ拡張手法であるAutoTSAugを紹介する。限界サンプルを学習可能なポリシーで強化することにより、AutoTSAugは予測性能を大幅に改善する。
論文参考訳（メタデータ） (2024-09-10T07:34:19Z)
Pre-Trained Vision-Language Models as Partial Annotators [40.89255396643592]
事前学習された視覚言語モデルは、画像と自然言語の統一表現をモデル化するために大量のデータを学習する。本稿では,事前学習型モデルアプリケーションのための「事前学習型-弱教師付き学習」パラダイムについて検討し,画像分類タスクの実験を行う。
論文参考訳（メタデータ） (2024-05-23T17:17:27Z)
Which Pretrain Samples to Rehearse when Finetuning Pretrained Models? [60.59376487151964]
特定のタスクに関する微調整済みモデルが、テキストとビジョンタスクの事実上のアプローチになった。このアプローチの落とし穴は、微調整中に起こる事前学習の知識を忘れることである。本研究では,実際に忘れられているサンプルを識別・優先順位付けする新しいサンプリング手法であるmix-cdを提案する。
論文参考訳（メタデータ） (2024-02-12T22:32:12Z)
Beyond Human Data: Scaling Self-Training for Problem-Solving with Language Models [115.501751261878]
人為的なデータに基づく微調整言語モデル(LM)が普及している。我々は、スカラーフィードバックにアクセス可能なタスクにおいて、人間のデータを超えることができるかどうか検討する。 ReST$EM$はモデルサイズに好適にスケールし、人間のデータのみによる微調整を大幅に上回っていることがわかった。
論文参考訳（メタデータ） (2023-12-11T18:17:43Z)
The Journey, Not the Destination: How Data Guides Diffusion Models [75.19694584942623]
大規模なデータセットでトレーニングされた拡散モデルは、顕著な品質と多様性のフォトリアリスティックなイメージを合成することができる。 i)拡散モデルの文脈でデータ属性の形式的概念を提供し、(ii)そのような属性を反実的に検証することを可能にする枠組みを提案する。
論文参考訳（メタデータ） (2023-12-11T08:39:43Z)
Learning Defect Prediction from Unrealistic Data [57.53586547895278]
事前訓練されたコードのモデルは、コード理解と生成タスクに人気がある。このようなモデルは大きい傾向があり、訓練データの総量を必要とする。人工的に注入されたバグのある関数など、はるかに大きくてもより現実的なデータセットを持つモデルをトレーニングすることが一般的になった。このようなデータで訓練されたモデルは、実際のプログラムでは性能が劣りながら、同様のデータでのみうまく機能する傾向にある。
論文参考訳（メタデータ） (2023-11-02T01:51:43Z)
Upgrading VAE Training With Unlimited Data Plans Provided by Diffusion Models [12.542073306638988]
VAEにおけるオーバーフィッティングエンコーダは,事前学習した拡散モデルからのサンプルのトレーニングによって効果的に緩和できることを示す。提案手法を用いて学習したVAEの一般化性能,償却ギャップ,ロバスト性を3つの異なるデータセットで解析した。
論文参考訳（メタデータ） (2023-10-30T15:38:39Z)
Reducing Training Sample Memorization in GANs by Training with Memorization Rejection [80.0916819303573]
本稿では,トレーニング中のトレーニングサンプルのほぼ重複する生成サンプルを拒否する学習手法であるリジェクション記憶法を提案する。我々のスキームは単純で汎用的であり、任意のGANアーキテクチャに直接適用することができる。
論文参考訳（メタデータ） (2022-10-21T20:17:50Z)
Generating Representative Samples for Few-Shot Classification [8.62483598990205]
クラスごとの視覚的なサンプルで新しいカテゴリを学習することを目的としている。データ不足によってクラス表現がバイアスを受ける場合が少なくない。条件付き変分オートエンコーダモデルを用いて,意味的埋め込みに基づく視覚サンプルを生成する。
論文参考訳（メタデータ） (2022-05-05T20:58:33Z)
Anytime Sampling for Autoregressive Models via Ordered Autoencoding [88.01906682843618]
自動回帰モデルは画像生成や音声生成などのタスクに広く使われている。これらのモデルのサンプリングプロセスは割り込みを許さず、リアルタイムの計算資源に適応できない。いつでもサンプリングできる新しい自動回帰モデルファミリーを提案します。
論文参考訳（メタデータ） (2021-02-23T05:13:16Z)
One for More: Selecting Generalizable Samples for Generalizable ReID Model [92.40951770273972]
本稿では,選択したサンプルを損失関数として一般化する1対3の学習目標を提案する。提案した1対3のサンプルは,ReIDトレーニングフレームワークにシームレスに統合できる。
論文参考訳（メタデータ） (2020-12-10T06:37:09Z)
Instance Selection for GANs [25.196177369030146]
GAN(Generative Adversarial Networks)は、高品質な合成画像を生成するために広く採用されている。 GANはしばしばデータ多様体の外にある非現実的なサンプルを生成する。本稿では,サンプルの品質向上のための新しいアプローチを提案する。モデルトレーニングが行われる前に,インスタンス選択によるトレーニングデータセットの変更を行う。
論文参考訳（メタデータ） (2020-07-30T06:33:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。