論文の概要: RareGAN: Generating Samples for Rare Classes
- arxiv url: http://arxiv.org/abs/2203.10674v1
- Date: Sun, 20 Mar 2022 23:14:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-22 19:22:00.487592
- Title: RareGAN: Generating Samples for Rare Classes
- Title(参考訳): RareGAN: 希少クラスのサンプル生成
- Authors: Zinan Lin, Hao Liang, Giulia Fanti, Vyas Sekar
- Abstract要約: ラベルなしデータセットの希少なクラスに対してGAN(Generative Adversarial Network)を学習する問題について検討する。
この問題は、セキュリティ(例えばDNS増幅攻撃用のパケット)、システム、ネットワークなどの分野の実践的な応用から動機づけられている。
提案するRareGANは,3つの重要なアイデアの新規な合成である。
- 参考スコア(独自算出の注目度): 14.254658226029894
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of learning generative adversarial networks (GANs) for a
rare class of an unlabeled dataset subject to a labeling budget. This problem
is motivated from practical applications in domains including security (e.g.,
synthesizing packets for DNS amplification attacks), systems and networking
(e.g., synthesizing workloads that trigger high resource usage), and machine
learning (e.g., generating images from a rare class). Existing approaches are
unsuitable, either requiring fully-labeled datasets or sacrificing the fidelity
of the rare class for that of the common classes. We propose RareGAN, a novel
synthesis of three key ideas: (1) extending conditional GANs to use labelled
and unlabelled data for better generalization; (2) an active learning approach
that requests the most useful labels; and (3) a weighted loss function to favor
learning the rare class. We show that RareGAN achieves a better
fidelity-diversity tradeoff on the rare class than prior work across different
applications, budgets, rare class fractions, GAN losses, and architectures.
- Abstract(参考訳): ラベル付きデータセットの希少クラスに対して,ラベリング予算を対象とするgans(generative adversarial network)の学習問題について検討する。
この問題は、セキュリティ(DNS増幅攻撃のためのパケットの合成など)、システムとネットワーク(高いリソース使用を誘発するワークロードの合成など)、マシンラーニング(まれなクラスからのイメージ生成など)といった分野の実践的な応用から動機づけられている。
既存のアプローチは不適切であり、完全なラベル付きデータセットを必要とするか、一般的なクラスのクラスに対するレアクラスの忠実さを犠牲にする。
本研究では,条件付きganをラベル付きデータとラベル付きデータに拡張し,より汎用性を高めること,最も有用なラベルを要求するアクティブラーニングアプローチ,そして,希少クラス学習を優先する重み付き損失関数の3つの重要な概念を新たに合成するレアガンを提案する。
我々は、RareGANが、異なるアプリケーション、予算、希少なクラス分数、GAN損失、アーキテクチャにわたる以前の作業よりも、レアクラスの忠実度と多様性のトレードオフを達成していることを示す。
関連論文リスト
- On-Device Domain Generalization [93.79736882489982]
ドメインの一般化はデバイス上の機械学習アプリケーションにとって重要である。
知識蒸留がこの問題の解決の有力な候補であることがわかった。
本研究では,教師が配布外データをどのように扱えるかを学生に教えることを目的とした,配布外知識蒸留(OKD)という簡単なアイデアを提案する。
論文 参考訳(メタデータ) (2022-09-15T17:59:31Z) - Universalizing Weak Supervision [18.832796698152492]
ラベルタイプに対して弱い監督を可能にするユニバーサル手法を提案する。
我々は、このテクニックを、ハイパーボリック空間におけるランク付け、回帰、学習を含むWSフレームワークがこれまで取り組まなかった重要な問題に適用する。
論文 参考訳(メタデータ) (2021-12-07T17:59:10Z) - Improving Contrastive Learning on Imbalanced Seed Data via Open-World
Sampling [96.8742582581744]
我々は、Model-Aware K-center (MAK)と呼ばれるオープンワールドなラベルなしデータサンプリングフレームワークを提案する。
MAKは、尾性、近接性、多様性の3つの単純な原則に従う。
我々はMAKが学習した機能の全体的な表現品質とクラスバランス性の両方を継続的に改善できることを実証した。
論文 参考訳(メタデータ) (2021-11-01T15:09:41Z) - A Unified Objective for Novel Class Discovery [48.1003877511578]
新たなクラスを発見するための統一目的関数(UNO)を導入する。
UNOは教師なし学習と教師なし学習の相乗効果を好んでいる。
その単純さにもかかわらず、UNOはいくつかのベンチマークで最先端の技術を誇っている。
論文 参考訳(メタデータ) (2021-08-19T07:22:29Z) - Generate, Annotate, and Learn: Generative Models Advance Self-Training
and Knowledge Distillation [58.64720318755764]
Semi-Supervised Learning (SSL)は多くのアプリケーションドメインで成功している。
知識蒸留(KD)により、深層ネットワークとアンサンブルの圧縮が可能となり、新しいタスク固有の未ラベルの例について知識を蒸留する際に最良の結果が得られる。
我々は、非条件生成モデルを用いて、ドメイン内の未ラベルデータを合成する「生成、注釈、学習(GAL)」と呼ばれる一般的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-11T05:01:24Z) - Tensor feature hallucination for few-shot learning [17.381648488344222]
限られた監督と限られたデータによって、サンプルを分類するという課題に対処するショットは少ない。
数ショット分類のための合成データ生成に関するこれまでの研究は、複雑なモデルを活用することに重点を置いていた。
本稿では,単純かつ簡単な合成データ生成手法を効果的に利用する方法を検討する。
論文 参考訳(メタデータ) (2021-06-09T18:25:08Z) - Few-shot learning via tensor hallucination [17.381648488344222]
限定されたラベルデータのみを与えられた例を分類するという課題に対処する。
単純な損失関数を使うことは、少数ショット設定でフィーチャージェネレータをトレーニングするのに十分であることを示す。
提案手法は,より洗練されたデータ拡張手法を上回って,新たな技術状態を設定する。
論文 参考訳(メタデータ) (2021-04-19T17:30:33Z) - Generative Multi-Label Zero-Shot Learning [136.17594611722285]
マルチラベルゼロショット学習は、トレーニング中にデータが入手できない複数の見えないカテゴリにイメージを分類する試みである。
我々の研究は、(一般化された)ゼロショット設定におけるマルチラベル機能の問題に最初に取り組みました。
私たちのクロスレベル核融合に基づく生成アプローチは、3つのデータセットすべてにおいて最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2021-01-27T18:56:46Z) - ErGAN: Generative Adversarial Networks for Entity Resolution [8.576633582363202]
学習ベースのエンティティ解決の大きな課題は、トレーニングのラベルコストを削減する方法です。
そこで本研究では,erganと呼ばれる新しい深層学習手法を提案する。
ErGANのラベリングと学習効率を実証的に検証するための広範な実験を実施しました。
論文 参考訳(メタデータ) (2020-12-18T01:33:58Z) - Classify and Generate Reciprocally: Simultaneous Positive-Unlabelled
Learning and Conditional Generation with Extra Data [77.31213472792088]
クラスラベルデータの不足は、多くの機械学習問題において、ユビキタスなボトルネックとなっている。
本稿では, 正負ラベル付き(PU)分類と, 余分なラベル付きデータによる条件生成を活用することで, この問題に対処する。
本稿では,PU分類と条件生成を併用した新たなトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-14T08:27:40Z) - Adversarial Feature Hallucination Networks for Few-Shot Learning [84.31660118264514]
Adversarial Feature Hallucination Networks (AFHN) は条件付き Wasserstein Generative Adversarial Network (cWGAN) に基づいている。
合成された特徴の識別性と多様性を促進するために、2つの新規レギュレータがAFHNに組み込まれている。
論文 参考訳(メタデータ) (2020-03-30T02:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。