論文の概要: DeGAN : Data-Enriching GAN for Retrieving Representative Samples from a
Trained Classifier
- arxiv url: http://arxiv.org/abs/1912.11960v1
- Date: Fri, 27 Dec 2019 02:05:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-10 00:14:50.158018
- Title: DeGAN : Data-Enriching GAN for Retrieving Representative Samples from a
Trained Classifier
- Title(参考訳): DeGAN : 訓練された分類器から代表サンプルを取得するためのデータ強化型GAN
- Authors: Sravanti Addepalli, Gaurav Kumar Nayak, Anirban Chakraborty, R.
Venkatesh Babu
- Abstract要約: 我々は、トレーニングされたネットワークの将来の学習タスクのために、利用可能なデータの豊富さと関連するデータの欠如の間のギャップを埋める。
利用可能なデータは、元のトレーニングデータセットまたは関連するドメインデータセットの不均衡なサブセットである可能性があるため、代表サンプルを検索するために使用します。
関連ドメインからのデータを活用して最先端のパフォーマンスを実現することを実証する。
- 参考スコア(独自算出の注目度): 58.979104709647295
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this era of digital information explosion, an abundance of data from
numerous modalities is being generated as well as archived everyday. However,
most problems associated with training Deep Neural Networks still revolve
around lack of data that is rich enough for a given task. Data is required not
only for training an initial model, but also for future learning tasks such as
Model Compression and Incremental Learning. A diverse dataset may be used for
training an initial model, but it may not be feasible to store it throughout
the product life cycle due to data privacy issues or memory constraints. We
propose to bridge the gap between the abundance of available data and lack of
relevant data, for the future learning tasks of a given trained network. We use
the available data, that may be an imbalanced subset of the original training
dataset, or a related domain dataset, to retrieve representative samples from a
trained classifier, using a novel Data-enriching GAN (DeGAN) framework. We
demonstrate that data from a related domain can be leveraged to achieve
state-of-the-art performance for the tasks of Data-free Knowledge Distillation
and Incremental Learning on benchmark datasets. We further demonstrate that our
proposed framework can enrich any data, even from unrelated domains, to make it
more useful for the future learning tasks of a given network.
- Abstract(参考訳): このデジタル情報爆発の時代には、大量のモダリティから大量のデータが生成され、日々アーカイブされている。
しかし、ディープニューラルネットワークのトレーニングに関連するほとんどの問題は、与えられたタスクに十分なリッチなデータの欠如にかかっている。
データは、初期モデルのトレーニングだけでなく、モデル圧縮やインクリメンタルラーニングといった将来の学習タスクにも必要である。
多様なデータセットは初期モデルのトレーニングに使用できるが、データのプライバシの問題やメモリの制約のため、製品ライフサイクル全体にわたって格納することは不可能である。
そこで本稿では,訓練されたネットワークの今後の学習課題に対して,利用可能なデータ量と関連するデータ不足のギャップを埋めることを提案する。
既存のトレーニングデータセットや関連するドメインデータセットの不均衡サブセットである利用可能なデータを使用して、新しいデータエンリッチgan(degan)フレームワークを使用して、トレーニングされた分類器から代表サンプルを取得する。
ベンチマークデータセットにおけるデータフリーな知識蒸留とインクリメンタルラーニングのタスクにおいて、関連するドメインのデータを最先端のパフォーマンスを達成するために活用できることを実証する。
さらに,提案するフレームワークは,無関係な領域からでも任意のデータを強化し,ネットワークの今後の学習タスクに役立てることができることを実証する。
関連論文リスト
- SSE: Multimodal Semantic Data Selection and Enrichment for Industrial-scale Data Assimilation [29.454948190814765]
近年、人工知能のために収集されたデータは、管理不能な量に成長している。
セマンティックに多様で重要なデータセット部分を選択するためのフレームワークを提案する。
巨大なラベルのないデータプールから意味のある新しいデータを発見することで、さらにセマンティックに強化します。
論文 参考訳(メタデータ) (2024-09-20T19:17:52Z) - Retrieval-Augmented Data Augmentation for Low-Resource Domain Tasks [66.87070857705994]
低リソース環境では、データ拡張に使用するシードデータサンプルの量は極めて少ない。
本稿では、他のデータセットから豊富なサンプルを組み込むことで、トレーニングデータを増強する新しい手法を提案する。
このアプローチは、生成されたデータが関連性だけでなく、限られたシードデータだけで達成できるものよりも多様であることを保証する。
論文 参考訳(メタデータ) (2024-02-21T02:45:46Z) - Data Filtering Networks [67.827994353269]
本研究では、大規模な未処理データセットをフィルタリングする第2ステップにおいて、データフィルタリングネットワーク(DFN)を学習する問題について検討する。
我々の重要な発見は、フィルタリングのためのネットワークの品質が下流タスクのパフォーマンスと異なることである。
我々の知見に基づいて、最先端の画像テキストデータセットを誘導する新しいデータフィルタリングネットワークを構築した。
論文 参考訳(メタデータ) (2023-09-29T17:37:29Z) - Building Manufacturing Deep Learning Models with Minimal and Imbalanced
Training Data Using Domain Adaptation and Data Augmentation [15.333573151694576]
本稿では,目標学習課題に対するラベル付き学習データ不足の問題に対処する新しいドメイン適応(DA)手法を提案する。
我々のアプローチは、ソースデータセットとターゲット学習タスクで利用可能なデータセットが同一または異なる機能空間を持つシナリオで機能する。
我々は、ウェハ欠陥予測のための画像データを用いて、組み合わせたアプローチを評価する。
論文 参考訳(メタデータ) (2023-05-31T21:45:34Z) - Scalable Neural Data Server: A Data Recommender for Transfer Learning [70.06289658553675]
転送学習は、下流のパフォーマンスを改善するために追加データを活用する一般的な戦略である。
Nerve Data Server (NDS)は、特定の下流タスクに関連するデータを推奨する検索エンジンで、この問題に対処するためにこれまで提案されていた。
NDSは、データソースでトレーニングされた専門家の混合物を使用して、各ソースと下流タスクの類似性を推定する。
SNDSは、中間データセットに近接して、データソースと下流タスクの両方を表現します。
論文 参考訳(メタデータ) (2022-06-19T12:07:32Z) - On the Pitfalls of Learning with Limited Data: A Facial Expression
Recognition Case Study [0.5249805590164901]
私達はビデオからの顔表現の認識の問題に焦点を合わせます。
4つのデータベースを異なる複雑さで,9つのディープラーニングアーキテクチャで動画分類を行った。
複雑なトレーニングセットは、トランスファーラーニングと合成生成データでトレーニングすると、より安定したテストセットによく変換されます。
論文 参考訳(メタデータ) (2021-04-02T18:53:41Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z) - Overcoming Noisy and Irrelevant Data in Federated Learning [13.963024590508038]
フェデレーション学習は、クライアントデバイスが収集したローカルデータから、機械学習モデルを分散的にトレーニングする効果的な方法である。
そこで我々は,小さなベンチマークデータセットに基づいてトレーニングされたベンチマークモデルを用いて,関連するデータを分散的に選択する手法を提案する。
提案手法の有効性は,多数のクライアントを持つシミュレーションシステムにおいて,複数の実世界の画像データセット上で評価される。
論文 参考訳(メタデータ) (2020-01-22T22:28:47Z) - Neural Data Server: A Large-Scale Search Engine for Transfer Learning
Data [78.74367441804183]
我々は,ターゲットドメインに最も有用な転送学習データを見つけるための大規模検索エンジンであるNeural Data Server (NDS)を紹介した。
NDSは、いくつかの人気のある画像データセットをインデックスするデータサーバで構成され、クライアントにデータを推奨することを目的としている。
我々は,NDSが様々な伝達学習シナリオにおいて有効であることを示し,複数のターゲットデータセットに対して最先端の性能を示す。
論文 参考訳(メタデータ) (2020-01-09T01:21:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。