論文の概要: Neural Data Server: A Large-Scale Search Engine for Transfer Learning
Data
- arxiv url: http://arxiv.org/abs/2001.02799v3
- Date: Wed, 1 Apr 2020 00:43:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-01-13 04:30:29.701352
- Title: Neural Data Server: A Large-Scale Search Engine for Transfer Learning
Data
- Title(参考訳): Neural Data Server: 学習データ転送のための大規模検索エンジン
- Authors: Xi Yan, David Acuna, Sanja Fidler
- Abstract要約: 我々は,ターゲットドメインに最も有用な転送学習データを見つけるための大規模検索エンジンであるNeural Data Server (NDS)を紹介した。
NDSは、いくつかの人気のある画像データセットをインデックスするデータサーバで構成され、クライアントにデータを推奨することを目的としている。
我々は,NDSが様々な伝達学習シナリオにおいて有効であることを示し,複数のターゲットデータセットに対して最先端の性能を示す。
- 参考スコア(独自算出の注目度): 78.74367441804183
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Transfer learning has proven to be a successful technique to train deep
learning models in the domains where little training data is available. The
dominant approach is to pretrain a model on a large generic dataset such as
ImageNet and finetune its weights on the target domain. However, in the new era
of an ever-increasing number of massive datasets, selecting the relevant data
for pretraining is a critical issue. We introduce Neural Data Server (NDS), a
large-scale search engine for finding the most useful transfer learning data to
the target domain. NDS consists of a dataserver which indexes several large
popular image datasets, and aims to recommend data to a client, an end-user
with a target application with its own small labeled dataset. The dataserver
represents large datasets with a much more compact mixture-of-experts model,
and employs it to perform data search in a series of dataserver-client
transactions at a low computational cost. We show the effectiveness of NDS in
various transfer learning scenarios, demonstrating state-of-the-art performance
on several target datasets and tasks such as image classification, object
detection and instance segmentation. Neural Data Server is available as a
web-service at http://aidemos.cs.toronto.edu/nds/.
- Abstract(参考訳): トランスファーラーニングは、ほとんどトレーニングデータがないドメインでディープラーニングモデルをトレーニングする成功技術であることが証明されている。
支配的なアプローチは、imagenetのような大きなジェネリックデータセット上でモデルを事前トレーニングし、ターゲットドメインで重みを微調整することです。
しかし、増え続ける膨大なデータセットの新時代において、事前トレーニングのための関連するデータを選択することが重要な問題である。
我々は,ターゲットドメインに最も有用な転送学習データを見つけるための大規模検索エンジンであるNeural Data Server (NDS)を紹介した。
ndsは、いくつかの大きな人気のあるイメージデータセットをインデックスするデータサーバで構成されており、クライアントにデータを推奨することを目的としている。
データサーバは、よりコンパクトなMix-of-expertsモデルで大規模なデータセットを表現し、計算コストの低い一連のデータサーバ-クライアントトランザクションでデータ検索を行う。
我々は,NDSの様々な伝達学習シナリオにおける有効性を示し,いくつかのターゲットデータセットや画像分類,オブジェクト検出,インスタンス分割といったタスクに対して最先端の性能を示す。
Neural Data Serverはhttp://aidemos.cs.toronto.edu/nds/でWebサービスとして利用できる。
関連論文リスト
- Data Filtering Networks [67.827994353269]
本研究では、大規模な未処理データセットをフィルタリングする第2ステップにおいて、データフィルタリングネットワーク(DFN)を学習する問題について検討する。
我々の重要な発見は、フィルタリングのためのネットワークの品質が下流タスクのパフォーマンスと異なることである。
我々の知見に基づいて、最先端の画像テキストデータセットを誘導する新しいデータフィルタリングネットワークを構築した。
論文 参考訳(メタデータ) (2023-09-29T17:37:29Z) - AutoSynth: Learning to Generate 3D Training Data for Object Point Cloud
Registration [69.21282992341007]
Auto Synthは、ポイントクラウド登録のための3Dトレーニングデータを自動的に生成する。
私たちはポイントクラウド登録ネットワークをもっと小さなサロゲートネットワークに置き換え、4056.43$のスピードアップを実現しました。
TUD-L,LINEMOD,Occluded-LINEMODに関する我々の研究結果は,検索データセットでトレーニングされたニューラルネットワークが,広く使用されているModelNet40データセットでトレーニングされたニューラルネットワークよりも一貫してパフォーマンスが向上していることを示す。
論文 参考訳(メタデータ) (2023-09-20T09:29:44Z) - Dataset Quantization [72.61936019738076]
大規模データセットを小さなサブセットに圧縮する新しいフレームワークであるデータセット量子化(DQ)を提案する。
DQは、ImageNet-1kのような大規模データセットを最先端圧縮比で蒸留する最初の方法である。
論文 参考訳(メタデータ) (2023-08-21T07:24:29Z) - Scalable Neural Data Server: A Data Recommender for Transfer Learning [70.06289658553675]
転送学習は、下流のパフォーマンスを改善するために追加データを活用する一般的な戦略である。
Nerve Data Server (NDS)は、特定の下流タスクに関連するデータを推奨する検索エンジンで、この問題に対処するためにこれまで提案されていた。
NDSは、データソースでトレーニングされた専門家の混合物を使用して、各ソースと下流タスクの類似性を推定する。
SNDSは、中間データセットに近接して、データソースと下流タスクの両方を表現します。
論文 参考訳(メタデータ) (2022-06-19T12:07:32Z) - Overcoming Noisy and Irrelevant Data in Federated Learning [13.963024590508038]
フェデレーション学習は、クライアントデバイスが収集したローカルデータから、機械学習モデルを分散的にトレーニングする効果的な方法である。
そこで我々は,小さなベンチマークデータセットに基づいてトレーニングされたベンチマークモデルを用いて,関連するデータを分散的に選択する手法を提案する。
提案手法の有効性は,多数のクライアントを持つシミュレーションシステムにおいて,複数の実世界の画像データセット上で評価される。
論文 参考訳(メタデータ) (2020-01-22T22:28:47Z) - DeGAN : Data-Enriching GAN for Retrieving Representative Samples from a
Trained Classifier [58.979104709647295]
我々は、トレーニングされたネットワークの将来の学習タスクのために、利用可能なデータの豊富さと関連するデータの欠如の間のギャップを埋める。
利用可能なデータは、元のトレーニングデータセットまたは関連するドメインデータセットの不均衡なサブセットである可能性があるため、代表サンプルを検索するために使用します。
関連ドメインからのデータを活用して最先端のパフォーマンスを実現することを実証する。
論文 参考訳(メタデータ) (2019-12-27T02:05:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。