論文の概要: From Model-driven to Data-driven: A Survey on Active Deep Learning
- arxiv url: http://arxiv.org/abs/2101.09933v1
- Date: Mon, 25 Jan 2021 07:49:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-16 07:21:20.301599
- Title: From Model-driven to Data-driven: A Survey on Active Deep Learning
- Title(参考訳): モデル駆動からデータ駆動へ:アクティブディープラーニングに関する調査
- Authors: Peng Liu, Guojin He, Lei Zhao
- Abstract要約: アクティブ深層学習(adl)は、その予測者が深層モデルである場合に限り、基本的な学習者は予測者と呼ばれ、ラベル付けスキームはセレクタと呼ばれる。
ADLをモデル駆動型ADLとデータ駆動型ADLに分類する。
データ駆動型adlandモデル駆動adlの利点と欠点を徹底的に分析する。
- 参考スコア(独自算出の注目度): 8.75286974962136
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Which samples should be labelled in a large data set is one of the most
important problems for trainingof deep learning. So far, a variety of active
sample selection strategies related to deep learning havebeen proposed in many
literatures. We defined them as Active Deep Learning (ADL) only if
theirpredictor is deep model, where the basic learner is called as predictor
and the labeling schemes iscalled selector. In this survey, three fundamental
factors in selector designation were summarized. Wecategory ADL into
model-driven ADL and data-driven ADL, by whether its selector is model-drivenor
data-driven. The different characteristics of the two major type of ADL were
addressed in indetail respectively. Furthermore, different sub-classes of
data-driven and model-driven ADL are alsosummarized and discussed emphatically.
The advantages and disadvantages between data-driven ADLand model-driven ADL
are thoroughly analyzed. We pointed out that, with the development of
deeplearning, the selector in ADL also is experiencing the stage from
model-driven to data-driven. Finally,we make discussion on ADL about its
uncertainty, explanatory, foundations of cognitive science etc.and survey on
the trend of ADL from model-driven to data-driven.
- Abstract(参考訳): 大規模なデータセットにラベル付けすべきサンプルは、ディープラーニングのトレーニングにおいて最も重要な問題のひとつです。
これまでのところ,多くの文献において,深層学習に関連する様々なサンプル選択戦略が提案されている。
基本学習者が予測者と呼ばれ、ラベル付けスキームがセレクタと呼ばれる深層モデルの場合のみ、アクティブ深層学習(adl)と定義した。
本調査では,セレクタ指定における3つの基本因子を要約した。
ADLをモデル駆動型ADLとデータ駆動型ADLに分類する。
2つの主要なADLの異なる特性は、それぞれindetailで対処された。
さらに、データ駆動型およびモデル駆動型ADLのサブクラスも要約され、実証的に議論される。
データ駆動型adlandモデル駆動adlの利点と欠点を徹底的に分析する。
我々は、ディープラーニングの開発により、ADLのセレクタもモデル駆動からデータ駆動まで段階を経験していると指摘した。
最後に、その不確実性、説明、認知科学の基礎などについて議論し、モデル駆動からデータ駆動へのadlの動向について調査する。
関連論文リスト
- Automated Detection of Algorithm Debt in Deep Learning Frameworks: An Empirical Study [5.6340045820686155]
以前の研究では、ML/DLモデルが、自己受け入れ技術的負債(SATD)と呼ばれるソースコードコメントから技術的負債を検出できることが示されている。
我々の目標は、様々なML/DLモデルのAD検出性能を改善することである。
論文 参考訳(メタデータ) (2024-08-20T04:06:58Z) - LESS: Selecting Influential Data for Targeted Instruction Tuning [64.78894228923619]
本稿では,データの影響を推定し,命令データ選択のための低ランクグレーディエント類似度探索を行うアルゴリズムであるLESSを提案する。
LESS選択したデータの5%のトレーニングは、さまざまなダウンストリームタスクにわたる完全なデータセットでのトレーニングよりも優れています。
我々の方法は、意図した下流アプリケーションに必要な推論スキルを識別するために、表面的なフォームキューを超えています。
論文 参考訳(メタデータ) (2024-02-06T19:18:04Z) - The Why, When, and How to Use Active Learning in Large-Data-Driven 3D
Object Detection for Safe Autonomous Driving: An Empirical Exploration [1.2815904071470705]
エントロピークエリは、リソース制約のある環境でモデル学習を強化するデータを選択するための有望な戦略である。
この結果から,エントロピークエリは資源制約のある環境でのモデル学習を促進するデータ選択に有望な戦略であることが示唆された。
論文 参考訳(メタデータ) (2024-01-30T00:14:13Z) - Querying Easily Flip-flopped Samples for Deep Active Learning [63.62397322172216]
アクティブラーニング(英: Active Learning)は、ラベルのないデータを戦略的に選択してクエリすることで、モデルの性能を向上させることを目的とした機械学習パラダイムである。
効果的な選択戦略の1つはモデルの予測の不確実性に基づくもので、サンプルがどの程度情報的であるかの尺度として解釈できる。
本稿では,予測されたラベルの不一致の最小確率として,最小不一致距離(LDM)を提案する。
論文 参考訳(メタデータ) (2024-01-18T08:12:23Z) - Self-Evolved Diverse Data Sampling for Efficient Instruction Tuning [47.02160072880698]
モデル自体が等しくあるいはそれ以上に効果的であるサブセットを積極的にサンプリングできる自己進化メカニズムを導入します。
データサンプリング技術の鍵は、選択したサブセットの多様性の向上にあります。
3つのデータセットとベンチマークにわたる大規模な実験は、DiverseEvolの有効性を示している。
論文 参考訳(メタデータ) (2023-11-14T14:10:40Z) - Zero-Shot AutoML with Pretrained Models [39.928531675761135]
ドメインに依存しないメタ学習アプローチはゼロショットサロゲートモデルを学ぶ。
提案手法はChaLearn AutoDL Challengeベンチマークの厳密な時間制限の下で評価する。
論文 参考訳(メタデータ) (2022-06-16T22:52:08Z) - Unified Instance and Knowledge Alignment Pretraining for Aspect-based
Sentiment Analysis [96.53859361560505]
Aspect-based Sentiment Analysis (ABSA) は、ある側面に対する感情の極性を決定することを目的としている。
事前トレーニングと下流ABSAデータセットの間には、常に深刻なドメインシフトが存在する。
我々は,バニラ・プレトレイン・ファインチューンパイプラインにアライメント事前訓練フレームワークを導入する。
論文 参考訳(メタデータ) (2021-10-26T04:03:45Z) - Knowledge-driven Active Learning [70.37119719069499]
アクティブな学習戦略は、ディープラーニングモデルをトレーニングするために必要なラベル付きデータの量を最小限にすることを目的としている。
ほとんどの積極的な戦略は不確実なサンプルの選択に基づいており、しばしば決定境界に近いサンプルに制限される。
本稿では、一般的なドメイン知識を考慮し、エキスパートでないユーザがより少ないサンプルでモデルを訓練できるようにする。
論文 参考訳(メタデータ) (2021-10-15T06:11:53Z) - CorDEL: A Contrastive Deep Learning Approach for Entity Linkage [70.82533554253335]
エンティティリンケージ(EL)は、データのクリーニングと統合において重要な問題である。
新たなデータの増加に伴い、ディープラーニング(DL)ベースのアプローチが提案され、従来のモデルに付随するELの高コスト化が図られている。
我々は、ツインネットワークアーキテクチャはELに準最適であり、既存のモデルに固有の欠点をもたらすと主張している。
論文 参考訳(メタデータ) (2020-09-15T16:33:05Z) - Deep Active Learning by Model Interpretability [7.3461534048332275]
本稿では, 線形分離可能なサンプル領域について, アクティブラーニングの課題について紹介する。
モデル解釈可能性(DAMI)を用いた新しい深層能動学習手法を提案する。
ラベルなしデータ全体の最大代表性を維持するため、DAMIは異なる線形分離可能な領域のサンプルを選択してラベル付けしようとする。
論文 参考訳(メタデータ) (2020-07-23T16:06:27Z) - Stance Detection Benchmark: How Robust Is Your Stance Detection? [65.91772010586605]
Stance Detection (StD) は、あるトピックやクレームに対する著者の姿勢を検出することを目的としている。
マルチデータセット学習環境において、さまざまなドメインの10のStDデータセットから学習するStDベンチマークを導入する。
このベンチマーク設定では、5つのデータセットに新しい最先端結果を表示することができます。
論文 参考訳(メタデータ) (2020-01-06T13:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。