論文の概要: On the reusability of samples in active learning
- arxiv url: http://arxiv.org/abs/2206.06276v1
- Date: Mon, 13 Jun 2022 16:03:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-14 18:54:03.337764
- Title: On the reusability of samples in active learning
- Title(参考訳): アクティブラーニングにおけるサンプルの再利用性について
- Authors: Gijs van Tulder and Marco Loog
- Abstract要約: 本稿は, サンプル再利用が実用的関心事である理由, 再利用性が問題となる理由, 再利用性がどのように改善されるかを説明する。
理論的議論と実演により、普遍的再利用は不可能であると主張する。
本稿では,実践における再利用可能性問題の影響を示す,重要度の高いアクティブラーニング実験について述べる。
- 参考スコア(独自算出の注目度): 17.064382683964528
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: An interesting but not extensively studied question in active learning is
that of sample reusability: to what extent can samples selected for one learner
be reused by another? This paper explains why sample reusability is of
practical interest, why reusability can be a problem, how reusability could be
improved by importance-weighted active learning, and which obstacles to
universal reusability remain. With theoretical arguments and practical
demonstrations, this paper argues that universal reusability is impossible.
Because every active learning strategy must undersample some areas of the
sample space, learners that depend on the samples in those areas will learn
more from a random sample selection. This paper describes several experiments
with importance-weighted active learning that show the impact of the
reusability problem in practice. The experiments confirmed that universal
reusability does not exist, although in some cases -- on some datasets and with
some pairs of classifiers -- there is sample reusability. Finally, this paper
explores the conditions that could guarantee the reusability between two
classifiers.
- Abstract(参考訳): アクティブラーニングにおいて、興味深いが広く研究されていない質問は、サンプル再利用可能性である。
本稿では,サンプル再利用性が実用的関心事である理由,再利用性が問題になり得る理由,重要度重み付けアクティブラーニングによる再利用性の向上,普遍的再利用性への障害について述べる。
理論的議論と実演により、普遍的再利用は不可能であると主張する。
アクティブな学習戦略はすべて、サンプルスペースのいくつかの領域を過小評価しなければならないため、これらの領域のサンプルに依存する学習者は、ランダムなサンプル選択からさらに学ぶことができる。
本稿では,実践における再利用可能性問題の影響を示す,重要度の高いアクティブラーニング実験について述べる。
実験では、普遍的な再利用性は存在しないことを確認したが、いくつかのデータセットといくつかの分類器では、サンプル再利用性がある。
最後に,2つの分類器間の再利用性を保証する条件について考察する。
関連論文リスト
- Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Adaptive Experiment Design with Synthetic Controls [79.69661880236293]
そこで我々は,多くのサブポピュレーションのうち,ポジティブな治療効果を有するサブポピュレーションを同定する探索的トライアル設計であるSyntaxを提案する。
我々は,Syntaxの性能を検証し,実験を通じて従来の試行設計よりも有利になる可能性について考察する。
論文 参考訳(メタデータ) (2024-01-30T17:45:47Z) - Even Small Correlation and Diversity Shifts Pose Dataset-Bias Issues [19.4921353136871]
実験サンプルがトレーニング中に見つからないパターンを示す場合の多様性シフトと、テストデータが観察された不変性と急激な特徴の異なる相関を示す場合の相関シフトの2種類について検討した。
そこで我々は,両タイプのシフトをデータセットを用いて分析し,制御可能な方法で共存する統合プロトコルを提案する。
論文 参考訳(メタデータ) (2023-05-09T23:40:23Z) - Using Adaptive Experiments to Rapidly Help Students [5.446351709118483]
我々は、トンプソンサンプリングアルゴリズムを用いて適応実験を行うことで、学生の宿題メールリマインダーの効果を評価する。
適応的ランダム化実験が多かれ少なかれ有用であるような条件について、様々なオープンな疑問を提起する。
論文 参考訳(メタデータ) (2022-08-10T00:43:05Z) - FACT: High-Dimensional Random Forests Inference [4.941630596191806]
ランダム森林学習における個々の特徴の有用性の定量化は、その解釈可能性を大幅に向上させる。
既存の研究では、ランダム森林の特徴的重要度尺度が偏見の問題に悩まされていることが示されている。
本研究では, 自己正規化特徴-残留相関テスト(FACT)の枠組みを提案する。
論文 参考訳(メタデータ) (2022-07-04T19:05:08Z) - Characterizing the robustness of Bayesian adaptive experimental designs
to active learning bias [3.1351527202068445]
本研究では,学習バイアスがベイズ適応型実験設計に悪影響を及ぼすことを示す。
我々は,誤識別に関する情報理論的な尺度を開発し,誤識別の悪さが学習バイアスの重大化を示唆していることを示す。
論文 参考訳(メタデータ) (2022-05-27T01:23:11Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - An Investigation of Replay-based Approaches for Continual Learning [79.0660895390689]
連続学習(CL)は機械学習(ML)の大きな課題であり、破滅的忘れ(CF)を伴わずに連続的に複数のタスクを学習する能力を記述する。
いくつかの解クラスが提案されており、その単純さと堅牢性から、いわゆるリプレイベースのアプローチは非常に有望であるように思われる。
連続学習におけるリプレイに基づくアプローチを実証的に検討し,応用の可能性を評価する。
論文 参考訳(メタデータ) (2021-08-15T15:05:02Z) - Mind Your Outliers! Investigating the Negative Impact of Outliers on
Active Learning for Visual Question Answering [71.15403434929915]
視覚的質問応答のタスクにおいて、5つのモデルと4つのデータセットにまたがって、多種多様な能動的学習アプローチがランダム選択を上回りません。
アクティブな学習手法が好まれるが、モデルは学習に失敗する例の集まりである。
本研究では,アクティブ学習プールにおける集団外乱の減少に伴い,アクティブ学習サンプル効率が著しく向上することを示す。
論文 参考訳(メタデータ) (2021-07-06T00:52:11Z) - Learning to Sample with Local and Global Contexts in Experience Replay
Buffer [135.94190624087355]
遷移の相対的重要性を計算できる学習に基づく新しいサンプリング手法を提案する。
本研究の枠組みは, 様々な非政治強化学習手法の性能を著しく向上させることができることを示す。
論文 参考訳(メタデータ) (2020-07-14T21:12:56Z) - On the Robustness of Active Learning [0.7340017786387767]
Active Learningは、機械学習アルゴリズムをトレーニングする上で最も有用なサンプルを特定する方法に関するものだ。
十分な注意とドメイン知識を持っていないことがよくあります。
そこで本研究では,Simpson の多様性指標に基づく新たな "Sum of Squared Logits" 手法を提案する。
論文 参考訳(メタデータ) (2020-06-18T09:07:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。