論文の概要: Mitigating sampling bias in risk-based active learning via an EM
algorithm
- arxiv url: http://arxiv.org/abs/2206.12598v1
- Date: Sat, 25 Jun 2022 08:48:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-28 14:23:48.738433
- Title: Mitigating sampling bias in risk-based active learning via an EM
algorithm
- Title(参考訳): emアルゴリズムによるリスクベースアクティブラーニングにおけるサンプリングバイアスの軽減
- Authors: Aidan J. Hughes, Lawrence A. Bull, Paul Gardner, Nikolaos Dervilis,
Keith Worden
- Abstract要約: リスクベースのアクティブラーニングは、オンライン意思決定支援のための統計分類器を開発するためのアプローチである。
データラベルクエリは、初期データポイントに対する完全情報の期待値に応じてガイドされる。
半教師付きアプローチは、EMアルゴリズムを介して未ラベルデータの擬似ラベルを組み込むことでサンプリングバイアスに対処する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Risk-based active learning is an approach to developing statistical
classifiers for online decision-support. In this approach, data-label querying
is guided according to the expected value of perfect information for incipient
data points. For SHM applications, the value of information is evaluated with
respect to a maintenance decision process, and the data-label querying
corresponds to the inspection of a structure to determine its health state.
Sampling bias is a known issue within active-learning paradigms; this occurs
when an active learning process over- or undersamples specific regions of a
feature-space, thereby resulting in a training set that is not representative
of the underlying distribution. This bias ultimately degrades decision-making
performance, and as a consequence, results in unnecessary costs incurred. The
current paper outlines a risk-based approach to active learning that utilises a
semi-supervised Gaussian mixture model. The semi-supervised approach
counteracts sampling bias by incorporating pseudo-labels for unlabelled data
via an EM algorithm. The approach is demonstrated on a numerical example
representative of the decision processes found in SHM.
- Abstract(参考訳): リスクベースのアクティブラーニングは、オンライン意思決定支援のための統計分類器を開発するためのアプローチである。
このアプローチでは,データポイントに対する完全情報の期待値に応じて,データラベルクエリを導出する。
SHMアプリケーションの場合、メンテナンス決定プロセスに関して情報の価値を評価し、データラベルクエリは構造検査に対応してその状態を決定する。
これは、アクティブな学習プロセスが特徴空間の特定の領域をオーバーサンプリングまたはアンサンプする場合に起こり、その結果、基礎となる分布を代表していないトレーニングセットとなる。
このバイアスは最終的に意思決定のパフォーマンスを低下させ、結果として不要なコストが発生する。
本稿では,半教師付きガウス混合モデルを用いたアクティブラーニングへのリスクベースアプローチについて概説する。
半教師付きアプローチは、EMアルゴリズムを介して未ラベルデータの擬似ラベルを組み込むことでサンプリングバイアスに対処する。
この手法は、SHMで見つかった決定過程の数値的な例で示される。
関連論文リスト
- Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Querying Easily Flip-flopped Samples for Deep Active Learning [63.62397322172216]
アクティブラーニング(英: Active Learning)は、ラベルのないデータを戦略的に選択してクエリすることで、モデルの性能を向上させることを目的とした機械学習パラダイムである。
効果的な選択戦略の1つはモデルの予測の不確実性に基づくもので、サンプルがどの程度情報的であるかの尺度として解釈できる。
本稿では,予測されたラベルの不一致の最小確率として,最小不一致距離(LDM)を提案する。
論文 参考訳(メタデータ) (2024-01-18T08:12:23Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - MAPS: A Noise-Robust Progressive Learning Approach for Source-Free
Domain Adaptive Keypoint Detection [76.97324120775475]
クロスドメインキーポイント検出方法は、常に適応中にソースデータにアクセスする必要がある。
本稿では、ターゲット領域に十分に訓練されたソースモデルのみを提供する、ソースフリーなドメイン適応キーポイント検出について考察する。
論文 参考訳(メタデータ) (2023-02-09T12:06:08Z) - Stream-based active learning with linear models [0.7734726150561089]
生産において、製品情報を取得するためにランダム検査を行う代わりに、ラベルなしデータの情報内容を評価することによりラベルを収集する。
本稿では,ストリームベースのシナリオを学習者に順次提供するための新たな戦略を提案する。
未ラベルデータポイントの通知性にしきい値を設定することにより、意思決定プロセスの反復的な側面に取り組む。
論文 参考訳(メタデータ) (2022-07-20T13:15:23Z) - Improving decision-making via risk-based active learning: Probabilistic
discriminative classifiers [0.0]
監視されたシステムの状態に対応する測定データの記述ラベルは、しばしば利用できない。
この問題に対処する1つのアプローチは、リスクベースのアクティブラーニングである。
本論文では,識別モデルを用いた代替型分類器の利点について述べる。
論文 参考訳(メタデータ) (2022-06-23T10:51:42Z) - Self-Certifying Classification by Linearized Deep Assignment [65.0100925582087]
そこで我々は,PAC-Bayesリスク認定パラダイム内で,グラフ上のメトリックデータを分類するための新しい深層予測器のクラスを提案する。
PAC-Bayesの最近の文献とデータに依存した先行研究に基づいて、この手法は仮説空間上の後続分布の学習を可能にする。
論文 参考訳(メタデータ) (2022-01-26T19:59:14Z) - On robust risk-based active-learning algorithms for enhanced decision
support [0.0]
分類モデルは、構造的健康モニタリング(SHM)システムやデジタルツインなどの物理資産管理技術の基本的な構成要素である。
本稿では,サンプリングバイアスの効果に対処する2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2022-01-07T17:25:41Z) - Learning Bias-Invariant Representation by Cross-Sample Mutual
Information Minimization [77.8735802150511]
対象タスクが誤用したバイアス情報を除去するために,クロスサンプル対逆脱バイアス法(CSAD)を提案する。
相関測定は, 対向的偏り評価において重要な役割を担い, クロスサンプル型相互情報推定器によって行われる。
我々は,提案手法の最先端手法に対する利点を検証するために,公開データセットの徹底的な実験を行った。
論文 参考訳(メタデータ) (2021-08-11T21:17:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。