論文の概要: Efficient Failure Pattern Identification of Predictive Algorithms
- arxiv url: http://arxiv.org/abs/2306.00760v1
- Date: Thu, 1 Jun 2023 14:54:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-02 15:26:11.751384
- Title: Efficient Failure Pattern Identification of Predictive Algorithms
- Title(参考訳): 予測アルゴリズムの効率的な故障パターン同定
- Authors: Bao Nguyen, Viet Anh Nguyen
- Abstract要約: 本稿では,人間のアノテータチームとシーケンシャルレコメンデーションアルゴリズムからなる人間機械協調フレームワークを提案する。
その結果、様々な信号対雑音比で複数のデータセット上でのフレームワークの競合性能を実証的に実証した。
- 参考スコア(独自算出の注目度): 15.02620042972929
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Given a (machine learning) classifier and a collection of unlabeled data, how
can we efficiently identify misclassification patterns presented in this
dataset? To address this problem, we propose a human-machine collaborative
framework that consists of a team of human annotators and a sequential
recommendation algorithm. The recommendation algorithm is conceptualized as a
stochastic sampler that, in each round, queries the annotators a subset of
samples for their true labels and obtains the feedback information on whether
the samples are misclassified. The sampling mechanism needs to balance between
discovering new patterns of misclassification (exploration) and confirming the
potential patterns of classification (exploitation). We construct a
determinantal point process, whose intensity balances the
exploration-exploitation trade-off through the weighted update of the posterior
at each round to form the generator of the stochastic sampler. The numerical
results empirically demonstrate the competitive performance of our framework on
multiple datasets at various signal-to-noise ratios.
- Abstract(参考訳): 機械学習)分類器とラベルなしデータの集合が与えられた場合、このデータセットで提示される誤分類パターンを効率的に識別するにはどうすればよいのか?
この問題に対処するために,人間のアノテーションと逐次レコメンデーションアルゴリズムからなるヒューマンマシン協調フレームワークを提案する。
推薦アルゴリズムは確率的サンプリングとして概念化され、各ラウンドでアノテータに真のラベルのサンプルのサブセットを問い合わせ、サンプルが誤分類されているかどうかのフィードバック情報を取得する。
サンプリングメカニズムは、新しい分類パターンの発見(探索)と潜在的な分類パターンの確認(探索)のバランスをとる必要がある。
我々は,各ラウンドにおける後方の重み付け更新により,探索・探索トレードオフのバランスを保ち,確率的サンプリング器の発電機を形成する決定点プロセスを構築した。
その結果,様々な信号-雑音比で複数のデータセット上でのフレームワークの競合性能を実証した。
関連論文リスト
- Pairwise Similarity Distribution Clustering for Noisy Label Learning [0.0]
ノイズラベル学習は、ノイズラベルを持つ大量のサンプルを使用してディープニューラルネットワークをトレーニングすることを目的としている。
トレーニングサンプルを1つのクリーンなセットと別のノイズのあるセットに分割する,単純で効果的なサンプル選択アルゴリズムを提案する。
CIFAR-10、CIFAR-100、Clothing1Mといった様々なベンチマークデータセットの実験結果は、最先端の手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-04-02T11:30:22Z) - Sampling Audit Evidence Using a Naive Bayes Classifier [0.0]
本研究は,機械学習とサンプリングを統合することで,サンプリング手法を進歩させる。
機械学習の統合は、サンプリングバイアスを避け、ランダム性と可変性を保ち、リスクサンプルをターゲットする。
論文 参考訳(メタデータ) (2024-03-21T01:35:03Z) - Generator Born from Classifier [66.56001246096002]
データサンプルに頼ることなく、イメージジェネレータを再構築することを目指している。
本稿では,ネットワークパラメータの収束条件を満たすために,ジェネレータを訓練する新しい学習パラダイムを提案する。
論文 参考訳(メタデータ) (2023-12-05T03:41:17Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Neighbour Consistency Guided Pseudo-Label Refinement for Unsupervised
Person Re-Identification [80.98291772215154]
教師なしの人物再識別(ReID)は、アノテーションを使わずに人物検索のための識別的アイデンティティの特徴を学習することを目的としている。
近年の進歩はクラスタリングに基づく擬似ラベルを活用することで実現されている。
本稿では, Pseudo Label Refinement フレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-30T09:39:57Z) - Resolving label uncertainty with implicit posterior models [71.62113762278963]
本稿では,データサンプルのコレクション間でラベルを共同で推論する手法を提案する。
異なる予測子を後部とする生成モデルの存在を暗黙的に仮定することにより、弱い信念の下での学習を可能にする訓練目標を導出する。
論文 参考訳(メタデータ) (2022-02-28T18:09:44Z) - Assessing the Quality of the Datasets by Identifying Mislabeled Samples [14.881597737762316]
本稿では,各データ点の品質を測る指標として,新しい統計値(ノイズスコア)を提案する。
本研究では,データ品質管理型変分オートエンコーダ(AQUAVS)の推論ネットワークから導出される表現を用いる。
我々は、MNIST、FashionMNIST、CIFAR10/100データセットを破損させることにより、提案した統計データを検証した。
論文 参考訳(メタデータ) (2021-09-10T17:14:09Z) - Visualizing Classifier Adjacency Relations: A Case Study in Speaker
Verification and Voice Anti-Spoofing [72.4445825335561]
任意のバイナリ分類器によって生成される検出スコアから2次元表現を導出する簡単な方法を提案する。
ランク相関に基づいて,任意のスコアを用いた分類器の視覚的比較を容易にする。
提案手法は完全に汎用的であり,任意の検出タスクに適用可能だが,自動話者検証と音声アンチスプーフィングシステムによるスコアを用いた手法を実証する。
論文 参考訳(メタデータ) (2021-06-11T13:03:33Z) - Pattern Sampling for Shapelet-based Time Series Classification [4.94950858749529]
時系列分類アルゴリズムは、正確かつ解釈可能なモデルを提供する。
これらのアルゴリズムは、高度に識別されたサブシーケンスの徹底的な探索に基づいている。
パターン爆発現象を緩和するための効果的な代替手段としてパターンサンプリングが提案されている。
論文 参考訳(メタデータ) (2021-02-16T23:35:10Z) - CONSAC: Robust Multi-Model Fitting by Conditional Sample Consensus [62.86856923633923]
我々は,同じ形状の複数のパラメトリックモデルを雑音測定に適合させる頑健な推定器を提案する。
複数のモデル検出のための手作り検索戦略を利用する従来の研究とは対照的に,データから検索戦略を学習する。
探索の自己教師付き学習において,提案したアルゴリズムをマルチホログラフィー推定で評価し,最先端手法よりも優れた精度を示す。
論文 参考訳(メタデータ) (2020-01-08T17:37:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。