論文の概要: Active Classification with Uncertainty Comparison Queries
- arxiv url: http://arxiv.org/abs/2008.00645v2
- Date: Wed, 28 Oct 2020 11:07:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 05:47:41.840539
- Title: Active Classification with Uncertainty Comparison Queries
- Title(参考訳): 不確実性比較クエリによるアクティブ分類
- Authors: Zhenghang Cui, Issei Sato
- Abstract要約: 本稿では,提案するオラクルと肯定的比較オラクルを用いた効率的な適応ラベリングアルゴリズムを提案する。
また,提案アルゴリズムをアクティブな学習アルゴリズムにプラグインすることで,データセットサイズと比較してラベル付け予算が不十分な状況にも対処する。
- 参考スコア(独自算出の注目度): 28.088914485737924
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Noisy pairwise comparison feedback has been incorporated to improve the
overall query complexity of interactively learning binary classifiers. The
\textit{positivity comparison oracle} is used to provide feedback on which is
more likely to be positive given a pair of data points. Because it is
impossible to infer accurate labels using this oracle alone \textit{without
knowing the classification threshold}, existing methods still rely on the
traditional \textit{explicit labeling oracle}, which directly answers the label
given a data point. Existing methods conduct sorting on all data points and use
explicit labeling oracle to find the classification threshold. The current
methods, however, have two drawbacks: (1) they needs unnecessary sorting for
label inference; (2) quick sort is naively adapted to noisy feedback and
negatively affects practical performance. In order to avoid this inefficiency
and acquire information of the classification threshold, we propose a new
pairwise comparison oracle concerning uncertainties. This oracle receives two
data points as input and answers which one has higher uncertainty. We then
propose an efficient adaptive labeling algorithm using the proposed oracle and
the positivity comparison oracle. In addition, we also address the situation
where the labeling budget is insufficient compared to the dataset size, which
can be dealt with by plugging the proposed algorithm into an active learning
algorithm. Furthermore, we confirm the feasibility of the proposed oracle and
the performance of the proposed algorithm theoretically and empirically.
- Abstract(参考訳): 対話的にバイナリ分類器を学習するクエリ全体の複雑さを改善するために、ペアワイズ比較フィードバックが組み込まれている。
データポイントのペアを考えると、より肯定的である可能性が高いフィードバックを提供するために、textit{positivity comparison oracle} が使用される。
このオラクルだけで正確なラベルを推測することは不可能であり、分類しきい値を知ることなく、既存のメソッドは、データポイントを与えられたラベルに直接答える従来の \textit{explicit labeling oracle} に依存している。
既存の方法はすべてのデータポイントをソートし、明示的なラベル付けオラクルを使用して分類しきい値を見つける。
しかし,現在の手法では,(1)ラベル推論の不要なソートが必要であり,(2)クイックソートがノイズフィードバックに適応し,実用性能に悪影響を及ぼすという欠点がある。
この非効率を回避し、分類しきい値の情報を入手するために、不確実性に関する新しいペアワイズ比較オラクルを提案する。
このオラクルは2つのデータポイントを、高い不確実性を持つ入力と答えとして受け取る。
そこで我々は,提案したオラクルと肯定的比較オラクルを用いた適応ラベリングアルゴリズムを提案する。
さらに,提案するアルゴリズムをアクティブラーニングアルゴリズムにプラグインすることで処理可能なデータセットサイズに対して,ラベリング予算が不十分な状況にも対処する。
さらに,提案するオラクルの実現可能性と提案アルゴリズムの性能を理論的,実証的に検証する。
関連論文リスト
- Drawing the Same Bounding Box Twice? Coping Noisy Annotations in Object
Detection with Repeated Labels [6.872072177648135]
そこで本研究では,基礎的真理推定手法に適合する新しい局所化アルゴリズムを提案する。
また,本アルゴリズムは,TexBiGデータセット上でのトレーニングにおいて,優れた性能を示す。
論文 参考訳(メタデータ) (2023-09-18T13:08:44Z) - Text Summarization with Oracle Expectation [88.39032981994535]
抽出要約は、文書の中で最も重要な文を識別し、連結することによって要約を生成する。
ほとんどの要約データセットは、文書文が要約に値するかどうかを示す金のラベルを持っていない。
本稿では,ソフトな予測に基づく文ラベルを生成する,シンプルで効果的なラベル付けアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-26T14:10:08Z) - Adaptive Sampling for Heterogeneous Rank Aggregation from Noisy Pairwise
Comparisons [85.5955376526419]
ランキングアグリゲーション問題では、各項目を比較する際に、様々な精度レベルが示される。
本稿では,ノイズのあるペアワイズ比較によってアイテムのランクを推定する,除去に基づくアクティブサンプリング戦略を提案する。
提案アルゴリズムは,商品の真のランキングを高い確率で返却できることを示す。
論文 参考訳(メタデータ) (2021-10-08T13:51:55Z) - Unsupervised Label Refinement Improves Dataless Text Classification [48.031421660674745]
データレステキスト分類は、ラベル記述と組み合わせた文書にスコアを割り当てることで、文書を未確認のラベルに分類することができる。
有望ながら、それは重要なダウンストリームタスクごとにラベルセットの正確な説明に依存します。
この依存により、データレス分類器はラベル記述の選択に非常に敏感になり、実際にはデータレス分類の幅広い適用を妨げる。
論文 参考訳(メタデータ) (2020-12-08T03:37:50Z) - Pointwise Binary Classification with Pairwise Confidence Comparisons [97.79518780631457]
ペアワイズ比較(Pcomp)分類を提案し、ラベルのないデータのペアしか持たない。
我々はPcomp分類をノイズラベル学習に結びつけて、進歩的UREを開発し、一貫性の正則化を課すことにより改善する。
論文 参考訳(メタデータ) (2020-10-05T09:23:58Z) - Interaction Matching for Long-Tail Multi-Label Classification [57.262792333593644]
既存のマルチラベル分類モデルにおいて,制約に対処するためのエレガントで効果的なアプローチを提案する。
ソフトなn-gram相互作用マッチングを実行することで、ラベルと自然言語記述をマッチングする。
論文 参考訳(メタデータ) (2020-05-18T15:27:55Z) - Noise-tolerant, Reliable Active Classification with Comparison Queries [25.725730509014355]
本研究では,大規模なデータプールにアクセス可能なアルゴリズムが,どのサンプルにラベルを付けるかを適応的に選択できる,アクティブラーニングのパラダイムについて検討する。
本研究では,有界(マサート)雑音に頑健な非同次線形分離器を学習するためのアルゴリズムを初めて提案する。
論文 参考訳(メタデータ) (2020-01-15T19:00:00Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。