論文の概要: Multiclass Classification using dilute bandit feedback
- arxiv url: http://arxiv.org/abs/2105.08093v1
- Date: Mon, 17 May 2021 18:05:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-20 04:10:38.868232
- Title: Multiclass Classification using dilute bandit feedback
- Title(参考訳): 希薄帯域フィードバックを用いたマルチクラス分類
- Authors: Gaurav Batra, Naresh Manwani
- Abstract要約: 希薄帯域フィードバック(MC-DBF)を用いたマルチクラス分類アルゴリズムを提案する。
提案アルゴリズムは,候補ラベルセットのサイズ(各ステップ)が m であれば,O(T1-frac1m+2) の誤差を達成できることを示す。
- 参考スコア(独自算出の注目度): 8.452237741722726
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces a new online learning framework for multiclass
classification called learning with diluted bandit feedback. At every time
step, the algorithm predicts a candidate label set instead of a single label
for the observed example. It then receives feedback from the environment
whether the actual label lies in this candidate label set or not. This feedback
is called "diluted bandit feedback". Learning in this setting is even more
challenging than the bandit feedback setting, as there is more uncertainty in
the supervision. We propose an algorithm for multiclass classification using
dilute bandit feedback (MC-DBF), which uses the exploration-exploitation
strategy to predict the candidate set in each trial. We show that the proposed
algorithm achieves O(T^{1-\frac{1}{m+2}}) mistake bound if candidate label set
size (in each step) is m. We demonstrate the effectiveness of the proposed
approach with extensive simulations.
- Abstract(参考訳): 本稿では,バンディットフィードバックの希薄化を伴う学習という,マルチクラス分類のための新しいオンライン学習フレームワークを提案する。
時間ステップ毎に、アルゴリズムは観測された例の単一のラベルではなく、候補ラベルセットを予測する。
そして、実際のラベルがこの候補ラベルセットにあるかどうかに関わらず、環境からフィードバックを受け取る。
このフィードバックは "diluted bandit feedback" と呼ばれる。
この環境での学習は、監視に不確実性があるため、盗賊のフィードバック設定よりもさらに難しい。
本稿では, 探索探索探索戦略を用いて, 試行錯誤フィードバック(MC-DBF)を用いたマルチクラス分類法を提案する。
提案手法が(各ステップにおいて)候補ラベル集合のサイズが m であれば, o(t^{1-\frac{1}{m+2}}) の誤りバウンドを達成することを示す。
関連論文リスト
- Partial-Label Regression [54.74984751371617]
部分ラベル学習は、弱い教師付き学習環境であり、各トレーニング例に候補ラベルのセットをアノテートすることができる。
部分ラベル学習に関する従来の研究は、候補ラベルがすべて離散的な分類設定のみに焦点を当てていた。
本稿では,各トレーニング例に実値付き候補ラベルのセットをアノテートした部分ラベル回帰を初めて検討する。
論文 参考訳(メタデータ) (2023-06-15T09:02:24Z) - Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label
Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。
本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:52:18Z) - M-Tuning: Prompt Tuning with Mitigated Label Bias in Open-Set Scenarios [103.6153593636399]
緩和ラベルバイアス(M-Tuning)を用いた視覚言語プロンプトチューニング手法を提案する。
これはWordNetからのオープンワードを導入し、クローズドセットラベルワードのみからもっと多くのプロンプトテキストを形成する単語の範囲を広げ、シミュレートされたオープンセットシナリオでプロンプトをチューニングする。
提案手法は,様々なスケールのデータセット上で最高の性能を達成し,広範囲にわたるアブレーション研究もその有効性を検証した。
論文 参考訳(メタデータ) (2023-03-09T09:05:47Z) - Learning with Proper Partial Labels [87.65718705642819]
部分ラベル学習は、不正確なラベルを持つ弱い教師付き学習の一種である。
この適切な部分ラベル学習フレームワークには,従来の部分ラベル学習設定が数多く含まれていることを示す。
次に、分類リスクの統一的非バイアス推定器を導出する。
論文 参考訳(メタデータ) (2021-12-23T01:37:03Z) - Multi-Objective Interpolation Training for Robustness to Label Noise [17.264550056296915]
標準教師付きコントラスト学習はラベル雑音の存在下で劣化することを示す。
コントラスト学習により学習したロバストな特徴表現を利用する新しいラベルノイズ検出手法を提案する。
合成および実世界のノイズベンチマークの実験は、MOIT/MOIT+が最先端の結果を得ることを示した。
論文 参考訳(メタデータ) (2020-12-08T15:01:54Z) - One-bit Supervision for Image Classification [121.87598671087494]
1ビットの監視は、不完全なアノテーションから学ぶための新しい設定である。
負ラベル抑圧を既成の半教師付き学習アルゴリズムに組み込んだ多段階学習パラダイムを提案する。
論文 参考訳(メタデータ) (2020-09-14T03:06:23Z) - Reliable Label Bootstrapping for Semi-Supervised Learning [19.841733658911767]
ReLaBは教師なしプレプロセッシングアルゴリズムであり、極めて低い監督条件下での半教師付きアルゴリズムの性能を改善する。
本稿では,ネットワークアーキテクチャと自己教師型アルゴリズムの選択が,ラベルの伝播を成功させる重要な要因であることを示す。
CIFAR-10のクラス毎に1つのランダムなラベル付きサンプルを持つ$boldsymbol22.34$の平均エラー率に達し、各クラスのラベル付きサンプルが非常に代表的である場合に、このエラーを$boldsymbol8.46$に下げる。
論文 参考訳(メタデータ) (2020-07-23T08:51:37Z) - Learning Multiclass Classifier Under Noisy Bandit Feedback [6.624726878647541]
本研究では,非バイアス推定手法に基づく雑音の多い帯域フィードバックに対処する新しい手法を提案する。
いくつかのベンチマークデータセットに対する広範な実験により,提案手法の有効性を示す。
論文 参考訳(メタデータ) (2020-06-05T16:31:05Z) - Unsupervised Person Re-identification via Multi-label Classification [55.65870468861157]
本稿では,教師なしのReIDを多ラベル分類タスクとして定式化し,段階的に真のラベルを求める。
提案手法は,まず,各人物画像に単一クラスラベルを割り当てることから始まり,ラベル予測のために更新されたReIDモデルを活用することで,多ラベル分類へと進化する。
マルチラベル分類におけるReIDモデルのトレーニング効率を高めるために,メモリベースマルチラベル分類損失(MMCL)を提案する。
論文 参考訳(メタデータ) (2020-04-20T12:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。