論文の概要: Online Learning with Set-Valued Feedback
- arxiv url: http://arxiv.org/abs/2306.06247v3
- Date: Sun, 19 Nov 2023 22:15:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-22 19:12:34.974581
- Title: Online Learning with Set-Valued Feedback
- Title(参考訳): 集合価値フィードバックによるオンライン学習
- Authors: Vinod Raman, Unique Subedi, Ambuj Tewari
- Abstract要約: 学習者は1つのラベルを予測するが、フィードバックとしてラベルのテキストセットを受け取る。
このモデルでは、学習者は、明らかにされた集合に含まれるラベルを出力しないようペナル化される。
単一ラベルフィードバックによるオンラインマルチクラス学習とは異なり、決定論的かつランダムなオンライン学習は、実現可能な環境ではテキストと同等であることを示す。
- 参考スコア(独自算出の注目度): 20.291598040396302
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study a variant of online multiclass classification where the learner
predicts a single label but receives a \textit{set of labels} as feedback. In
this model, the learner is penalized for not outputting a label contained in
the revealed set. We show that unlike online multiclass learning with
single-label feedback, deterministic and randomized online learnability are
\textit{not equivalent} in the realizable setting under set-valued feedback. In
addition, we show that deterministic and randomized realizable learnability are
equivalent if the Helly number of the collection of sets that can be revealed
as feedback is finite. In light of this separation, we give two new
combinatorial dimensions, named the Set Littlestone and Measure Shattering
dimension, whose finiteness characterizes deterministic and randomized
realizable learnability respectively. Additionally, these dimensions lower- and
upper bound the deterministic and randomized minimax regret in the realizable
setting. Going beyond the realizable setting, we prove that the Measure
shattering dimension continues to characterize learnability and quantify
minimax regret in the agnostic setting. Finally, we use our results to
establish bounds on the minimax regret for three practical learning settings:
online multilabel ranking, online multilabel classification, and real-valued
prediction with interval-valued response.
- Abstract(参考訳): 学習者が1つのラベルを予測するが、フィードバックとして \textit{set of labels} を受け取るオンラインマルチクラス分類の変種を調査した。
このモデルでは、明らかにされた集合に含まれるラベルを出力しないために学習者がペナルティを課される。
単一ラベルフィードバックによるオンラインマルチクラス学習とは異なり、決定論的かつランダム化されたオンライン学習能力は、集合的フィードバックの下で実現可能な設定において \textit{not equivalent} である。
さらに、決定論的かつランダムな実現可能学習性は、フィードバックとして明らかにできる集合の集合のヘリー数が有限であれば同値であることを示す。
この分離を考慮に入れ、我々は2つの新しい組合せ次元、すなわち集合リトルストーンと測度シェータリングの次元を与え、その有限性はそれぞれ決定論的およびランダムに実現可能な可学習性を特徴づける。
さらに、これらの次元は、決定論的でランダム化されたミニマックスの後悔を、実現可能な設定で下界と上界に制限する。
実現可能な設定を超えて、測定値の破砕次元が学習性を特徴づけ続け、不可知的な設定におけるミニマックス後悔を定量化する。
最後に,オンラインマルチラベルランキング,オンラインマルチラベル分類,インターバル値応答による実数値予測という3つの実践的学習環境において,ミニマックス後悔の限界を確立するために実験結果を用いた。
関連論文リスト
- Probably Approximately Precision and Recall Learning [62.912015491907994]
精度とリコールは機械学習の基本的な指標である。
一方的なフィードバック – トレーニング中にのみ肯定的な例が観察される – は,多くの実践的な問題に固有のものだ。
PAC学習フレームワークでは,各仮説をグラフで表現し,エッジは肯定的な相互作用を示す。
論文 参考訳(メタデータ) (2024-11-20T04:21:07Z) - Smoothed Online Classification can be Harder than Batch Classification [18.054632903107546]
オンライン学習の円滑化は,PACモデルに基づくiidバッチ設定の学習と同じくらい容易であることを示す。
PACモデルではiidバッチ設定で学習できるが,スムーズなオンラインモデルでは学習できない仮説クラスを構築した。
論文 参考訳(メタデータ) (2024-05-24T10:37:39Z) - Pseudo-Labeling and Contextual Curriculum Learning for Online Grasp
Learning in Robotic Bin Picking [47.4409816260196]
SSL-ConvSACは、半教師付き学習と強化学習を組み合わせて、オンライングリップラーニングを行う。
実機7-DoFのフランカ・エミカロボットアームに吸引グリップを装着することで,ビンピッキングタスクにおけるオンライングリップ学習を改善することを実証する。
論文 参考訳(メタデータ) (2024-03-04T21:41:27Z) - One-bit Supervision for Image Classification: Problem, Solution, and
Beyond [114.95815360508395]
本稿では,ラベルの少ない新しい学習環境である,画像分類のための1ビット監督について述べる。
多段階学習パラダイムを提案し、負ラベル抑圧を半教師付き半教師付き学習アルゴリズムに組み込む。
複数のベンチマークにおいて、提案手法の学習効率は、フルビットの半教師付き監視手法よりも優れている。
論文 参考訳(メタデータ) (2023-11-26T07:39:00Z) - A Combinatorial Characterization of Supervised Online Learnability [20.291598040396302]
本稿では,任意だが有界な損失関数に対する仮説クラスのオンライン学習可能性について検討する。
連続最小次元と呼ばれる新しいスケール感性次元を与え、オンライン学習可能性の厳密な定量的評価を与えることを示す。
論文 参考訳(メタデータ) (2023-07-07T20:11:07Z) - Label Inference Attack against Split Learning under Regression Setting [24.287752556622312]
回帰モデルのシナリオにおいて,プライベートラベルが連続数である場合の漏洩について検討する。
グラデーション情報と追加学習正規化目標を統合した,新たな学習ベースアタックを提案する。
論文 参考訳(メタデータ) (2023-01-18T03:17:24Z) - Maximising the Utility of Validation Sets for Imbalanced Noisy-label
Meta-learning [16.318123642642075]
本稿では,その有効性を最大化して検証セットを自動的に構築する不均衡な雑音ラベルメタラーニング(INOLML)アルゴリズムを提案する。
提案手法は,従来のメタラーニング手法よりも大幅に改善され,いくつかのベンチマークで新たな最先端を設定できる。
論文 参考訳(メタデータ) (2022-08-17T08:02:53Z) - Label Matching Semi-Supervised Object Detection [85.99282969977541]
半教師対象検出は,教師主導型自己学習の開発において大きな進歩を遂げている。
ラベルミスマッチ問題は、以前の研究でまだ完全に解明されていないため、自己学習中に重大な確証バイアスが生じる。
本稿では,2つの異なる相補的視点から,単純かつ効果的な LabelMatch フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-14T05:59:41Z) - One Positive Label is Sufficient: Single-Positive Multi-Label Learning
with Label Enhancement [71.9401831465908]
本研究では,SPMLL (Single- positive multi-label learning) について検討した。
ラベルエンハンスメントを用いた単陽性MultIラベル学習という新しい手法を提案する。
ベンチマークデータセットの実験により,提案手法の有効性が検証された。
論文 参考訳(メタデータ) (2022-06-01T14:26:30Z) - Contrastive Test-Time Adaptation [83.73506803142693]
本稿では,自己指導型コントラスト学習を活用して特徴学習を支援する新しい手法を提案する。
擬似ラベルをオンラインで作成し、ターゲットのフィーチャースペースに最も近い隣人の間でソフト投票によってそれらを洗練します。
我々の手法であるAdaContrastは、主要なベンチマーク上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-04-21T19:17:22Z) - SLADE: A Self-Training Framework For Distance Metric Learning [75.54078592084217]
我々は、追加のラベルのないデータを活用することで、検索性能を向上させるための自己学習フレームワークSLADEを提案する。
まず、ラベル付きデータに基づいて教師モデルをトレーニングし、ラベルなしデータに対して擬似ラベルを生成する。
次に、最終機能埋め込みを生成するために、ラベルと擬似ラベルの両方で学生モデルをトレーニングします。
論文 参考訳(メタデータ) (2020-11-20T08:26:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。