論文の概要: Online Learning with Set-Valued Feedback
- arxiv url: http://arxiv.org/abs/2306.06247v2
- Date: Thu, 29 Jun 2023 20:04:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-03 14:51:27.263932
- Title: Online Learning with Set-Valued Feedback
- Title(参考訳): 集合価値フィードバックによるオンライン学習
- Authors: Vinod Raman, Unique Subedi, Ambuj Tewari
- Abstract要約: 学習者は1つのラベルを予測するが、フィードバックとしてラベルのテキストセットを受け取る。
単一ラベルフィードバックによるオンラインマルチクラス学習とは異なり、決定論的かつランダムなオンライン学習は、実現可能な設定においてもテキストと同等であることを示す。
- 参考スコア(独自算出の注目度): 17.11922027966447
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study a variant of online multiclass classification where the learner
predicts a single label but receives a \textit{set of labels} as feedback. In
this model, the learner is penalized for not outputting a label contained in
the revealed set. We show that unlike online multiclass learning with
single-label feedback, deterministic and randomized online learnability are
\textit{not equivalent} even in the realizable setting with set-valued
feedback. Accordingly, we give two new combinatorial dimensions, named the Set
Littlestone and Measure Shattering dimension, that tightly characterize
deterministic and randomized online learnability respectively in the realizable
setting. In addition, we show that the Measure Shattering dimension tightly
characterizes online learnability in the agnostic setting. Finally, we show
that practical learning settings like online multilabel ranking, online
multilabel classification, and online interval learning are specific instances
of our general framework.
- Abstract(参考訳): 学習者が1つのラベルを予測するが、フィードバックとして \textit{set of labels} を受け取るオンラインマルチクラス分類の変種を調査した。
このモデルでは、明らかにされた集合に含まれるラベルを出力しないために学習者がペナルティを課される。
単一ラベルフィードバックによるオンラインマルチクラス学習とは異なり、決定論的かつランダム化されたオンライン学習能力は、セット値フィードバックで実現可能な設定でも \textit{not equivalent} である。
そこで我々は, 決定論的およびランダムなオンライン学習を, 実現可能な設定でそれぞれ特徴付ける2つの新しい組合せ次元, Set Littlestone と Measure Shattering を提示する。
さらに,測定シェータリング次元は,非依存的な環境下でのオンライン学習性を強く特徴付けることを示す。
最後に,オンラインマルチラベルランキング,オンラインマルチラベル分類,オンラインインターバル学習といった実践的な学習環境が,我々の汎用フレームワークの具体例であることを示す。
関連論文リスト
- Probably Approximately Precision and Recall Learning [62.912015491907994]
精度とリコールは機械学習の基本的な指標である。
一方的なフィードバック – トレーニング中にのみ肯定的な例が観察される – は,多くの実践的な問題に固有のものだ。
PAC学習フレームワークでは,各仮説をグラフで表現し,エッジは肯定的な相互作用を示す。
論文 参考訳(メタデータ) (2024-11-20T04:21:07Z) - Smoothed Online Classification can be Harder than Batch Classification [18.054632903107546]
オンライン学習の円滑化は,PACモデルに基づくiidバッチ設定の学習と同じくらい容易であることを示す。
PACモデルではiidバッチ設定で学習できるが,スムーズなオンラインモデルでは学習できない仮説クラスを構築した。
論文 参考訳(メタデータ) (2024-05-24T10:37:39Z) - Pseudo-Labeling and Contextual Curriculum Learning for Online Grasp
Learning in Robotic Bin Picking [47.4409816260196]
SSL-ConvSACは、半教師付き学習と強化学習を組み合わせて、オンライングリップラーニングを行う。
実機7-DoFのフランカ・エミカロボットアームに吸引グリップを装着することで,ビンピッキングタスクにおけるオンライングリップ学習を改善することを実証する。
論文 参考訳(メタデータ) (2024-03-04T21:41:27Z) - One-bit Supervision for Image Classification: Problem, Solution, and
Beyond [114.95815360508395]
本稿では,ラベルの少ない新しい学習環境である,画像分類のための1ビット監督について述べる。
多段階学習パラダイムを提案し、負ラベル抑圧を半教師付き半教師付き学習アルゴリズムに組み込む。
複数のベンチマークにおいて、提案手法の学習効率は、フルビットの半教師付き監視手法よりも優れている。
論文 参考訳(メタデータ) (2023-11-26T07:39:00Z) - A Combinatorial Characterization of Supervised Online Learnability [20.291598040396302]
本稿では,任意だが有界な損失関数に対する仮説クラスのオンライン学習可能性について検討する。
連続最小次元と呼ばれる新しいスケール感性次元を与え、オンライン学習可能性の厳密な定量的評価を与えることを示す。
論文 参考訳(メタデータ) (2023-07-07T20:11:07Z) - Label Inference Attack against Split Learning under Regression Setting [24.287752556622312]
回帰モデルのシナリオにおいて,プライベートラベルが連続数である場合の漏洩について検討する。
グラデーション情報と追加学習正規化目標を統合した,新たな学習ベースアタックを提案する。
論文 参考訳(メタデータ) (2023-01-18T03:17:24Z) - Maximising the Utility of Validation Sets for Imbalanced Noisy-label
Meta-learning [16.318123642642075]
本稿では,その有効性を最大化して検証セットを自動的に構築する不均衡な雑音ラベルメタラーニング(INOLML)アルゴリズムを提案する。
提案手法は,従来のメタラーニング手法よりも大幅に改善され,いくつかのベンチマークで新たな最先端を設定できる。
論文 参考訳(メタデータ) (2022-08-17T08:02:53Z) - Label Matching Semi-Supervised Object Detection [85.99282969977541]
半教師対象検出は,教師主導型自己学習の開発において大きな進歩を遂げている。
ラベルミスマッチ問題は、以前の研究でまだ完全に解明されていないため、自己学習中に重大な確証バイアスが生じる。
本稿では,2つの異なる相補的視点から,単純かつ効果的な LabelMatch フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-14T05:59:41Z) - One Positive Label is Sufficient: Single-Positive Multi-Label Learning
with Label Enhancement [71.9401831465908]
本研究では,SPMLL (Single- positive multi-label learning) について検討した。
ラベルエンハンスメントを用いた単陽性MultIラベル学習という新しい手法を提案する。
ベンチマークデータセットの実験により,提案手法の有効性が検証された。
論文 参考訳(メタデータ) (2022-06-01T14:26:30Z) - Contrastive Test-Time Adaptation [83.73506803142693]
本稿では,自己指導型コントラスト学習を活用して特徴学習を支援する新しい手法を提案する。
擬似ラベルをオンラインで作成し、ターゲットのフィーチャースペースに最も近い隣人の間でソフト投票によってそれらを洗練します。
我々の手法であるAdaContrastは、主要なベンチマーク上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-04-21T19:17:22Z) - SLADE: A Self-Training Framework For Distance Metric Learning [75.54078592084217]
我々は、追加のラベルのないデータを活用することで、検索性能を向上させるための自己学習フレームワークSLADEを提案する。
まず、ラベル付きデータに基づいて教師モデルをトレーニングし、ラベルなしデータに対して擬似ラベルを生成する。
次に、最終機能埋め込みを生成するために、ラベルと擬似ラベルの両方で学生モデルをトレーニングします。
論文 参考訳(メタデータ) (2020-11-20T08:26:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。