論文の概要: Online Learning with Set-Valued Feedback
- arxiv url: http://arxiv.org/abs/2306.06247v4
- Date: Tue, 18 Jun 2024 22:11:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-22 09:00:25.016930
- Title: Online Learning with Set-Valued Feedback
- Title(参考訳): セットバリューフィードバックによるオンライン学習
- Authors: Vinod Raman, Unique Subedi, Ambuj Tewari,
- Abstract要約: 学習者は1つのラベルを予測するが、フィードバックとしてラベルのテキストセットを受け取る。
単一ラベルフィードバックによるオンラインマルチクラス学習とは異なり、決定論的かつランダムなオンライン学習は、実現可能な設定においてもテキストと同等であることを示す。
- 参考スコア(独自算出の注目度): 18.054632903107546
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study a variant of online multiclass classification where the learner predicts a single label but receives a \textit{set of labels} as feedback. In this model, the learner is penalized for not outputting a label contained in the revealed set. We show that unlike online multiclass learning with single-label feedback, deterministic and randomized online learnability are \textit{not equivalent} even in the realizable setting with set-valued feedback. Accordingly, we give two new combinatorial dimensions, named the Set Littlestone and Measure Shattering dimension, that tightly characterize deterministic and randomized online learnability respectively in the realizable setting. In addition, we show that the Measure Shattering dimension characterizes online learnability in the agnostic setting and tightly quantifies the minimax regret. Finally, we use our results to establish bounds on the minimax regret for three practical learning settings: online multilabel ranking, online multilabel classification, and real-valued prediction with interval-valued response.
- Abstract(参考訳): 学習者は1つのラベルを予測するが、フィードバックとして‘textit{set of labels’を受信する。
このモデルでは、学習者は、明らかにされた集合に含まれるラベルを出力しないようペナル化される。
単一ラベルフィードバックによるオンラインマルチクラス学習とは異なり、決定論的かつランダム化されたオンライン学習容易性は、セット値フィードバックによる実現可能な設定であっても、 \textit{not equivalent} であることを示す。
そこで我々は, 決定論的およびランダムなオンライン学習を, 実現可能な設定でそれぞれ特徴付ける, Set Littlestone と Measure Shattering の2つの新しい組合せ次元を与える。
さらに、測定シェータリング次元は、非依存設定におけるオンライン学習性を特徴付け、ミニマックス後悔を厳格に定量化することを示す。
最後に, オンラインマルチラベルランキング, オンラインマルチラベル分類, 間隔値応答を用いた実数値予測という3つの実践的学習環境において, ミニマックス後悔の限界を確立するために, 実験結果を用いた。
関連論文リスト
- Smoothed Online Classification can be Harder than Batch Classification [18.054632903107546]
オンライン学習の円滑化は,PACモデルに基づくiidバッチ設定の学習と同じくらい容易であることを示す。
PACモデルではiidバッチ設定で学習できるが,スムーズなオンラインモデルでは学習できない仮説クラスを構築した。
論文 参考訳(メタデータ) (2024-05-24T10:37:39Z) - Pseudo-Labeling and Contextual Curriculum Learning for Online Grasp
Learning in Robotic Bin Picking [47.4409816260196]
SSL-ConvSACは、半教師付き学習と強化学習を組み合わせて、オンライングリップラーニングを行う。
実機7-DoFのフランカ・エミカロボットアームに吸引グリップを装着することで,ビンピッキングタスクにおけるオンライングリップ学習を改善することを実証する。
論文 参考訳(メタデータ) (2024-03-04T21:41:27Z) - Match me if you can: Semantic Correspondence Learning with Unpaired
Images [82.05105090432025]
制限された画像対とスパース点対の両方を補完する、ラベルのないペアでトレーニングを行う、単純で効果的な方法を提案する。
簡単な教師/学生の枠組みを用いて,学生ネットワークに信頼性の高い擬似通信を機械の監督を通じて提供する。
我々のモデルは,セマンティック対応ベンチマークの最先端手法を含む,マイルストーンベースラインを上回ります。
論文 参考訳(メタデータ) (2023-11-30T13:22:15Z) - One-bit Supervision for Image Classification: Problem, Solution, and
Beyond [114.95815360508395]
本稿では,ラベルの少ない新しい学習環境である,画像分類のための1ビット監督について述べる。
多段階学習パラダイムを提案し、負ラベル抑圧を半教師付き半教師付き学習アルゴリズムに組み込む。
複数のベンチマークにおいて、提案手法の学習効率は、フルビットの半教師付き監視手法よりも優れている。
論文 参考訳(メタデータ) (2023-11-26T07:39:00Z) - A Combinatorial Characterization of Supervised Online Learnability [20.291598040396302]
本稿では,任意だが有界な損失関数に対する仮説クラスのオンライン学習可能性について検討する。
連続最小次元と呼ばれる新しいスケール感性次元を与え、オンライン学習可能性の厳密な定量的評価を与えることを示す。
論文 参考訳(メタデータ) (2023-07-07T20:11:07Z) - Label Inference Attack against Split Learning under Regression Setting [24.287752556622312]
回帰モデルのシナリオにおいて,プライベートラベルが連続数である場合の漏洩について検討する。
グラデーション情報と追加学習正規化目標を統合した,新たな学習ベースアタックを提案する。
論文 参考訳(メタデータ) (2023-01-18T03:17:24Z) - Maximising the Utility of Validation Sets for Imbalanced Noisy-label
Meta-learning [16.318123642642075]
本稿では,その有効性を最大化して検証セットを自動的に構築する不均衡な雑音ラベルメタラーニング(INOLML)アルゴリズムを提案する。
提案手法は,従来のメタラーニング手法よりも大幅に改善され,いくつかのベンチマークで新たな最先端を設定できる。
論文 参考訳(メタデータ) (2022-08-17T08:02:53Z) - Label Matching Semi-Supervised Object Detection [85.99282969977541]
半教師対象検出は,教師主導型自己学習の開発において大きな進歩を遂げている。
ラベルミスマッチ問題は、以前の研究でまだ完全に解明されていないため、自己学習中に重大な確証バイアスが生じる。
本稿では,2つの異なる相補的視点から,単純かつ効果的な LabelMatch フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-14T05:59:41Z) - One Positive Label is Sufficient: Single-Positive Multi-Label Learning
with Label Enhancement [71.9401831465908]
本研究では,SPMLL (Single- positive multi-label learning) について検討した。
ラベルエンハンスメントを用いた単陽性MultIラベル学習という新しい手法を提案する。
ベンチマークデータセットの実験により,提案手法の有効性が検証された。
論文 参考訳(メタデータ) (2022-06-01T14:26:30Z) - Contrastive Test-Time Adaptation [83.73506803142693]
本稿では,自己指導型コントラスト学習を活用して特徴学習を支援する新しい手法を提案する。
擬似ラベルをオンラインで作成し、ターゲットのフィーチャースペースに最も近い隣人の間でソフト投票によってそれらを洗練します。
我々の手法であるAdaContrastは、主要なベンチマーク上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-04-21T19:17:22Z) - SLADE: A Self-Training Framework For Distance Metric Learning [75.54078592084217]
我々は、追加のラベルのないデータを活用することで、検索性能を向上させるための自己学習フレームワークSLADEを提案する。
まず、ラベル付きデータに基づいて教師モデルをトレーニングし、ラベルなしデータに対して擬似ラベルを生成する。
次に、最終機能埋め込みを生成するために、ラベルと擬似ラベルの両方で学生モデルをトレーニングします。
論文 参考訳(メタデータ) (2020-11-20T08:26:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。