論文の概要: Apple Tasting Revisited: Bayesian Approaches to Partially Monitored Online Binary Classification
- arxiv url: http://arxiv.org/abs/2109.14412v2
- Date: Mon, 22 Apr 2024 16:24:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-24 20:31:21.482527
- Title: Apple Tasting Revisited: Bayesian Approaches to Partially Monitored Online Binary Classification
- Title(参考訳): Appleのテイスティングが再考:Bayesianのオンラインバイナリ分類の部分的監視アプローチ
- Authors: James A. Grant, David S. Leslie,
- Abstract要約: 本稿では,学習者がラベルを未知の真のクラスを持つ項目に逐次割り当てるオンライン二項分類の変種について考察する。
もし学習者がラベルを1ドル選ぶと、すぐにそのアイテムの本当のラベルを観察する。
学習者は、短期分類精度と長期情報ゲインとのトレードオフに直面している。
- 参考スコア(独自算出の注目度): 4.204990010424083
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider a variant of online binary classification where a learner sequentially assigns labels ($0$ or $1$) to items with unknown true class. If, but only if, the learner chooses label $1$ they immediately observe the true label of the item. The learner faces a trade-off between short-term classification accuracy and long-term information gain. This problem has previously been studied under the name of the `apple tasting' problem. We revisit this problem as a partial monitoring problem with side information, and focus on the case where item features are linked to true classes via a logistic regression model. Our principal contribution is a study of the performance of Thompson Sampling (TS) for this problem. Using recently developed information-theoretic tools, we show that TS achieves a Bayesian regret bound of an improved order to previous approaches. Further, we experimentally verify that efficient approximations to TS and Information Directed Sampling via P\'{o}lya-Gamma augmentation have superior empirical performance to existing methods.
- Abstract(参考訳): 学習者がラベル(0ドルまたは1ドル)を未知の真のクラスを持つ項目に逐次割り当てるオンライン二項分類の変種を考える。
もし学習者がラベルを1ドル選ぶと、すぐにそのアイテムの本当のラベルを観察する。
学習者は、短期分類精度と長期情報ゲインとのトレードオフに直面している。
この問題は以前、"apple tasting"問題という名前で研究されてきた。
副次的情報を伴う部分的監視問題としてこの問題を再考し,ロジスティック回帰モデルを用いて項目特徴が真のクラスにリンクされている場合に着目した。
我々の主な貢献は、この問題に対するトンプソンサンプリング(TS)の性能に関する研究である。
最近開発された情報理論ツールを用いて、TSは過去のアプローチに改良された順序のベイズ的後悔境界を達成していることを示す。
さらに,P\'{o}lya-Gamma拡張によるTSとInformation Directed Smplingの効率的な近似が,既存の手法よりも優れた経験的性能を示すことを実験的に検証した。
関連論文リスト
- On Characterizing and Mitigating Imbalances in Multi-Instance Partial Label Learning [57.18649648182171]
我々は、MI-PLLの文脈において、これまで研究されていない問題に対処するためのコントリビューションを行っている。
最小限の仮定をしながら、クラス固有のMI-PLLのリスク境界を導出する。
我々の理論は、$sigma$が学習の不均衡に大きな影響を及ぼすというユニークな現象を明らかにしている。
論文 参考訳(メタデータ) (2024-07-13T20:56:34Z) - Label-Retrieval-Augmented Diffusion Models for Learning from Noisy
Labels [61.97359362447732]
ノイズの多いラベルからの学習は、実際のアプリケーションのための機械学習において、重要かつ長年にわたる問題である。
本稿では,生成モデルの観点からラベルノイズ問題を再構成する。
我々のモデルは、標準的な実世界のベンチマークデータセットで新しいSOTA(State-of-the-art)結果を達成する。
論文 参考訳(メタデータ) (2023-05-31T03:01:36Z) - Revisiting Discriminative vs. Generative Classifiers: Theory and
Implications [37.98169487351508]
本論文はベイズの統計的効率に着想を得たものである。
マルチクラス$mathcalH$-consistency bound frameworkと明示的なロジスティック損失境界を示す。
様々な事前訓練されたディープビジョンモデルの実験は、データの数が増加するにつれて、ナイーブベイズは常に速く収束することを示している。
論文 参考訳(メタデータ) (2023-02-05T08:30:42Z) - Dist-PU: Positive-Unlabeled Learning from a Label Distribution
Perspective [89.5370481649529]
本稿では,PU学習のためのラベル分布視点を提案する。
そこで本研究では,予測型と基底型のラベル分布間のラベル分布の整合性を追求する。
提案手法の有効性を3つのベンチマークデータセットで検証した。
論文 参考訳(メタデータ) (2022-12-06T07:38:29Z) - Label Matching Semi-Supervised Object Detection [85.99282969977541]
半教師対象検出は,教師主導型自己学習の開発において大きな進歩を遂げている。
ラベルミスマッチ問題は、以前の研究でまだ完全に解明されていないため、自己学習中に重大な確証バイアスが生じる。
本稿では,2つの異なる相補的視点から,単純かつ効果的な LabelMatch フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-14T05:59:41Z) - On tuning a mean-field model for semi-supervised classification [0.0]
ラベル付きデータとラベルなしデータの両方が利用可能なシナリオでの学習能力のため、半教師付き学習(SSL)は興味深い研究領域になっている。
分類結果が$beta$に依存するかを調べ、最適位相が利用可能なラベル付きデータの量に大きく依存していることを確認する。
論文 参考訳(メタデータ) (2022-04-28T14:11:55Z) - SparseDet: Improving Sparsely Annotated Object Detection with
Pseudo-positive Mining [76.95808270536318]
Pseudo- positive mining を用いてラベル付き地域とラベルなし地域を分離するエンド・ツー・エンドシステムを提案する。
ラベル付き領域は通常通り処理されるが、ラベルなし領域の処理には自己教師付き学習が使用される。
我々は,PASCAL-VOCとCOCOデータセットの5つの分割に対して,最先端の性能を達成するための徹底的な実験を行った。
論文 参考訳(メタデータ) (2022-01-12T18:57:04Z) - Label, Verify, Correct: A Simple Few Shot Object Detection Method [93.84801062680786]
トレーニングセットから高品質な擬似アノテーションを抽出するための簡単な擬似ラベリング手法を提案する。
擬似ラベリングプロセスの精度を向上させるための2つの新しい手法を提案する。
提案手法は,既存手法と比較して,最先端ないし第2の性能を実現する。
論文 参考訳(メタデータ) (2021-12-10T18:59:06Z) - Active learning for online training in imbalanced data streams under
cold start [0.8155575318208631]
本稿では,クラス不均衡の桁数を持つデータセットに対するアクティブラーニング(AL)アノテーションシステムを提案する。
本稿では,計算効率のよい Outlier-based Discriminative AL approach (ODAL) を提案する。
その結果,提案手法は標準ALポリシーよりも高速に高性能なモデルに到達できることが示唆された。
論文 参考訳(メタデータ) (2021-07-16T06:49:20Z) - Imbalanced Continual Learning with Partitioning Reservoir Sampling [46.427023757892336]
シーケンシャルなデータストリームからの継続的な学習は、機械学習研究にとって重要な課題である。
予測不能な逆性は,多くの多ラベルデータセットにおいて自然に存在し,長い尾の分布を推定する。
本稿では,Reservoir Smpling (PRS) というリプレイ型アプローチのための新しいサンプリング手法を提案する。
論文 参考訳(メタデータ) (2020-09-08T10:28:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。