論文の概要: Reliable Programmatic Weak Supervision with Confidence Intervals for Label Probabilities
- arxiv url: http://arxiv.org/abs/2508.03896v1
- Date: Tue, 05 Aug 2025 20:34:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-07 20:09:22.437938
- Title: Reliable Programmatic Weak Supervision with Confidence Intervals for Label Probabilities
- Title(参考訳): ラベル確率に対する信頼区間を持つ信頼度プログラム弱スーパービジョン
- Authors: Verónica Álvarez, Santiago Mazuelas, Steven An, Sanjoy Dasgupta,
- Abstract要約: 本稿では,ラベル確率の信頼区間を提供し,より信頼性の高い予測を行うプログラム弱監視手法を提案する。
複数のベンチマークデータセットを用いた実験により,提案手法の最先端性の向上と,提示される信頼区間の実用性を示した。
- 参考スコア(独自算出の注目度): 15.228186072614049
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The accurate labeling of datasets is often both costly and time-consuming. Given an unlabeled dataset, programmatic weak supervision obtains probabilistic predictions for the labels by leveraging multiple weak labeling functions (LFs) that provide rough guesses for labels. Weak LFs commonly provide guesses with assorted types and unknown interdependences that can result in unreliable predictions. Furthermore, existing techniques for programmatic weak supervision cannot provide assessments for the reliability of the probabilistic predictions for labels. This paper presents a methodology for programmatic weak supervision that can provide confidence intervals for label probabilities and obtain more reliable predictions. In particular, the methods proposed use uncertainty sets of distributions that encapsulate the information provided by LFs with unrestricted behavior and typology. Experiments on multiple benchmark datasets show the improvement of the presented methods over the state-of-the-art and the practicality of the confidence intervals presented.
- Abstract(参考訳): データセットの正確なラベル付けは、しばしばコストと時間がかかります。
ラベル付きデータセットが与えられた場合、プログラムによる弱い監督は、ラベルに対する大まかな推測を提供する複数の弱いラベル機能(LF)を活用することで、ラベルに対する確率的予測を得る。
弱LFは、一般に、信頼できない予測をもたらす可能性のある、類型と未知の補間による推測を提供する。
さらに,プログラム的弱監督のための既存の手法では,ラベルの確率的予測の信頼性を評価できない。
本稿では,ラベル確率の信頼区間を提供し,より信頼性の高い予測を行うプログラム弱監視手法を提案する。
特に,提案手法では,LFが提供した情報に制約のない動作や型をカプセル化した不確実性分布を用いている。
複数のベンチマークデータセットを用いた実験は,提案手法の最先端化と,提示される信頼区間の実用性を示す。
関連論文リスト
- Improving realistic semi-supervised learning with doubly robust estimation [8.828699635463265]
Semi-Supervised Learning (SSL)における大きな課題は、ラベルなしデータのクラス分布に関する制限された情報である。
本稿では,有限次元パラメータである無ラベルなクラス分布を,強い理論的保証を持つ2重頑健な推定器を用いて明示的に推定することを提案する。
この推定値を既存の手法に統合して、トレーニング中のラベルなしデータをより正確に擬似ラベル付けすることができる。
論文 参考訳(メタデータ) (2025-02-01T02:34:12Z) - Credible Teacher for Semi-Supervised Object Detection in Open Scene [106.25850299007674]
Open Scene Semi-Supervised Object Detection (O-SSOD)では、ラベル付きデータはラベル付きデータで観測されていない未知のオブジェクトを含む可能性がある。
より不確実性が、偽ラベルのローカライズと分類精度の低下につながるため、主に自己学習に依存する現在の手法には有害である。
我々は,不確実な擬似ラベルがモデルに誤解をもたらすのを防ぐための,エンドツーエンドのフレームワークであるCredible Teacherを提案する。
論文 参考訳(メタデータ) (2024-01-01T08:19:21Z) - Binary Classification with Confidence Difference [100.08818204756093]
本稿では,信頼性差分法 (ConfDiff) という,弱教師付き二項分類問題について考察する。
本稿では,この問題に対処するためのリスク一貫性のあるアプローチを提案し,推定誤差が最適収束率と一致することを示す。
また,整合性や収束率も証明されたオーバーフィッティング問題を緩和するためのリスク補正手法も導入する。
論文 参考訳(メタデータ) (2023-10-09T11:44:50Z) - Conservative Prediction via Data-Driven Confidence Minimization [70.93946578046003]
機械学習の安全性クリティカルな応用においては、モデルが保守的であることが望ましいことが多い。
本研究では,不確実性データセットに対する信頼性を最小化するデータ駆動信頼性最小化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-08T07:05:36Z) - Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label
Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。
本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:52:18Z) - Gray Learning from Non-IID Data with Out-of-distribution Samples [45.788789553551176]
専門家が注釈を付けたとしても、トレーニングデータの完全性は保証されていない。
我々は,基本真実と相補的ラベルを両立させる新しいアプローチであるtextitGray Learningを導入する。
統計学習理論における我々のアプローチを基礎として、一般化誤差の境界を導出し、GLが非IID設定でも厳密な制約を達成できることを実証する。
論文 参考訳(メタデータ) (2022-06-19T10:46:38Z) - Conformal Credal Self-Supervised Learning [7.170735702082675]
半教師付き学習において、自己学習のパラダイムとは、学習者自身が提案する擬似ラベルから学習することを指す。
そのような方法の1つは、いわゆるクレダル自己教師学習であり、ラベル上の(単体ではなく)確率分布の集合の形で擬超越性を維持している。
論文 参考訳(メタデータ) (2022-05-30T16:53:16Z) - Predictive Inference with Weak Supervision [3.1925030748447747]
コンフォメーション予測フレームワークを開発することにより,部分監督と検証のギャップを埋める。
我々は、新しいカバレッジと予測妥当性の概念を導入し、いくつかのアプリケーションシナリオを開発します。
我々は、新しいカバレッジ定義がより厳密で情報的な(しかし有効な)信頼セットを可能にするという仮説を裏付ける。
論文 参考訳(メタデータ) (2022-01-20T17:26:52Z) - A Gentle Introduction to Conformal Prediction and Distribution-Free
Uncertainty Quantification [1.90365714903665]
このハンズオン導入は、配布不要なUQの実践的な実装に関心のある読者を対象としている。
PyTorch構文で、Pythonで説明的なイラストやサンプル、コードサンプルを多数含みます。
論文 参考訳(メタデータ) (2021-07-15T17:59:50Z) - Distribution-free uncertainty quantification for classification under
label shift [105.27463615756733]
2つの経路による分類問題に対する不確実性定量化(UQ)に焦点を当てる。
まず、ラベルシフトはカバレッジとキャリブレーションの低下を示すことでuqを損なうと論じる。
これらの手法を, 理論上, 分散性のない枠組みで検討し, その優れた実用性を示す。
論文 参考訳(メタデータ) (2021-03-04T20:51:03Z) - Evaluating probabilistic classifiers: Reliability diagrams and score
decompositions revisited [68.8204255655161]
確率的に統計的に一貫性があり、最適に結合し、再現可能な信頼性図を自動生成するCORP手法を導入する。
コーパスは非パラメトリックアイソトニック回帰に基づいており、プール・アジャセント・ヴァイオレータ(PAV)アルゴリズムによって実装されている。
論文 参考訳(メタデータ) (2020-08-07T08:22:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。