論文の概要: Achieving Unbiased Multi-Instance Learning via Balanced Fine-Grained Positive-Unlabeled Learning
- arxiv url: http://arxiv.org/abs/2503.13562v2
- Date: Tue, 17 Jun 2025 04:34:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-18 15:22:20.315718
- Title: Achieving Unbiased Multi-Instance Learning via Balanced Fine-Grained Positive-Unlabeled Learning
- Title(参考訳): バランスの取れた正の正の学習を通して、偏りのないマルチインスタンス学習を実現する
- Authors: Lin-Han Jia, Lan-Zhe Guo, Zhi Zhou, Si-Ye Han, Zi-Wen Li, Yu-Feng Li,
- Abstract要約: 現実世界のアプリケーションでは、それらに含まれる情報が極めて限られている場合、異常なサンプルを検出することはしばしば困難である。
そこで本研究では,MIL問題を,より微細な正極無ラベル学習問題(PU)に変換できることを考察した。
この変換により、マイクロレベルのバランス機構を用いて、不均衡問題にバイアスのない方法で対処できる。
- 参考スコア(独自算出の注目度): 46.44686264442672
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In real-world applications, it is often challenging to detect anomalous samples when the anomalous information they contain is extremely limited. In such cases, both macro-level and micro-level detection using multi-instance learning (MIL) encounter significant difficulties. The former struggles because normal and anomalous samples are highly similar and hard to distinguish at the macro level, while the latter is limited by the lack of labels at the micro level. In MIL, micro-level labels are inferred from macro-level labels, which can lead to severe bias. Moreover, the more imbalanced the distribution between normal and anomalous samples, the more pronounced these limitations become. In this study, we observe that the MIL problem can be elegantly transformed into a fine-grained Positive-Unlabeled (PU) learning problem. This transformation allows us to address the imbalance issue in an unbiased manner using a micro-level balancing mechanism. To this end, we propose a novel framework-Balanced Fine-Grained Positive-Unlabeled (BFGPU)-based on rigorous theoretical foundations to address the challenges above. Extensive experiments on both public and real-world datasets demonstrate the effectiveness of BFGPU, which outperforms existing methods, even in extreme scenarios where both macro and micro-level distributions are highly imbalanced. The code is open-sourced at https://github.com/BFGPU/BFGPU.
- Abstract(参考訳): 現実世界のアプリケーションでは、それらを含む異常な情報が極めて限られている場合、異常なサンプルを検出することはしばしば困難である。
このような場合、MIL(Multi-Instance Learning)を用いたマクロレベルおよびマイクロレベルの検出は、大きな困難に直面する。
前者は、正常なサンプルと異常なサンプルがマクロレベルで非常に類似しており、区別が難しいため、後者はマイクロレベルでのラベルの欠如によって制限されている。
MILでは、マイクロレベルのラベルはマクロレベルのラベルから推測され、重大なバイアスを引き起こす可能性がある。
さらに、正常なサンプルと異常なサンプルの分布が不均衡になればなるほど、これらの制限はより顕著になる。
本研究では,MIL問題を細粒度正極無ラベル(PU)学習問題にエレガントに変換できることを示す。
この変換により、マイクロレベルのバランス機構を用いて、不均衡問題にバイアスのない方法で対処できる。
そこで本研究では,厳密な理論的基礎に基づくフレームワークベースファイングラインド・ポジティブ・アンラベル(BFGPU)を提案する。
公開と実世界の両方のデータセットに対する大規模な実験は、マクロレベルの分布とマイクロレベルの分布が極めて不均衡な極端なシナリオであっても、既存の手法よりも優れたBFGPUの有効性を示す。
コードはhttps://github.com/BFGPU/BFGPUで公開されている。
関連論文リスト
- FairSAM: Fair Classification on Corrupted Data Through Sharpness-Aware Minimization [12.178322948983263]
クリーンなデータに基づいてトレーニングされた画像分類モデルは、しばしば、破損したデータをテストする際に大きなパフォーマンス劣化に悩まされる。
この劣化は全体的なパフォーマンスに影響を及ぼすだけでなく、様々な階層のサブグループに不均等に影響を与え、重要なアルゴリズムバイアスの懸念を引き起こす。
既存の公平性を意識した機械学習手法は、性能格差を減らすことを目的としているが、データの破損に直面した場合、堅牢で公平な精度を維持することは困難である。
我々は、アンダーラインFairnessを指向した戦略をアンダーラインSAMに統合した新しいフレームワークである textbfFairSAM を提案する。
論文 参考訳(メタデータ) (2025-03-29T01:51:59Z) - Ensemble Debiasing Across Class and Sample Levels for Fairer Prompting Accuracy [17.610305828703957]
言語モデルは、強力な数発の学習者であり、テキスト分類タスクにおいて、全体的な精度が良好である。
本稿では,クラス確率のフレキシブルな修正を実現するために,ポストホック非線形整数計画に基づくデバイアス法を提案する。
本手法は,バランスの取れたクラスアキュラシーを用いて,最先端の総合的精度向上を実現する。
論文 参考訳(メタデータ) (2025-03-07T05:34:31Z) - Learning with Imbalanced Noisy Data by Preventing Bias in Sample
Selection [82.43311784594384]
実世界のデータセットには、ノイズの多いラベルだけでなく、クラス不均衡も含まれている。
不均衡なデータセットにおけるノイズラベルに対処する,単純かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-02-17T10:34:53Z) - Learning with Complementary Labels Revisited: The Selected-Completely-at-Random Setting Is More Practical [66.57396042747706]
補完ラベル学習は、弱教師付き学習問題である。
均一分布仮定に依存しない一貫したアプローチを提案する。
相補的なラベル学習は、負のラベル付きバイナリ分類問題の集合として表現できる。
論文 参考訳(メタデータ) (2023-11-27T02:59:17Z) - Revisiting Class Imbalance for End-to-end Semi-Supervised Object
Detection [1.6249267147413524]
半教師付きオブジェクト検出(SSOD)は、擬似ラベルに基づくエンドツーエンド手法の開発において大きな進歩を遂げている。
多くの手法は、擬似ラベルジェネレータの有効性を妨げるクラス不均衡のため、課題に直面している。
本稿では,低品質な擬似ラベルの根本原因と,ラベル生成品質を改善するための新しい学習メカニズムについて検討する。
論文 参考訳(メタデータ) (2023-06-04T06:01:53Z) - Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label
Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。
本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:52:18Z) - SoftMatch: Addressing the Quantity-Quality Trade-off in Semi-supervised
Learning [101.86916775218403]
本稿では, サンプル重み付けを統一した定式化により, 一般的な擬似ラベル法を再検討する。
トレーニング中の擬似ラベルの量と質を両立させることでトレードオフを克服するSoftMatchを提案する。
実験では、画像、テキスト、不均衡な分類など、さまざまなベンチマークで大幅に改善されている。
論文 参考訳(メタデータ) (2023-01-26T03:53:25Z) - Uncertainty-aware Pseudo-label Selection for Positive-Unlabeled Learning [10.014356492742074]
本稿では,正の未ラベル学習環境における不均衡データセットとモデル校正の問題に取り組むことを提案する。
マイノリティクラスからのシグナルを増強することにより、擬似ラベル付けはラベル付きデータセットをラベル付きデータセットから新しいサンプルで拡張する。
PUUPLは一連の実験において、高度に不均衡な設定で大幅な性能向上をもたらす。
論文 参考訳(メタデータ) (2022-01-31T12:55:47Z) - On Positive-Unlabeled Classification in GAN [130.43248168149432]
本稿では,標準GANに対する肯定的かつ未ラベルの分類問題を定義する。
その後、GANにおける差別者の訓練を安定させる新しい手法が導かれる。
論文 参考訳(メタデータ) (2020-02-04T05:59:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。