論文の概要: Imbalanced Classification under Capacity Constraints
- arxiv url: http://arxiv.org/abs/2605.03289v1
- Date: Tue, 05 May 2026 02:21:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.723977
- Title: Imbalanced Classification under Capacity Constraints
- Title(参考訳): 容量制約下における不均衡分類
- Authors: Daniel Fraiman, Ricardo Fraiman,
- Abstract要約: 主要な関心のクラスは分類設定で不足しており、不均衡なデータ問題を引き起こします。
本稿では,肯定的な予測率を明示的に制御するフレームワークを提案する。
キャパシティ制約を組み込むことで、古典的なアプローチよりも大幅に改善されることが示される。
- 参考スコア(独自算出の注目度): 0.5156484100374058
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many classification settings, the class of primary interest is underrepresented, leading to imbalanced data problems that arise in applications such as rare disease detection and fraud identification. In these contexts, identifying a potential positive instance typically triggers costly follow-up actions, such as medical imaging or detailed transaction inspection, which are subject to limited operational capacity. Motivated by this setting, we consider classification problems where data may arrive sequentially and decisions must be made under constraints on the number of instances that can be selected for further analysis. We propose a classification framework that explicitly controls the rate of positive predictions, enforcing a user-defined bound on the proportion of observations classified as belonging to the minority class while maximizing detection performance. The approach can be implemented using standard learning methods and naturally extends to online settings, where decisions are taken in real time. We show that incorporating capacity constraints leads to substantial improvements over classical approaches, including resampling techniques such as SMOTE, which do not directly control the selection rate.
- Abstract(参考訳): 多くの分類において、一次関心のクラスは不足しており、希少な疾患検出や不正識別などの応用で発生する不均衡なデータ問題の原因となっている。
これらの文脈では、潜在的正のインスタンスを特定することは、通常、医療画像や詳細な取引検査のような、運用能力に制限のあるコストのかかるフォローアップアクションを引き起こす。
この設定により、データの逐次到着や、さらなる分析のために選択できるインスタンス数に関する制約の下で決定を行うという分類問題を考察する。
本稿では,検出性能を最大化しつつ,マイノリティクラスに属するものとして分類された観測率にユーザ定義境界を課し,肯定的な予測率を明示的に制御する分類フレームワークを提案する。
このアプローチは標準的な学習方法を使って実装することができ、オンライン設定に自然に拡張され、意思決定がリアルタイムで行われる。
キャパシティ制約を組み込むことは、選択率を直接制御しないSMOTEのような再サンプリング技術を含む古典的アプローチよりも大幅に改善されることを示す。
関連論文リスト
- Probing Network Decisions: Capturing Uncertainties and Unveiling Vulnerabilities Without Label Information [19.50321703079894]
本稿では, 対実例を用いて分類器の弱点を明らかにするための新しい枠組みを提案する。
本研究では, 画像分類ベンチマークを用いて, 誤分類検出の性能を検証し, その妥当性を検証した。
論文 参考訳(メタデータ) (2025-03-12T05:05:58Z) - Ask for More Than Bayes Optimal: A Theory of Indecisions for Classification [0.8283940114367678]
選択分類におけるミニマックスリスクの完全な評価を行う。
非漸近的保証を伴う有限サンプル校正法を提案する。
ガウス混合物と実際のデータセットの実験により、小さな不確定比がかなりの精度の向上をもたらすことが確認された。
論文 参考訳(メタデータ) (2024-12-17T11:25:51Z) - When Does Confidence-Based Cascade Deferral Suffice? [69.28314307469381]
カスケードは、推論コストをサンプル毎に適応的に変化させる古典的な戦略である。
deferralルールは、シーケンス内の次の分類子を呼び出すか、または予測を終了するかを決定する。
カスケードの構造に執着しているにもかかわらず、信頼に基づく推論は実際は極めてうまく機能することが多い。
論文 参考訳(メタデータ) (2023-07-06T04:13:57Z) - Open-Set Likelihood Maximization for Few-Shot Learning [36.97433312193586]
我々はFew-Shot Open-Set Recognition (FSOSR) 問題、すなわちいくつかのラベル付きサンプルしか持たないクラスのインスタンスを分類する問題に取り組む。
提案手法では,推論時に非競合なクエリインスタンスを利用する。
既存のトランスダクティブ手法はオープンセットのシナリオではうまく動作しないという観測により,最大極大原理の一般化を提案する。
論文 参考訳(メタデータ) (2023-01-20T01:56:19Z) - Benchmarking common uncertainty estimation methods with
histopathological images under domain shift and label noise [62.997667081978825]
リスクの高い環境では、深層学習モデルは不確実性を判断し、誤分類の可能性がかなり高い場合に入力を拒否しなければなりません。
我々は,全スライド画像の分類において,最もよく使われている不確実性と頑健さの厳密な評価を行う。
我々は一般的に,手法のアンサンブルが,ドメインシフトやラベルノイズに対するロバスト性の向上とともに,より良い不確実性評価につながることを観察する。
論文 参考訳(メタデータ) (2023-01-03T11:34:36Z) - Mitigating Algorithmic Bias with Limited Annotations [65.060639928772]
機密属性が公開されていない場合、バイアスを軽減するために、トレーニングデータの小さな部分を手動でアノテートする必要がある。
本稿では,アルゴリズムバイアスの影響を最大限に排除するために,限定アノテーションを誘導する対話型フレームワークであるアクティブペナライゼーション・オブ・差別(APOD)を提案する。
APODは完全なアノテートバイアス緩和と同等のパフォーマンスを示しており、機密情報が制限された場合、APODが現実世界のアプリケーションに利益をもたらすことを実証している。
論文 参考訳(メタデータ) (2022-07-20T16:31:19Z) - Tradeoffs in Streaming Binary Classification under Limited Inspection
Resources [14.178224954581069]
イベントが順次到着し,疑わしいイベントの数が限られている,不均衡なバイナリ分類問題を考える。
マイノリティクラス検出率と検査能力のトレードオフを解析的に特徴付ける。
本研究では,実際の不正検出データセット上での選択手法を実装し,実験結果と解析的境界を比較検討する。
論文 参考訳(メタデータ) (2021-10-05T23:23:11Z) - When in Doubt: Improving Classification Performance with Alternating
Normalization [57.39356691967766]
分類のための非パラメトリック後処理ステップである交互正規化(CAN)を用いた分類を導入する。
CANは、予測されたクラス確率分布を再調整することで、挑戦的な例の分類精度を向上させる。
多様な分類課題にまたがってその効果を実証的に示す。
論文 参考訳(メタデータ) (2021-09-28T02:55:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。