論文の概要: Exact Reformulation and Optimization for Direct Metric Optimization in Binary Imbalanced Classification
- arxiv url: http://arxiv.org/abs/2507.15240v1
- Date: Mon, 21 Jul 2025 04:52:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 20:51:32.258497
- Title: Exact Reformulation and Optimization for Direct Metric Optimization in Binary Imbalanced Classification
- Title(参考訳): 2元不均衡分類における厳密な修正と直接メートル法最適化
- Authors: Le Peng, Yash Travadi, Chuan He, Ying Cui, Ju Sun,
- Abstract要約: 本稿では,2つの重要な分類基準である精度とリコールについて,実用的な2値IC設定の下で検討する。
インジケータ関数を扱うためにスムーズな近似に依存する既存の手法とは異なり、textitweはこれらの直接計量最適化(DMO)問題に対して、初めて厳密な制約付き修正を導入する。
- 参考スコア(独自算出の注目度): 10.140989590842224
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: For classification with imbalanced class frequencies, i.e., imbalanced classification (IC), standard accuracy is known to be misleading as a performance measure. While most existing methods for IC resort to optimizing balanced accuracy (i.e., the average of class-wise recalls), they fall short in scenarios where the significance of classes varies or certain metrics should reach prescribed levels. In this paper, we study two key classification metrics, precision and recall, under three practical binary IC settings: fix precision optimize recall (FPOR), fix recall optimize precision (FROP), and optimize $F_\beta$-score (OFBS). Unlike existing methods that rely on smooth approximations to deal with the indicator function involved, \textit{we introduce, for the first time, exact constrained reformulations for these direct metric optimization (DMO) problems}, which can be effectively solved by exact penalty methods. Experiment results on multiple benchmark datasets demonstrate the practical superiority of our approach over the state-of-the-art methods for the three DMO problems. We also expect our exact reformulation and optimization (ERO) framework to be applicable to a wide range of DMO problems for binary IC and beyond. Our code is available at https://github.com/sun-umn/DMO.
- Abstract(参考訳): 不均衡なクラス周波数の分類、すなわち不均衡な分類(IC)の場合、標準精度は性能指標として誤解を招くことが知られている。
IC手法の多くは、バランスの取れた精度を最適化する(すなわち、クラスレベルのリコールの平均)が、クラスの重要性が変化するシナリオや特定のメトリクスが所定のレベルに達するシナリオでは不足している。
本稿では,FPOR,FROP,FF_\beta$-score(OFBS)の3つの実用的な2値IC設定の下で,2つの重要な分類基準,精度とリコールについて検討する。
インジケータ関数を扱うためのスムーズな近似に依存する既存の手法とは異なり、 \textit{weは、これらの直接距離最適化(DMO)問題に対する厳密な制約付き修正を初めて導入し、正確なペナルティ法によって効果的に解ける。
複数のベンチマークデータセットの実験結果から,DMO問題に対する最先端手法に対するアプローチの実用的優位性を示す。
また、我々のEROフレームワークは、バイナリIC以降の幅広いDMO問題にも適用できると期待しています。
私たちのコードはhttps://github.com/sun-umn/DMOで公開されています。
関連論文リスト
- DSTC: Direct Preference Learning with Only Self-Generated Tests and Code to Improve Code LMs [56.4979142807426]
UnderlinetextbfDirect Preference Learning with only underlinetextbfSelf-Generated underlinetextbfTests and underlinetextbfCode (DSTC)を紹介する。
DSTCは自己生成コードスニペットとテストのみを使用して信頼性の高い選好ペアを構築する。
論文 参考訳(メタデータ) (2024-11-20T02:03:16Z) - POPoS: Improving Efficient and Robust Facial Landmark Detection with Parallel Optimal Position Search [34.50794776762681]
本稿では,高精度符号化・復号化フレームワークであるParallel Optimal Position Search (POPoS)を紹介する。
Pseudo-range multilaterationは、ヒートマップエラーの修正に使われ、ランドマークのローカライゼーション精度が向上する。
1ステップの並列計算アルゴリズムを導入し、計算効率を高め、処理時間を短縮する。
論文 参考訳(メタデータ) (2024-10-12T16:28:40Z) - Benchmarking Large Language Model Uncertainty for Prompt Optimization [4.151658495779136]
本稿では,不確実性指標を評価するためのベンチマークデータセットを提案する。
現在のメトリクスは、正当性不確実性ではなく、出力の信頼性と多様性を反映したアンサー不確実性とより一致していることを示します。
論文 参考訳(メタデータ) (2024-09-16T07:13:30Z) - Geometric-Averaged Preference Optimization for Soft Preference Labels [78.2746007085333]
LLMを人間の嗜好と整合させる多くのアルゴリズムは、人間の嗜好は二進的かつ決定論的であると仮定する。
本研究では,分散ソフトな選好ラベルを導入し,損失関数におけるLLM出力確率の重み付き幾何平均を用いて直接選好最適化(DPO)を改善する。
論文 参考訳(メタデータ) (2024-09-10T17:54:28Z) - Optimal Baseline Corrections for Off-Policy Contextual Bandits [61.740094604552475]
オンライン報酬指標の偏りのないオフライン推定を最適化する意思決定ポリシーを学習することを目指している。
学習シナリオにおける同値性に基づく単一のフレームワークを提案する。
我々のフレームワークは、分散最適非バイアス推定器の特徴付けを可能にし、それに対する閉形式解を提供する。
論文 参考訳(メタデータ) (2024-05-09T12:52:22Z) - Lower-Left Partial AUC: An Effective and Efficient Optimization Metric
for Recommendation [52.45394284415614]
我々は,AUCのように計算効率が良く,Top-Kランキングの指標と強く相関する新しい最適化指標であるLLPAUCを提案する。
LLPAUCはローワーレフト角のROC曲線の下の部分領域のみを考慮し、最適化はトップKに焦点をあてる。
論文 参考訳(メタデータ) (2024-02-29T13:58:33Z) - Adaptive Neural Ranking Framework: Toward Maximized Business Goal for
Cascade Ranking Systems [33.46891569350896]
カスケードランキングは、オンライン広告とレコメンデーションシステムにおける大規模なトップk選択問題に広く使われている。
それまでの学習からランクへの取り組みは、モデルに完全な順序やトップクオーダを学習させることに重点を置いていた。
我々はこの手法をアダプティブ・ニューラルランキング・フレームワーク (Adaptive Neural Ranking Framework, ARF) と命名する。
論文 参考訳(メタデータ) (2023-10-16T14:43:02Z) - Adaptive manifold for imbalanced transductive few-shot learning [16.627512688664513]
適応マニフォールド(Adaptive Manifold)という,不均衡なトランスダクティブ・ショット・ラーニングに対処する新しいアルゴリズムを提案する。
提案手法は,ラベル付きサポート例とラベルなしクエリの基盤となる多様体を利用して,クエリごとのクラス確率分布を予測する。
論文 参考訳(メタデータ) (2023-04-27T15:42:49Z) - Accurate and Reliable Methods for 5G UAV Jamming Identification With
Calibrated Uncertainty [3.4208659698673127]
不確実性を考慮せずに精度を上げるだけで、Deep Neural Network(DNN)の意思決定に悪影響を及ぼす可能性がある。
本稿では,時系列二項分類問題に対する前処理と後処理の5つの組み合わせを提案する。
論文 参考訳(メタデータ) (2022-11-05T15:04:45Z) - Optimizing Partial Area Under the Top-k Curve: Theory and Practice [151.5072746015253]
トップk曲線下部分領域(AUTKC)と呼ばれる新しい計量法を開発した。
AUTKCはより優れた識別能力を持ち、ベイズ最適スコア関数は条件付き確率に対して正しいトップKランクを与えることができる。
提案手法を最適化するために,実証的なサロゲートリスク最小化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-03T11:09:13Z) - Learning with Multiclass AUC: Theory and Algorithms [141.63211412386283]
ROC曲線 (AUC) の下の領域は、不均衡学習やレコメンダシステムといった問題に対するよく知られたランキング基準である。
本稿では,マルチクラスAUCメトリクスを最適化することで,多クラススコアリング関数を学習する問題について検討する。
論文 参考訳(メタデータ) (2021-07-28T05:18:10Z) - Mix-n-Match: Ensemble and Compositional Methods for Uncertainty
Calibration in Deep Learning [21.08664370117846]
我々は,Mix-n-Matchキャリブレーション戦略が,データ効率と表現力を大幅に向上することを示す。
標準評価プラクティスの潜在的な問題も明らかにします。
我々の手法はキャリブレーションと評価タスクの両方において最先端のソリューションより優れている。
論文 参考訳(メタデータ) (2020-03-16T17:00:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。