論文の概要: Buffered AUC maximization for scoring systems via mixed-integer optimization
- arxiv url: http://arxiv.org/abs/2601.05544v1
- Date: Fri, 09 Jan 2026 05:52:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-12 17:41:49.854064
- Title: Buffered AUC maximization for scoring systems via mixed-integer optimization
- Title(参考訳): 混合整数最適化によるスコアリングシステムのバッファリングAUC最大化
- Authors: Moe Shiina, Shunnosuke Ikeda, Yuichi Takano,
- Abstract要約: スコアリングシステムは、少数の説明変数からなる線形分類器であり、それぞれが小さな整数係数を割り当てている。
これまでのいくつかの研究では、混合整数最適化(MIO)技術を用いてバイナリ分類のためのスコアリングシステムを開発した。
この研究は、高度に解釈可能な分類モデルを開発するためのMIO技術の進歩に寄与する。
- 参考スコア(独自算出の注目度): 1.8224668251608893
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A scoring system is a linear classifier composed of a small number of explanatory variables, each assigned a small integer coefficient. This system is highly interpretable and allows predictions to be made with simple manual calculations without the need for a calculator. Several previous studies have used mixed-integer optimization (MIO) techniques to develop scoring systems for binary classification; however, they have not focused on directly maximizing AUC (i.e., area under the receiver operating characteristic curve), even though AUC is recognized as an essential evaluation metric for scoring systems. Our goal herein is to establish an effective MIO framework for constructing scoring systems that directly maximize the buffered AUC (bAUC) as the tightest concave lower bound on AUC. Our optimization model is formulated as a mixed-integer linear optimization (MILO) problem that maximizes bAUC subject to a group sparsity constraint for limiting the number of questions in the scoring system. Computational experiments using publicly available real-world datasets demonstrate that our MILO method can build scoring systems with superior AUC values compared to the baseline methods based on regularization and stepwise regression. This research contributes to the advancement of MIO techniques for developing highly interpretable classification models.
- Abstract(参考訳): スコアリングシステムは、少数の説明変数からなる線形分類器であり、それぞれが小さな整数係数を割り当てている。
このシステムは高度に解釈可能であり、電卓を必要とせずに単純な手動計算で予測を行うことができる。
これまでのいくつかの研究では、混合整数最適化(MIO)技術を用いてバイナリ分類のためのスコアリングシステムを開発したが、AUC(すなわち、受信者動作特性曲線の下の領域)を直接最大化することには焦点が当てられておらず、スコアリングシステムにとって重要な評価基準として認識されている。
本研究の目的は,バッファリングされたAUC(bAUC)をAUC上の最も狭い凹面下限として直接最大化するスコアリングシステムを構築するための効果的なMIOフレームワークを確立することである。
我々の最適化モデルは混合整数線形最適化(MILO)問題として定式化され、スコアリングシステムにおける質問数を制限するため、グループ間隔制約を受けるbAUCを最大化する。
公開されている実世界のデータセットを用いた計算実験により,MILO法は正規化と段階回帰に基づくベースライン法と比較して,AUC値の優れたスコアリングシステムを構築することができることを示した。
この研究は、高度に解釈可能な分類モデルを開発するためのMIO技術の進歩に寄与する。
関連論文リスト
- Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - MISS: Multiclass Interpretable Scoring Systems [13.902264070785986]
MISS(Multiclass Interpretable Scoring Systems)構築のための機械学習手法を提案する。
MISSは、シングルクラス、スパース、ユーザフレンドリーなスコアリングシステムのための、完全なデータ駆動の方法論である。
結果から,本手法は他の機械学習モデルと性能指標の分類において競合し,高い校正率のクラス確率が得られたことが示唆された。
論文 参考訳(メタデータ) (2024-01-10T10:57:12Z) - Balanced Self-Paced Learning for AUC Maximization [88.53174245457268]
既存のセルフパッチ方式は、ポイントワイズAUCに限られている。
我々のアルゴリズムは閉形式解に基づいて定常点に収束する。
論文 参考訳(メタデータ) (2022-07-08T02:09:32Z) - Feature subset selection for kernel SVM classification via mixed-integer
optimization [0.7734726150561088]
非線形カーネルサポートベクトルマシン(SVM)における特徴部分選択のための混合整数最適化(MIO)手法について検討した。
1970年代に線形回帰について最初に提案されたこのアプローチは、最近最適化アルゴリズムとコンピュータハードウェアの進歩とともにスポットライトに移行した。
特徴部分集合選択のためのカーネルターゲットアライメントに基づくMILO(mixed-integer linear optimization)の定式化を提案し,このMILO問題を最適化ソフトウェアを用いて最適に解くことができる。
論文 参考訳(メタデータ) (2022-05-28T04:01:40Z) - Large-scale Optimization of Partial AUC in a Range of False Positive
Rates [51.12047280149546]
ROC曲線 (AUC) の下の領域は、機械学習において最も広く使われている分類モデルのパフォーマンス指標の1つである。
近年の封筒平滑化技術に基づく効率的な近似勾配降下法を開発した。
提案アルゴリズムは,効率のよい解法を欠くランク付けされた範囲損失の和を最小化するためにも利用できる。
論文 参考訳(メタデータ) (2022-03-03T03:46:18Z) - Pretrained Cost Model for Distributed Constraint Optimization Problems [37.79733538931925]
分散制約最適化問題(DCOP)は、最適化問題の重要なサブクラスである。
本稿では,DCOPのための新しい非巡回グラフスキーマ表現を提案し,グラフ表現を組み込むためにグラフ注意ネットワーク(GAT)を利用する。
我々のモデルであるGAT-PCMは、幅広いDCOPアルゴリズムを向上するために、オフラインで最適なラベル付きデータで事前訓練される。
論文 参考訳(メタデータ) (2021-12-08T09:24:10Z) - Learning with Multiclass AUC: Theory and Algorithms [141.63211412386283]
ROC曲線 (AUC) の下の領域は、不均衡学習やレコメンダシステムといった問題に対するよく知られたランキング基準である。
本稿では,マルチクラスAUCメトリクスを最適化することで,多クラススコアリング関数を学習する問題について検討する。
論文 参考訳(メタデータ) (2021-07-28T05:18:10Z) - Adaptive Local Kernels Formulation of Mutual Information with
Application to Active Post-Seismic Building Damage Inference [1.066048003460524]
地震後の建築物の地域被害評価は高価な作業である。
相互情報の情報理論尺度は,サンプルの有効性を評価する上で最も有効な基準の一つである。
計算コストを削減するためにローカルカーネル戦略が提案されたが、観測されたラベルへのカーネルの適応性は考慮されなかった。
本稿では,観測された出力データに対するカーネルの適合性を実現するための適応型ローカルカーネル手法を開発した。
論文 参考訳(メタデータ) (2021-05-24T18:34:46Z) - Learning by Minimizing the Sum of Ranked Range [58.24935359348289]
本稿では,学習目標を定式化するための一般的なアプローチとして,ランキング範囲(SoRR)の和を紹介した。
ランク付き範囲は、実数の集合のソートされた値の連続的なシーケンスである。
我々は,SoRRフレームワークの最小化のための機械学習における2つの応用,すなわち,バイナリ分類のためのAoRR集約損失とマルチラベル/マルチクラス分類のためのTKML個人損失について検討する。
論文 参考訳(メタデータ) (2020-10-05T01:58:32Z) - Communication-Efficient Distributed Stochastic AUC Maximization with
Deep Neural Networks [50.42141893913188]
本稿では,ニューラルネットワークを用いた大規模AUCのための分散変数について検討する。
我々のモデルは通信ラウンドをはるかに少なくし、理論上はまだ多くの通信ラウンドを必要としています。
いくつかのデータセットに対する実験は、我々の理論の有効性を示し、我々の理論を裏付けるものである。
論文 参考訳(メタデータ) (2020-05-05T18:08:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。