論文の概要: Policy-Oriented Binary Classification: Improving (KD-)CART Final Splits for Subpopulation Targeting
- arxiv url: http://arxiv.org/abs/2502.15072v2
- Date: Wed, 01 Oct 2025 19:14:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:19.678727
- Title: Policy-Oriented Binary Classification: Improving (KD-)CART Final Splits for Subpopulation Targeting
- Title(参考訳): 政策指向バイナリ分類: (KD-)CARTファイナルスプリットの改良によるサブポピュレーションターゲティング
- Authors: Lei Bill Wang, Zhenbang Jiao, Fangyi Wang,
- Abstract要約: 本稿では, 学生モデルがKD-CARTであるCARTと知識蒸留法が潜在確率分類に最適であることを示す。
本稿では,CART/KD-CARTを厳格に支配する分割規則を生成するMDFS(Maximizing Distance Final Split)を提案する。
MDFSはCART/KD-CARTよりも脆弱なサブ集団をターゲットにしている。
- 参考スコア(独自算出の注目度): 1.9754011041953696
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Policymakers often use recursive binary split rules to partition populations based on binary outcomes and target subpopulations whose probability of the binary event exceeds a threshold. We call such problems Latent Probability Classification (LPC). Practitioners typically employ Classification and Regression Trees (CART) for LPC. We prove that in the context of LPC, classic CART and the knowledge distillation method, whose student model is a CART (referred to as KD-CART), are suboptimal. We propose Maximizing Distance Final Split (MDFS), which generates split rules that strictly dominate CART/KD-CART under the unique intersect assumption. MDFS identifies the unique best split rule, is consistent, and targets more vulnerable subpopulations than CART/KD-CART. To relax the unique intersect assumption, we additionally propose Penalized Final Split (PFS) and weighted Empirical risk Final Split (wEFS). Through extensive simulation studies, we demonstrate that the proposed methods predominantly outperform CART/KD-CART. When applied to real-world datasets, MDFS generates policies that target more vulnerable subpopulations than the CART/KD-CART.
- Abstract(参考訳): 政策立案者は、しばしば再帰的な二分法を用いて、二分法の結果に基づいて人口を分割し、二分法事象の確率がしきい値を超えるターゲットのサブポピュレーションを標的とする。
このような問題をLPC(Latent Probability Classification)と呼ぶ。
実践者は一般的に、LPCに分類木と回帰木(CART)を用いる。
我々は、LPCの文脈では、古典的なCARTと、学生モデルがCART(KD-CART)である知識蒸留法が最適であることを示す。
本稿では,CART/KD-CARTを厳格に支配する分割規則を生成するMDFS(Maximizing Distance Final Split)を提案する。
MDFSはCART/KD-CARTよりも脆弱なサブ集団をターゲットにしている。
さらに,PFS(Penalized Final Split)と重み付き経験的リスクファイナルスプリット(wEFS)を提案する。
シミュレーション研究を通じて,提案手法がCART/KD-CARTより優れていることを示す。
実世界のデータセットに適用すると、MDFSはCART/KD-CARTよりも脆弱なサブ集団をターゲットにしたポリシーを生成する。
関連論文リスト
- Recalibrating binary probabilistic classifiers [1.3053649021965603]
信用リスク管理などの分野では、バイナリ確率的分類器を対象の事前確率に再分類することが重要な課題である。
分布シフトの観点から再校正法を解析した結果,曲線下の領域に関連付けられた分布シフト仮定は,有意義な再校正法の設計に有用であることが判明した。
論文 参考訳(メタデータ) (2025-05-25T10:04:46Z) - Decision from Suboptimal Classifiers: Excess Risk Pre- and Post-Calibration [52.70324949884702]
バッチ二分決定における近似的後続確率を用いた余剰リスクの定量化を行う。
我々は、再校正のみが後悔のほとんどに対処する体制と、後悔が集団的損失に支配される体制を識別する。
NLP実験では、これらの量によって、より高度なポストトレーニングの期待値が運用コストに値するかどうかが分かる。
論文 参考訳(メタデータ) (2025-03-23T10:52:36Z) - Risk-based Calibration for Generative Classifiers [4.792851066169872]
リスクベースキャリブレーション(RC)と呼ばれる学習手法を提案する。
RCは、トレーニングサンプルの0-1損失に応じて関節確率分布を調整することにより、生成分類器を反復的に洗練する。
RCは、訓練誤差と一般化誤差の両方の観点から、クローズドフォームの学習手順を著しく上回っている。
論文 参考訳(メタデータ) (2024-09-05T14:06:56Z) - Risk Consistent Multi-Class Learning from Label Proportions [64.0125322353281]
本研究は,バッグにトレーニングインスタンスを提供するMCLLP設定によるマルチクラス学習に対処する。
既存のほとんどのMCLLPメソッドは、インスタンスの予測や擬似ラベルの割り当てにバッグワイズな制約を課している。
経験的リスク最小化フレームワークを用いたリスク一貫性手法を提案する。
論文 参考訳(メタデータ) (2022-03-24T03:49:04Z) - False membership rate control in mixture models [1.387448620257867]
クラスタリングタスクは、サンプルの要素を均質なグループに分割する。
教師付き設定では、このアプローチはよく知られており、禁忌オプションの分類として言及されている。
本稿では, 教師なし混合モデルフレームワークで再検討し, 偽会員率が予め定義された名目レベルを超えないことを保証する手法を開発することを目的とする。
論文 参考訳(メタデータ) (2022-03-04T22:37:59Z) - Error rate control for classification rules in multiclass mixture models [0.0]
最適な分類規則の発見は、観測空間の最適領域を探索することにつながる。
シミュレーションと実データの両方において、FDRのような最適規則は、しきい値のMAP規則よりもはるかに保守的でない可能性があることが示されている。
論文 参考訳(メタデータ) (2021-09-29T07:18:33Z) - SphereFace2: Binary Classification is All You Need for Deep Face
Recognition [57.07058009281208]
最先端のディープフェイス認識手法は、ソフトマックスベースのマルチクラス分類フレームワークで主に訓練されている。
本稿では,SphereFace2と呼ばれる新しいバイナリ分類学習フレームワークを提案する。
SphereFace2は、最先端のディープ・フェイス認識手法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2021-08-03T13:58:45Z) - Exact Recovery in the General Hypergraph Stochastic Block Model [92.28929858529679]
本稿では,d-uniform hypergraph block model(d-HSBM)の正確な回復の基本的な限界について検討する。
精度の高いしきい値が存在し、正確な回復がしきい値の上に達成でき、その下には不可能であることを示す。
論文 参考訳(メタデータ) (2021-05-11T03:39:08Z) - Selective Probabilistic Classifier Based on Hypothesis Testing [14.695979686066066]
分類器の閉世界仮定の違反に対処するためのシンプルで効果的な方法を提案する。
提案手法は確率的ネットワークを用いた仮説テストに基づく拒絶オプションである。
提案手法は, より広い操作範囲を達成でき, 代替手段よりも低い偽陽性比をカバーできることが示されている。
論文 参考訳(メタデータ) (2021-05-09T08:55:56Z) - Semi-Supervised Learning with Variational Bayesian Inference and Maximum
Uncertainty Regularization [62.21716612888669]
半教師付き学習(SSL)を改善するための2つの一般的な方法を提案する。
第一に、重量摂動(WP)を既存のCR(Consistency regularization)ベースの手法に統合する。
第2の手法は「最大不確実性正規化(MUR)」と呼ばれる新しい整合性損失を提案する。
論文 参考訳(メタデータ) (2020-12-03T09:49:35Z) - Minimax Pareto Fairness: A Multi Objective Perspective [24.600419295290504]
グループフェアネスは多目的最適化問題であり、各敏感なグループリスクは別個の目的である。
これらの制約を満たすために、ディープニューラルネットワークと互換性のある単純なアルゴリズムを提供する。
提案手法は,収入予測,ICU患者死亡率,皮膚病変分類,信用リスク評価の実際のケーススタディについて検証した。
論文 参考訳(メタデータ) (2020-11-03T16:21:53Z) - Selective Classification via One-Sided Prediction [54.05407231648068]
片側予測(OSP)に基づく緩和は、実際に関係する高目標精度体制において、ほぼ最適カバレッジが得られるSCスキームをもたらす。
理論的には,SCとOSPのバウンダリ一般化を導出し,その手法が小さな誤差レベルでのカバレッジにおいて,技術手法の状態を強く上回ることを示す。
論文 参考訳(メタデータ) (2020-10-15T16:14:27Z) - Rethink Maximum Mean Discrepancy for Domain Adaptation [77.2560592127872]
本論文は,(1)最大平均距離の最小化は,それぞれソースとクラス内距離の最大化に等しいが,その差を暗黙の重みと共同で最小化し,特徴判別性は低下する,という2つの本質的な事実を理論的に証明する。
いくつかのベンチマークデータセットの実験は、理論的な結果の有効性を証明しただけでなく、我々のアプローチが比較した最先端手法よりも大幅に向上できることを実証した。
論文 参考訳(メタデータ) (2020-07-01T18:25:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。