論文の概要: Modifying Final Splits of Classification Tree for Fine-tuning Subpopulation Target in Policy Making
- arxiv url: http://arxiv.org/abs/2502.15072v1
- Date: Thu, 20 Feb 2025 22:08:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-24 21:37:39.000049
- Title: Modifying Final Splits of Classification Tree for Fine-tuning Subpopulation Target in Policy Making
- Title(参考訳): 政策立案における細調整サブポピュレーションターゲットの分類木最終分割の修正
- Authors: Lei Bill Wang, Zhenbang Jiao, Fangyi Wang,
- Abstract要約: 政策立案者は、二進的な結果と二進的事象の確率がしきい値を超えるターゲットサブポピュレーションに基づいて人口を分割するために、しばしば分類と回帰木(CART)を使用する。
本稿では,Penalized Final Split (PFS) とMaximizing Distance Final Split (MDFS) の2つの手法を提案する。
大規模なシミュレーション研究を通じて,これらの手法が誤分類誤りの点で古典的CARTやKD-CARTよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Policymakers often use Classification and Regression Trees (CART) to partition populations based on binary outcomes and target subpopulations whose probability of the binary event exceeds a threshold. However, classic CART and knowledge distillation method whose student model is a CART (referred to as KD-CART) do not minimize the misclassification risk associated with classifying the latent probabilities of these binary events. To reduce the misclassification risk, we propose two methods, Penalized Final Split (PFS) and Maximizing Distance Final Split (MDFS). PFS incorporates a tunable penalty into the standard CART splitting criterion function. MDFS maximizes a weighted sum of distances between node means and the threshold. It can point-identify the optimal split under the unique intersect latent probability assumption. In addition, we develop theoretical result for MDFS splitting rule estimation, which has zero asymptotic risk. Through extensive simulation studies, we demonstrate that these methods predominately outperform classic CART and KD-CART in terms of misclassification error. Furthermore, in our empirical evaluations, these methods provide deeper insights than the two baseline methods.
- Abstract(参考訳): 政策立案者は、二進的な結果と二進的事象の確率がしきい値を超えるターゲットサブポピュレーションに基づいて人口を分割するために、しばしば分類と回帰木(CART)を使用する。
しかし、学生モデルがCART(KD-CART)である古典的なCARTおよび知識蒸留法は、これらの二項事象の潜在確率の分類に伴う誤分類リスクを最小化しない。
誤分類リスクを低減するため,Penalized Final Split (PFS) とMaximizing Distance Final Split (MDFS) の2つの手法を提案する。
PFSは標準のCART分割基準関数に調整可能なペナルティを組み込む。
MDFSはノード平均と閾値の間の距離の重み付け和を最大化する。
これは、一意に交差する潜在確率仮定の下で最適分割を特定できる。
さらに,漸近リスクがゼロであるMDFS分割規則推定のための理論的結果を開発した。
大規模なシミュレーション研究を通じて,これらの手法が誤分類誤りの点から古典的CARTとKD-CARTを優先的に上回ることを示した。
さらに,実証評価では,これらの手法は2つの基本手法よりも深い洞察を与える。
関連論文リスト
- Rethinking the Trust Region in LLM Reinforcement Learning [72.25890308541334]
PPO(Proximal Policy Optimization)は、大規模言語モデル(LLM)のデファクト標準アルゴリズムとして機能する。
より原則的な制約でクリッピングを代用する多変量確率ポリシー最適化(DPPO)を提案する。
DPPOは既存の方法よりも優れたトレーニングと効率を実現し、RLベースの微調整のためのより堅牢な基盤を提供する。
論文 参考訳(メタデータ) (2026-02-04T18:59:04Z) - Save the Good Prefix: Precise Error Penalization via Process-Supervised RL to Enhance LLM Reasoning [59.76691952347156]
強化学習(RL)は,大規模言語モデル(LLM)の推論能力向上のための強力なフレームワークとして登場した。
既存のRLアプローチの多くは疎結果報酬に依存しており、部分的に成功した解では正しい中間段階を信用できない。
本稿では、PRMを用いてRL中の最初のエラーをローカライズする検証済み事前修正ポリシー最適化(VPPO)を提案する。
論文 参考訳(メタデータ) (2026-01-26T21:38:20Z) - Covariance-Driven Regression Trees: Reducing Overfitting in CART [30.06506470737739]
回帰木に対する共分散駆動分割基準(CovRT)を導入する。
CovRTは、CARTで使用される経験的リスク最小化基準よりも、過適合に対して堅牢である。
シミュレーションと実世界の両方のタスクにおいて,CARTと比較して予測精度が優れていることがわかった。
論文 参考訳(メタデータ) (2026-01-12T07:36:18Z) - MMDCP: A Distribution-free Approach to Outlier Detection and Classification with Coverage Guarantees and SCW-FDR Control [6.429952624399788]
ラベルシフト下でのマルチクラス分類と外乱検出のための統一的なフレームワークを提案する。
修正マハラノビス距離等角予測(MMDCP)は、クラス固有の距離測度と完全な等角予測を組み合わせてスコア関数を構築する。
オラクルと経験的コンフォーマルな$p$-値のギャップを初めて理論的に評価し、クラスワイド偽発見率(CW-FDR)の有効なカバレッジと効果的な制御を確実にする。
論文 参考訳(メタデータ) (2025-11-15T03:48:44Z) - One Sample is Enough to Make Conformal Prediction Robust [53.78604391939934]
共形予測は, 1つのランダムな摂動入力に対して前方通過しても, ある程度の堅牢性が得られることを示す。
提案手法は,入力毎に多数のパス(例えば100回程度)を使用するSOTA法と比較して,平均セットサイズが小さいロバストな集合を返す。
論文 参考訳(メタデータ) (2025-06-19T19:14:25Z) - Recalibrating binary probabilistic classifiers [1.3053649021965603]
信用リスク管理などの分野では、バイナリ確率的分類器を対象の事前確率に再分類することが重要な課題である。
分布シフトの観点から再校正法を解析した結果,曲線下の領域に関連付けられた分布シフト仮定は,有意義な再校正法の設計に有用であることが判明した。
論文 参考訳(メタデータ) (2025-05-25T10:04:46Z) - Decision from Suboptimal Classifiers: Excess Risk Pre- and Post-Calibration [52.70324949884702]
バッチ二分決定における近似的後続確率を用いた余剰リスクの定量化を行う。
我々は、再校正のみが後悔のほとんどに対処する体制と、後悔が集団的損失に支配される体制を識別する。
NLP実験では、これらの量によって、より高度なポストトレーニングの期待値が運用コストに値するかどうかが分かる。
論文 参考訳(メタデータ) (2025-03-23T10:52:36Z) - Learning Structured Representations by Embedding Class Hierarchy with Fast Optimal Transport [20.927804550845355]
我々は、Earth Moverefficient's Distance (EMD) を用いて、特徴空間内のクラス間のペア距離を測定する。
4種類の近似式を探索することにより、最適なトランスポートCPCCファミリーを導入する。
我々の最も効率的なOT-CPCC変種であるFast FlowTreeアルゴリズムは、データセットのサイズで線形に実行される。
論文 参考訳(メタデータ) (2024-10-04T00:20:34Z) - Risk-based Calibration for Generative Classifiers [4.792851066169872]
リスクベースキャリブレーション(RC)と呼ばれる学習手法を提案する。
RCは、トレーニングサンプルの0-1損失に応じて関節確率分布を調整することにより、生成分類器を反復的に洗練する。
RCは、訓練誤差と一般化誤差の両方の観点から、クローズドフォームの学習手順を著しく上回っている。
論文 参考訳(メタデータ) (2024-09-05T14:06:56Z) - Off-Policy Evaluation in Markov Decision Processes under Weak Distributional Overlap [3.351714665243138]
我々は,マルコフ決定過程(MDP)における非政治的評価の課題を再考し,分布重なりというより弱い概念の下で検討する。
本稿では,この環境での良好な性能を期待できる2重頑健性(TDR)推定器のクラスを紹介する。
我々の実験では、強い分布重なりが保たない場合、適切な乱れが、政治外の正確な評価を可能にする上で重要な役割を担っていることがわかった。
論文 参考訳(メタデータ) (2024-02-13T03:55:56Z) - TD3 with Reverse KL Regularizer for Offline Reinforcement Learning from
Mixed Datasets [118.22975463000928]
エージェントが複数の行動ポリシーをロールアウトすることで収集したデータセットから学習する必要があるオフライン強化学習(RL)について考察する。
1) RL信号の最適化と行動クローニング(BC)信号の最適なトレードオフは、異なる行動ポリシーによって引き起こされる行動カバレッジの変化によって異なる状態に変化する。
本稿では,TD3アルゴリズムに基づくBC正規化器として,適応重み付き逆KL(Kulback-Leibler)分散を用いることにより,両課題に対処する。
論文 参考訳(メタデータ) (2022-12-05T09:36:23Z) - Bayes risk CTC: Controllable CTC alignment in Sequence-to-Sequence tasks [63.189632935619535]
予測アライメントの望ましい特性を強制するためにベイズリスクCTC(BRCTC)を提案する。
BRCTCを他の早期排出の選好と組み合わせることで、オンラインモデルの性能・遅延トレードオフが改善される。
論文 参考訳(メタデータ) (2022-10-14T03:55:36Z) - Is Vertical Logistic Regression Privacy-Preserving? A Comprehensive
Privacy Analysis and Beyond [57.10914865054868]
垂直ロジスティック回帰(VLR)をミニバッチ降下勾配で訓練した。
我々は、オープンソースのフェデレーション学習フレームワークのクラスにおいて、VLRの包括的で厳密なプライバシー分析を提供する。
論文 参考訳(メタデータ) (2022-07-19T05:47:30Z) - Risk Consistent Multi-Class Learning from Label Proportions [64.0125322353281]
本研究は,バッグにトレーニングインスタンスを提供するMCLLP設定によるマルチクラス学習に対処する。
既存のほとんどのMCLLPメソッドは、インスタンスの予測や擬似ラベルの割り当てにバッグワイズな制約を課している。
経験的リスク最小化フレームワークを用いたリスク一貫性手法を提案する。
論文 参考訳(メタデータ) (2022-03-24T03:49:04Z) - False membership rate control in mixture models [1.387448620257867]
クラスタリングタスクは、サンプルの要素を均質なグループに分割する。
教師付き設定では、このアプローチはよく知られており、禁忌オプションの分類として言及されている。
本稿では, 教師なし混合モデルフレームワークで再検討し, 偽会員率が予め定義された名目レベルを超えないことを保証する手法を開発することを目的とする。
論文 参考訳(メタデータ) (2022-03-04T22:37:59Z) - Error rate control for classification rules in multiclass mixture models [0.0]
最適な分類規則の発見は、観測空間の最適領域を探索することにつながる。
シミュレーションと実データの両方において、FDRのような最適規則は、しきい値のMAP規則よりもはるかに保守的でない可能性があることが示されている。
論文 参考訳(メタデータ) (2021-09-29T07:18:33Z) - SphereFace2: Binary Classification is All You Need for Deep Face
Recognition [57.07058009281208]
最先端のディープフェイス認識手法は、ソフトマックスベースのマルチクラス分類フレームワークで主に訓練されている。
本稿では,SphereFace2と呼ばれる新しいバイナリ分類学習フレームワークを提案する。
SphereFace2は、最先端のディープ・フェイス認識手法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2021-08-03T13:58:45Z) - Exact Recovery in the General Hypergraph Stochastic Block Model [92.28929858529679]
本稿では,d-uniform hypergraph block model(d-HSBM)の正確な回復の基本的な限界について検討する。
精度の高いしきい値が存在し、正確な回復がしきい値の上に達成でき、その下には不可能であることを示す。
論文 参考訳(メタデータ) (2021-05-11T03:39:08Z) - Selective Probabilistic Classifier Based on Hypothesis Testing [14.695979686066066]
分類器の閉世界仮定の違反に対処するためのシンプルで効果的な方法を提案する。
提案手法は確率的ネットワークを用いた仮説テストに基づく拒絶オプションである。
提案手法は, より広い操作範囲を達成でき, 代替手段よりも低い偽陽性比をカバーできることが示されている。
論文 参考訳(メタデータ) (2021-05-09T08:55:56Z) - Semi-Supervised Learning with Variational Bayesian Inference and Maximum
Uncertainty Regularization [62.21716612888669]
半教師付き学習(SSL)を改善するための2つの一般的な方法を提案する。
第一に、重量摂動(WP)を既存のCR(Consistency regularization)ベースの手法に統合する。
第2の手法は「最大不確実性正規化(MUR)」と呼ばれる新しい整合性損失を提案する。
論文 参考訳(メタデータ) (2020-12-03T09:49:35Z) - Minimax Pareto Fairness: A Multi Objective Perspective [24.600419295290504]
グループフェアネスは多目的最適化問題であり、各敏感なグループリスクは別個の目的である。
これらの制約を満たすために、ディープニューラルネットワークと互換性のある単純なアルゴリズムを提供する。
提案手法は,収入予測,ICU患者死亡率,皮膚病変分類,信用リスク評価の実際のケーススタディについて検証した。
論文 参考訳(メタデータ) (2020-11-03T16:21:53Z) - Selective Classification via One-Sided Prediction [54.05407231648068]
片側予測(OSP)に基づく緩和は、実際に関係する高目標精度体制において、ほぼ最適カバレッジが得られるSCスキームをもたらす。
理論的には,SCとOSPのバウンダリ一般化を導出し,その手法が小さな誤差レベルでのカバレッジにおいて,技術手法の状態を強く上回ることを示す。
論文 参考訳(メタデータ) (2020-10-15T16:14:27Z) - Rethink Maximum Mean Discrepancy for Domain Adaptation [77.2560592127872]
本論文は,(1)最大平均距離の最小化は,それぞれソースとクラス内距離の最大化に等しいが,その差を暗黙の重みと共同で最小化し,特徴判別性は低下する,という2つの本質的な事実を理論的に証明する。
いくつかのベンチマークデータセットの実験は、理論的な結果の有効性を証明しただけでなく、我々のアプローチが比較した最先端手法よりも大幅に向上できることを実証した。
論文 参考訳(メタデータ) (2020-07-01T18:25:10Z) - On Aggregation in Ensembles of Multilabel Classifiers [4.842945656927122]
予測と組み合わせ (PTC) と合成と予測 (CTP) は, マルチラベル分類をアンサンブルする2つの主要なアプローチである。
PTCは非分解不能な損失に対してより良い選択であることを示す。
論文 参考訳(メタデータ) (2020-06-21T21:43:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。