Fugu-MT 論文翻訳(概要): Modifying Final Splits of Classification Tree for Fine-tuning Subpopulation Target in Policy Making

論文の概要: Modifying Final Splits of Classification Tree for Fine-tuning Subpopulation Target in Policy Making

arxiv url: http://arxiv.org/abs/2502.15072v1
Date: Thu, 20 Feb 2025 22:08:43 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-24 21:37:39.000049
Title: Modifying Final Splits of Classification Tree for Fine-tuning Subpopulation Target in Policy Making
Title（参考訳）: 政策立案における細調整サブポピュレーションターゲットの分類木最終分割の修正
Authors: Lei Bill Wang, Zhenbang Jiao, Fangyi Wang,
Abstract要約: 政策立案者は、二進的な結果と二進的事象の確率がしきい値を超えるターゲットサブポピュレーションに基づいて人口を分割するために、しばしば分類と回帰木(CART)を使用する。本稿では,Penalized Final Split (PFS) とMaximizing Distance Final Split (MDFS) の2つの手法を提案する。大規模なシミュレーション研究を通じて,これらの手法が誤分類誤りの点で古典的CARTやKD-CARTよりも優れていることを示す。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Policymakers often use Classification and Regression Trees (CART) to partition populations based on binary outcomes and target subpopulations whose probability of the binary event exceeds a threshold. However, classic CART and knowledge distillation method whose student model is a CART (referred to as KD-CART) do not minimize the misclassification risk associated with classifying the latent probabilities of these binary events. To reduce the misclassification risk, we propose two methods, Penalized Final Split (PFS) and Maximizing Distance Final Split (MDFS). PFS incorporates a tunable penalty into the standard CART splitting criterion function. MDFS maximizes a weighted sum of distances between node means and the threshold. It can point-identify the optimal split under the unique intersect latent probability assumption. In addition, we develop theoretical result for MDFS splitting rule estimation, which has zero asymptotic risk. Through extensive simulation studies, we demonstrate that these methods predominately outperform classic CART and KD-CART in terms of misclassification error. Furthermore, in our empirical evaluations, these methods provide deeper insights than the two baseline methods.
Abstract（参考訳）: 政策立案者は、二進的な結果と二進的事象の確率がしきい値を超えるターゲットサブポピュレーションに基づいて人口を分割するために、しばしば分類と回帰木(CART)を使用する。しかし、学生モデルがCART(KD-CART)である古典的なCARTおよび知識蒸留法は、これらの二項事象の潜在確率の分類に伴う誤分類リスクを最小化しない。誤分類リスクを低減するため,Penalized Final Split (PFS) とMaximizing Distance Final Split (MDFS) の2つの手法を提案する。 PFSは標準のCART分割基準関数に調整可能なペナルティを組み込む。 MDFSはノード平均と閾値の間の距離の重み付け和を最大化する。これは、一意に交差する潜在確率仮定の下で最適分割を特定できる。さらに,漸近リスクがゼロであるMDFS分割規則推定のための理論的結果を開発した。大規模なシミュレーション研究を通じて,これらの手法が誤分類誤りの点から古典的CARTとKD-CARTを優先的に上回ることを示した。さらに,実証評価では,これらの手法は2つの基本手法よりも深い洞察を与える。

関連論文リスト

Recalibrating binary probabilistic classifiers [1.3053649021965603]
信用リスク管理などの分野では、バイナリ確率的分類器を対象の事前確率に再分類することが重要な課題である。分布シフトの観点から再校正法を解析した結果,曲線下の領域に関連付けられた分布シフト仮定は,有意義な再校正法の設計に有用であることが判明した。
論文参考訳（メタデータ） (2025-05-25T10:04:46Z)
Decision from Suboptimal Classifiers: Excess Risk Pre- and Post-Calibration [52.70324949884702]
バッチ二分決定における近似的後続確率を用いた余剰リスクの定量化を行う。我々は、再校正のみが後悔のほとんどに対処する体制と、後悔が集団的損失に支配される体制を識別する。 NLP実験では、これらの量によって、より高度なポストトレーニングの期待値が運用コストに値するかどうかが分かる。
論文参考訳（メタデータ） (2025-03-23T10:52:36Z)
Risk-based Calibration for Generative Classifiers [4.792851066169872]
リスクベースキャリブレーション(RC)と呼ばれる学習手法を提案する。 RCは、トレーニングサンプルの0-1損失に応じて関節確率分布を調整することにより、生成分類器を反復的に洗練する。 RCは、訓練誤差と一般化誤差の両方の観点から、クローズドフォームの学習手順を著しく上回っている。
論文参考訳（メタデータ） (2024-09-05T14:06:56Z)
Risk Consistent Multi-Class Learning from Label Proportions [64.0125322353281]
本研究は,バッグにトレーニングインスタンスを提供するMCLLP設定によるマルチクラス学習に対処する。既存のほとんどのMCLLPメソッドは、インスタンスの予測や擬似ラベルの割り当てにバッグワイズな制約を課している。経験的リスク最小化フレームワークを用いたリスク一貫性手法を提案する。
論文参考訳（メタデータ） (2022-03-24T03:49:04Z)
False membership rate control in mixture models [1.387448620257867]
クラスタリングタスクは、サンプルの要素を均質なグループに分割する。教師付き設定では、このアプローチはよく知られており、禁忌オプションの分類として言及されている。本稿では, 教師なし混合モデルフレームワークで再検討し, 偽会員率が予め定義された名目レベルを超えないことを保証する手法を開発することを目的とする。
論文参考訳（メタデータ） (2022-03-04T22:37:59Z)
Error rate control for classification rules in multiclass mixture models [0.0]
最適な分類規則の発見は、観測空間の最適領域を探索することにつながる。シミュレーションと実データの両方において、FDRのような最適規則は、しきい値のMAP規則よりもはるかに保守的でない可能性があることが示されている。
論文参考訳（メタデータ） (2021-09-29T07:18:33Z)
SphereFace2: Binary Classification is All You Need for Deep Face Recognition [57.07058009281208]
最先端のディープフェイス認識手法は、ソフトマックスベースのマルチクラス分類フレームワークで主に訓練されている。本稿では,SphereFace2と呼ばれる新しいバイナリ分類学習フレームワークを提案する。 SphereFace2は、最先端のディープ・フェイス認識手法よりも一貫して優れていることを示す。
論文参考訳（メタデータ） (2021-08-03T13:58:45Z)
Exact Recovery in the General Hypergraph Stochastic Block Model [92.28929858529679]
本稿では,d-uniform hypergraph block model(d-HSBM)の正確な回復の基本的な限界について検討する。精度の高いしきい値が存在し、正確な回復がしきい値の上に達成でき、その下には不可能であることを示す。
論文参考訳（メタデータ） (2021-05-11T03:39:08Z)
Selective Probabilistic Classifier Based on Hypothesis Testing [14.695979686066066]
分類器の閉世界仮定の違反に対処するためのシンプルで効果的な方法を提案する。提案手法は確率的ネットワークを用いた仮説テストに基づく拒絶オプションである。提案手法は, より広い操作範囲を達成でき, 代替手段よりも低い偽陽性比をカバーできることが示されている。
論文参考訳（メタデータ） (2021-05-09T08:55:56Z)
Semi-Supervised Learning with Variational Bayesian Inference and Maximum Uncertainty Regularization [62.21716612888669]
半教師付き学習(SSL)を改善するための2つの一般的な方法を提案する。第一に、重量摂動(WP)を既存のCR(Consistency regularization)ベースの手法に統合する。第2の手法は「最大不確実性正規化(MUR)」と呼ばれる新しい整合性損失を提案する。
論文参考訳（メタデータ） (2020-12-03T09:49:35Z)
Minimax Pareto Fairness: A Multi Objective Perspective [24.600419295290504]
グループフェアネスは多目的最適化問題であり、各敏感なグループリスクは別個の目的である。これらの制約を満たすために、ディープニューラルネットワークと互換性のある単純なアルゴリズムを提供する。提案手法は,収入予測,ICU患者死亡率,皮膚病変分類,信用リスク評価の実際のケーススタディについて検証した。
論文参考訳（メタデータ） (2020-11-03T16:21:53Z)
Selective Classification via One-Sided Prediction [54.05407231648068]
片側予測(OSP)に基づく緩和は、実際に関係する高目標精度体制において、ほぼ最適カバレッジが得られるSCスキームをもたらす。理論的には,SCとOSPのバウンダリ一般化を導出し,その手法が小さな誤差レベルでのカバレッジにおいて,技術手法の状態を強く上回ることを示す。
論文参考訳（メタデータ） (2020-10-15T16:14:27Z)
Rethink Maximum Mean Discrepancy for Domain Adaptation [77.2560592127872]
本論文は,(1)最大平均距離の最小化は,それぞれソースとクラス内距離の最大化に等しいが,その差を暗黙の重みと共同で最小化し,特徴判別性は低下する,という2つの本質的な事実を理論的に証明する。いくつかのベンチマークデータセットの実験は、理論的な結果の有効性を証明しただけでなく、我々のアプローチが比較した最先端手法よりも大幅に向上できることを実証した。
論文参考訳（メタデータ） (2020-07-01T18:25:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。