論文の概要: Handling Missing Data in Probabilistic Regression Trees: Methods and Implementation in R
- arxiv url: http://arxiv.org/abs/2510.03634v1
- Date: Sat, 04 Oct 2025 02:39:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.167098
- Title: Handling Missing Data in Probabilistic Regression Trees: Methods and Implementation in R
- Title(参考訳): 確率的回帰木におけるミスデータ処理:Rの手法と実装
- Authors: Taiane Schaedler Prass, Alisson Silva Neimaier, Guilherme Pumi,
- Abstract要約: 確率的回帰木(PRTrees)は、各データポイントとツリーの異なる領域を関連付ける確率関数を組み込むことで、従来の決定木を一般化する。
本稿では,3つの異なるアプローチにより,共変量における欠落値を扱うことができるPRTreeの適応について紹介する。
提案手法は,不完全データセットへの適用性を拡張しつつ,PRTreesの解釈可能性特性を保存する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Probabilistic Regression Trees (PRTrees) generalize traditional decision trees by incorporating probability functions that associate each data point with different regions of the tree, providing smooth decisions and continuous responses. This paper introduces an adaptation of PRTrees capable of handling missing values in covariates through three distinct approaches: (i) a uniform probability method, (ii) a partial observation approach, and (iii) a dimension-reduced smoothing technique. The proposed methods preserve the interpretability properties of PRTrees while extending their applicability to incomplete datasets. Simulation studies under MCAR conditions demonstrate the relative performance of each approach, including comparisons with traditional regression trees on smooth function estimation tasks. The proposed methods, together with the original version, have been developed in R with highly optimized routines and are distributed in the PRTree package, publicly available on CRAN. In this paper we also present and discuss the main functionalities of the PRTree package, providing researchers and practitioners with new tools for incomplete data analysis.
- Abstract(参考訳): 確率的回帰木(PRTrees)は、各データポイントとツリーの異なる領域を関連付け、スムーズな決定と継続的な応答を提供する確率関数を組み込むことで、従来の決定木を一般化する。
本稿では,3つの異なるアプローチにより,共変量における欠落値を扱うことができるPRTreeの適応について紹介する。
(i)一様確率法
(二)部分的な観察方法、及び
(三)寸法再現平滑化技術。
提案手法は,不完全データセットへの適用性を拡張しつつ,PRTreesの解釈可能性特性を保存する。
MCAR条件下でのシミュレーション研究は,スムーズな関数推定タスクにおける従来の回帰木との比較を含む,各手法の相対的性能を示す。
提案手法はオリジナルのバージョンとともに,高度に最適化されたルーチンを持つRで開発され,CRANで公開されているPRTreeパッケージに配布されている。
本稿では,PRTreeパッケージの主な機能について論じ,不完全なデータ分析のための新しいツールを研究者や実践者に提供する。
関連論文リスト
- TreePO: Bridging the Gap of Policy Optimization and Efficacy and Inference Efficiency with Heuristic Tree-based Modeling [65.46347858249295]
TreePOは自己誘導型ロールアウトアルゴリズムで、シーケンス生成を木構造検索プロセスとして見る。
TreePOは基本的に、探索の多様性を保存または強化しながら、更新毎の計算負担を削減します。
論文 参考訳(メタデータ) (2025-08-24T16:52:37Z) - Learning Decision Trees as Amortized Structure Inference [59.65621207449269]
本稿では,予測決定木アンサンブルを学習するためのハイブリッドアモータイズされた構造推論手法を提案する。
提案手法であるDT-GFNは,標準分類ベンチマークにおける最先端決定木やディープラーニング手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-03-10T07:05:07Z) - A Unified Approach to Extract Interpretable Rules from Tree Ensembles via Integer Programming [2.1408617023874443]
ツリーアンサンブルは非常に人気のある機械学習モデルであり、教師付き分類と回帰タスクの有効性で知られている。
我々の研究は、訓練された木アンサンブルから最適化されたルールのリストを抽出することを目的としており、ユーザーは完全なモデルの予測力をほとんど保持する凝縮された解釈可能なモデルを提供する。
我々の広範な計算実験は,木アンサンブルに対する予測性能と忠実度の観点から,本手法が他のルール抽出法と競合することを示す統計的に有意な証拠を提供する。
論文 参考訳(メタデータ) (2024-06-30T22:33:47Z) - Ensembles of Probabilistic Regression Trees [46.53457774230618]
木に基づくアンサンブル法は多くの応用や研究で回帰問題に成功している。
本研究では,確率分布に関する各領域の観察を割り当てることで,目的関数のスムーズな近似を提供する確率回帰木のアンサンブルバージョンについて検討する。
論文 参考訳(メタデータ) (2024-06-20T06:51:51Z) - TreeFlow: Going beyond Tree-based Gaussian Probabilistic Regression [0.0]
ツリーアンサンブルを使うことの利点と柔軟な確率分布をモデル化する能力を組み合わせたツリーベースアプローチであるTreeFlowを紹介した。
提案手法は, 諸量, 特徴量, 目標寸法の異なる回帰ベンチマークを用いて評価する。
論文 参考訳(メタデータ) (2022-06-08T20:06:23Z) - Probability Distribution on Rooted Trees [1.3955252961896318]
根付き木の階層的表現能力は、データ圧縮、画像処理、機械学習など、さまざまな領域の統計モデルを表現するために応用される。
これを解決するための統一的なアプローチはベイズ的アプローチであり、ルート木をランダム変数とみなし、選択されたモデルや新しいデータポイントの予測値に対して直接損失関数を仮定することができる。
本稿では,最大子ノード数と最大深さのみを固定したルート木に対して,一般化された確率分布を提案する。
論文 参考訳(メタデータ) (2022-01-24T05:13:58Z) - Probabilistic Gradient Boosting Machines for Large-Scale Probabilistic
Regression [51.770998056563094]
PGBM(Probabilistic Gradient Boosting Machines)は、確率的予測を生成する手法である。
既存の最先端手法と比較してPGBMの利点を実証的に示す。
論文 参考訳(メタデータ) (2021-06-03T08:32:13Z) - Polynomial-Time Exact MAP Inference on Discrete Models with Global
Dependencies [83.05591911173332]
ジャンクションツリーアルゴリズムは、実行時の保証と正確なMAP推論のための最も一般的な解である。
本稿では,ノードのクローン化による新たなグラフ変換手法を提案する。
論文 参考訳(メタデータ) (2019-12-27T13:30:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。