論文の概要: On Imbalanced Regression with Hoeffding Trees
- arxiv url: http://arxiv.org/abs/2602.22101v1
- Date: Wed, 25 Feb 2026 16:48:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-26 18:19:16.917924
- Title: On Imbalanced Regression with Hoeffding Trees
- Title(参考訳): ホイフディング木による不均衡回帰について
- Authors: Pantia-Marina Alchirch, Dimitrios I. Diochnos,
- Abstract要約: ホイフディングの木とその変種は、その有効性から長年の伝統がある。
バッチ学習における最近の研究は、カーネル密度推定がスムーズな予測に有効なアプローチであることを示している。
階層的縮小をインクリメンタルな決定木モデルに拡張する。
- 参考スコア(独自算出の注目度): 1.3149034455953847
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many real-world applications provide a continuous stream of data that is subsequently used by machine learning models to solve regression tasks of interest. Hoeffding trees and their variants have a long-standing tradition due to their effectiveness, either alone or as base models in broader ensembles. At the same time a recent line of work in batch learning has shown that kernel density estimation (KDE) is an effective approach for smoothed predictions in imbalanced regression tasks [Yang et al., 2021]. Moreover, another recent line of work for batch learning, called hierarchical shrinkage (HS) [Agarwal et al., 2022], has introduced a post-hoc regularization method for decision trees that does not alter the structure of the learned tree. Using a telescoping argument we cast KDE to streaming environments and extend the implementation of HS to incremental decision tree models. Armed with these extensions we investigate the performance of decision trees that may enjoy such options in datasets commonly used for regression in online settings. We conclude that KDE is beneficial in the early parts of the stream, while HS hardly, if ever, offers performance benefits. Our code is publicly available at: https://github.com/marinaAlchirch/DSFA_2026.
- Abstract(参考訳): 多くの現実世界のアプリケーションは連続したデータストリームを提供し、その後、機械学習モデルによって関心のある回帰タスクを解決するために使用される。
ホイフディングの木とその変種は、その効果が単独でも、より広いアンサンブルのベースモデルとしても、長く続いた伝統を持っている。
同時に、バッチ学習における最近の研究は、カーネル密度推定(KDE)が不均衡回帰タスク(Yang et al , 2021)におけるスムーズな予測に有効なアプローチであることを示した。
さらに, 階層的縮小 (HS) [Agarwal et al , 2022] と呼ばれる近年のバッチ学習では, 学習木の構造を変えない決定木に対するポストホック正規化法が導入された。
テレスコープの引数を使用して、KDEをストリーミング環境にキャストし、HSの実装をインクリメンタルな決定ツリーモデルに拡張します。
これらの拡張を活用して、オンライン設定の回帰によく使用されるデータセットでそのような選択肢を楽しむことができる決定木の性能を調査します。
KDEはストリームの初期段階で有益である一方、HSはパフォーマンス上のメリットをほとんど提供していない、と結論付けています。
私たちのコードは、https://github.com/marinaAlchirch/DSFA_2026で公開されています。
関連論文リスト
- Hierarchical Quantized Diffusion Based Tree Generation Method for Hierarchical Representation and Lineage Analysis [49.00783841494125]
HDTreeは階層的潜在空間内の木関係を、統一的な階層的コードブックと量子化拡散プロセスを用いてキャプチャする。
HDTreeの有効性は、汎用データセットと単一セルデータセットの比較によって示される。
これらの貢献は階層的な系統解析のための新しいツールを提供し、より正確で効率的な細胞分化経路のモデリングを可能にする。
論文 参考訳(メタデータ) (2025-06-29T15:19:13Z) - A Powerful Random Forest Featuring Linear Extensions (RaFFLE) [1.2233362977312945]
RaFFLEは、ランダムな森林アンサンブル内でPILOTツリーをベースラーナーとして統合する新しいフレームワークである。
PILOT木は、従来の決定木の計算効率と線形モデル木の柔軟性を組み合わせたものである。
RaFFLEは様々な回帰問題に対処するための汎用ツールであることが証明されている。
論文 参考訳(メタデータ) (2025-02-14T14:22:51Z) - Conditional Density Estimation with Histogram Trees [3.5297361401370044]
条件密度推定(CDE)は、完全な条件分布をモデル化することによって回帰を超える。
現在の手法ではカーネルに基づくアプローチが一般的であり、カーネル密度推定や線形モデルの基底関数としてカーネル関数を直接使用する。
本研究では,各葉がヒストグラムモデルによって形成される決定木からなる完全非パラメータモデルである条件密度木(CDTree)を提案する。
論文 参考訳(メタデータ) (2024-10-15T09:53:24Z) - Forecasting with Hyper-Trees [50.72190208487953]
Hyper-Treesは時系列モデルのパラメータを学習するために設計されている。
対象とする時系列モデルのパラメータを特徴に関連付けることで、Hyper-Treesはパラメータ非定常性の問題にも対処する。
この新しいアプローチでは、木はまず入力特徴から情報表現を生成し、浅いネットワークはターゲットモデルパラメータにマップする。
論文 参考訳(メタデータ) (2024-05-13T15:22:15Z) - Policy Gradient with Tree Expansion [72.10002936187388]
政策勾配法は、大きなばらつきと高いサンプルの複雑さを持つことで有名である。
我々は、計画を採用するソフトマックスの一般化であるSoftTreeMaxを紹介します。
我々は、SoftTreeMaxが勾配のばらつきを3桁に減らすことを示す。
論文 参考訳(メタデータ) (2023-01-30T19:03:14Z) - Optimal Sparse Regression Trees [24.03491277969824]
本研究は,確率的最適スパース回帰木の構築に対する動的プログラミングとバウンドのアプローチを提案する。
ラベル集合上の1次元におけるk平均クラスタリングアルゴリズムの最適解に基づいて、新しい下界を利用する。
論文 参考訳(メタデータ) (2022-11-28T00:43:21Z) - Social Interpretable Tree for Pedestrian Trajectory Prediction [75.81745697967608]
本稿では,このマルチモーダル予測課題に対処するため,SIT(Social Interpretable Tree)と呼ばれる木に基づく手法を提案する。
木の根から葉までの経路は、個々の将来の軌跡を表す。
ETH-UCYとStanford Droneのデータセットによる実験結果からは,手作り木にもかかわらず,我々の手法が最先端の手法の性能に適合または超えることを示した。
論文 参考訳(メタデータ) (2022-05-26T12:18:44Z) - Hierarchical Shrinkage: improving the accuracy and interpretability of
tree-based methods [10.289846887751079]
木構造を改変しないポストホックアルゴリズムである階層収縮(Hierarchical Shrinkage, HS)を導入する。
HSは、他の正規化技術と併用しても、決定木の予測性能を大幅に向上させる。
すべてのコードとモデルはGithubにある本格的なパッケージでリリースされている。
論文 参考訳(メタデータ) (2022-02-02T02:43:23Z) - Scaling Structured Inference with Randomization [64.18063627155128]
本稿では、構造化されたモデルを数万の潜在状態に拡張するためにランダム化された動的プログラミング(RDP)のファミリを提案する。
我々の手法は古典的DPベースの推論に広く適用できる。
また、自動微分とも互換性があり、ニューラルネットワークとシームレスに統合できる。
論文 参考訳(メタデータ) (2021-12-07T11:26:41Z) - Dive into Decision Trees and Forests: A Theoretical Demonstration [0.0]
決定木は"divide-and-conquer"の戦略を使用して、入力機能とラベル間の依存性に関する複雑な問題を小さなものに分割します。
近年, 計算広告, 推薦システム, 情報検索などの性能が大幅に向上している。
論文 参考訳(メタデータ) (2021-01-20T16:47:59Z) - Growing Deep Forests Efficiently with Soft Routing and Learned
Connectivity [79.83903179393164]
この論文は、いくつかの重要な側面で深い森林のアイデアをさらに拡張します。
我々は、ノードがハードバイナリ決定ではなく、確率的ルーティング決定、すなわちソフトルーティングを行う確率的ツリーを採用する。
MNISTデータセットの実験は、私たちの力のある深部森林が[1]、[3]よりも優れたまたは匹敵するパフォーマンスを達成できることを示しています。
論文 参考訳(メタデータ) (2020-12-29T18:05:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。