Fugu-MT 論文翻訳(概要): On Imbalanced Regression with Hoeffding Trees

論文の概要: On Imbalanced Regression with Hoeffding Trees

arxiv url: http://arxiv.org/abs/2602.22101v1
Date: Wed, 25 Feb 2026 16:48:07 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-26 18:19:16.917924
Title: On Imbalanced Regression with Hoeffding Trees
Title（参考訳）: ホイフディング木による不均衡回帰について
Authors: Pantia-Marina Alchirch, Dimitrios I. Diochnos,
Abstract要約: ホイフディングの木とその変種は、その有効性から長年の伝統がある。バッチ学習における最近の研究は、カーネル密度推定がスムーズな予測に有効なアプローチであることを示している。階層的縮小をインクリメンタルな決定木モデルに拡張する。
参考スコア（独自算出の注目度）: 1.3149034455953847
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Many real-world applications provide a continuous stream of data that is subsequently used by machine learning models to solve regression tasks of interest. Hoeffding trees and their variants have a long-standing tradition due to their effectiveness, either alone or as base models in broader ensembles. At the same time a recent line of work in batch learning has shown that kernel density estimation (KDE) is an effective approach for smoothed predictions in imbalanced regression tasks [Yang et al., 2021]. Moreover, another recent line of work for batch learning, called hierarchical shrinkage (HS) [Agarwal et al., 2022], has introduced a post-hoc regularization method for decision trees that does not alter the structure of the learned tree. Using a telescoping argument we cast KDE to streaming environments and extend the implementation of HS to incremental decision tree models. Armed with these extensions we investigate the performance of decision trees that may enjoy such options in datasets commonly used for regression in online settings. We conclude that KDE is beneficial in the early parts of the stream, while HS hardly, if ever, offers performance benefits. Our code is publicly available at: https://github.com/marinaAlchirch/DSFA_2026.
Abstract（参考訳）: 多くの現実世界のアプリケーションは連続したデータストリームを提供し、その後、機械学習モデルによって関心のある回帰タスクを解決するために使用される。ホイフディングの木とその変種は、その効果が単独でも、より広いアンサンブルのベースモデルとしても、長く続いた伝統を持っている。同時に、バッチ学習における最近の研究は、カーネル密度推定(KDE)が不均衡回帰タスク(Yang et al , 2021)におけるスムーズな予測に有効なアプローチであることを示した。さらに, 階層的縮小 (HS) [Agarwal et al , 2022] と呼ばれる近年のバッチ学習では, 学習木の構造を変えない決定木に対するポストホック正規化法が導入された。テレスコープの引数を使用して、KDEをストリーミング環境にキャストし、HSの実装をインクリメンタルな決定ツリーモデルに拡張します。これらの拡張を活用して、オンライン設定の回帰によく使用されるデータセットでそのような選択肢を楽しむことができる決定木の性能を調査します。 KDEはストリームの初期段階で有益である一方、HSはパフォーマンス上のメリットをほとんど提供していない、と結論付けています。私たちのコードは、https://github.com/marinaAlchirch/DSFA_2026で公開されています。

関連論文リスト

BranchGRPO: Stable and Efficient GRPO with Structured Branching in Diffusion Models [57.304411396229035]
BranchGRPOは、ロールアウトプロセスを分岐木に再構成する手法である。 HPDv2.1イメージアライメントでは、BranchGRPOはDanceGRPOよりも最大でtextbf16%のアライメントスコアを改善する。ハイブリッド版であるBranchGRPO-MixはDanceGRPOよりも4.7倍の速度でトレーニングを加速する。
論文参考訳（メタデータ） (2025-09-07T12:53:06Z)
Scaling Linear Attention with Sparse State Expansion [62.749291436866606]
トランスフォーマーアーキテクチャは、2次計算と線形メモリ成長による長期コンテキストシナリオに苦慮している。より効率的な文脈圧縮を実現するための2つの重要な革新を提案する。まず、情報分類として状態更新を概念化し、線形注意のための行スパース更新定式化を導入する。次に、スパースフレームワーク内にスパース状態拡張(SSE)を示し、コンテキスト状態を複数のパーティションに拡張する。
論文参考訳（メタデータ） (2025-07-22T13:27:31Z)
Hierarchical Quantized Diffusion Based Tree Generation Method for Hierarchical Representation and Lineage Analysis [49.00783841494125]
HDTreeは階層的潜在空間内の木関係を、統一的な階層的コードブックと量子化拡散プロセスを用いてキャプチャする。 HDTreeの有効性は、汎用データセットと単一セルデータセットの比較によって示される。これらの貢献は階層的な系統解析のための新しいツールを提供し、より正確で効率的な細胞分化経路のモデリングを可能にする。
論文参考訳（メタデータ） (2025-06-29T15:19:13Z)
A Powerful Random Forest Featuring Linear Extensions (RaFFLE) [1.2233362977312945]
RaFFLEは、ランダムな森林アンサンブル内でPILOTツリーをベースラーナーとして統合する新しいフレームワークである。 PILOT木は、従来の決定木の計算効率と線形モデル木の柔軟性を組み合わせたものである。 RaFFLEは様々な回帰問題に対処するための汎用ツールであることが証明されている。
論文参考訳（メタデータ） (2025-02-14T14:22:51Z)
Conditional Density Estimation with Histogram Trees [3.5297361401370044]
条件密度推定(CDE)は、完全な条件分布をモデル化することによって回帰を超える。現在の手法ではカーネルに基づくアプローチが一般的であり、カーネル密度推定や線形モデルの基底関数としてカーネル関数を直接使用する。本研究では,各葉がヒストグラムモデルによって形成される決定木からなる完全非パラメータモデルである条件密度木(CDTree)を提案する。
論文参考訳（メタデータ） (2024-10-15T09:53:24Z)
Large Continual Instruction Assistant [59.585544987096974]
CIT(Continuous Instruction Tuning)は、大規模モデルにデータによる人間の意図データに従うよう指示するために用いられる。既存の更新勾配は、CITプロセス中に前のデータセットのパフォーマンスを著しく損なうことになる。本稿では,この課題に対処する汎用的な連続的命令チューニングフレームワークを提案する。
論文参考訳（メタデータ） (2024-10-08T11:24:59Z)
Forecasting with Hyper-Trees [50.72190208487953]
Hyper-Treesは時系列モデルのパラメータを学習するために設計されている。対象とする時系列モデルのパラメータを特徴に関連付けることで、Hyper-Treesはパラメータ非定常性の問題にも対処する。この新しいアプローチでは、木はまず入力特徴から情報表現を生成し、浅いネットワークはターゲットモデルパラメータにマップする。
論文参考訳（メタデータ） (2024-05-13T15:22:15Z)
Policy Gradient with Tree Expansion [72.10002936187388]
政策勾配法は、大きなばらつきと高いサンプルの複雑さを持つことで有名である。我々は、計画を採用するソフトマックスの一般化であるSoftTreeMaxを紹介します。我々は、SoftTreeMaxが勾配のばらつきを3桁に減らすことを示す。
論文参考訳（メタデータ） (2023-01-30T19:03:14Z)
Optimal Sparse Regression Trees [24.03491277969824]
本研究は,確率的最適スパース回帰木の構築に対する動的プログラミングとバウンドのアプローチを提案する。ラベル集合上の1次元におけるk平均クラスタリングアルゴリズムの最適解に基づいて、新しい下界を利用する。
論文参考訳（メタデータ） (2022-11-28T00:43:21Z)
Social Interpretable Tree for Pedestrian Trajectory Prediction [75.81745697967608]
本稿では,このマルチモーダル予測課題に対処するため,SIT(Social Interpretable Tree)と呼ばれる木に基づく手法を提案する。木の根から葉までの経路は、個々の将来の軌跡を表す。 ETH-UCYとStanford Droneのデータセットによる実験結果からは,手作り木にもかかわらず,我々の手法が最先端の手法の性能に適合または超えることを示した。
論文参考訳（メタデータ） (2022-05-26T12:18:44Z)
Deep Equilibrium Optical Flow Estimation [80.80992684796566]
最近のSOTA(State-of-the-art)光フローモデルでは、従来のアルゴリズムをエミュレートするために有限ステップの更新操作を使用する。これらのRNNは大きな計算とメモリオーバーヘッドを課し、そのような安定した推定をモデル化するために直接訓練されていない。暗黙的層の無限レベル固定点として直接流れを解く手法として,Deep equilibrium Flow estimatorを提案する。
論文参考訳（メタデータ） (2022-04-18T17:53:44Z)
GP-BART: a novel Bayesian additive regression trees approach using Gaussian processes [1.03590082373586]
GP-BARTモデル(GP-BART model)は、すべての木間の各終端ノードの予測にGP先行を仮定することで制限に対処するBARTの拡張である。モデルの有効性は、シミュレーションおよび実世界のデータへの応用を通じて実証され、様々なシナリオにおける従来のモデリング手法のパフォーマンスを上回る。
論文参考訳（メタデータ） (2022-04-05T11:18:44Z)
Hierarchical Shrinkage: improving the accuracy and interpretability of tree-based methods [10.289846887751079]
木構造を改変しないポストホックアルゴリズムである階層収縮(Hierarchical Shrinkage, HS)を導入する。 HSは、他の正規化技術と併用しても、決定木の予測性能を大幅に向上させる。すべてのコードとモデルはGithubにある本格的なパッケージでリリースされている。
論文参考訳（メタデータ） (2022-02-02T02:43:23Z)
On multivariate randomized classification trees: $l_0$-based sparsity, VC~dimension and decomposition methods [0.9346127431927981]
Blanquero et alで提案された非線形連続最適化の定式化について検討する。我々はまず、$l_0$ノルムの凹凸近似に基づいて、そのような木をスパース化する代替手法を検討する。より大規模なデータセットを用いた実験により,提案手法は精度を損なうことなく,学習時間を著しく短縮できることが示された。
論文参考訳（メタデータ） (2021-12-09T22:49:08Z)
Scaling Structured Inference with Randomization [64.18063627155128]
本稿では、構造化されたモデルを数万の潜在状態に拡張するためにランダム化された動的プログラミング(RDP)のファミリを提案する。我々の手法は古典的DPベースの推論に広く適用できる。また、自動微分とも互換性があり、ニューラルネットワークとシームレスに統合できる。
論文参考訳（メタデータ） (2021-12-07T11:26:41Z)
Stabilizing Equilibrium Models by Jacobian Regularization [151.78151873928027]
ディープ均衡ネットワーク(Deep equilibrium Network, DEQs)は、単一非線形層の固定点を見つけるために従来の深さを推定する新しいモデルのクラスである。本稿では、平衡モデルの学習を安定させるために、固定点更新方程式のヤコビアンを明示的に正規化するDECモデルの正規化スキームを提案する。この正規化は計算コストを最小限に抑え、前方と後方の両方の固定点収束を著しく安定化させ、高次元の現実的な領域に順応することを示した。
論文参考訳（メタデータ） (2021-06-28T00:14:11Z)
Dive into Decision Trees and Forests: A Theoretical Demonstration [0.0]
決定木は"divide-and-conquer"の戦略を使用して、入力機能とラベル間の依存性に関する複雑な問題を小さなものに分割します。近年, 計算広告, 推薦システム, 情報検索などの性能が大幅に向上している。
論文参考訳（メタデータ） (2021-01-20T16:47:59Z)
Growing Deep Forests Efficiently with Soft Routing and Learned Connectivity [79.83903179393164]
この論文は、いくつかの重要な側面で深い森林のアイデアをさらに拡張します。我々は、ノードがハードバイナリ決定ではなく、確率的ルーティング決定、すなわちソフトルーティングを行う確率的ツリーを採用する。 MNISTデータセットの実験は、私たちの力のある深部森林が[1]、[3]よりも優れたまたは匹敵するパフォーマンスを達成できることを示しています。
論文参考訳（メタデータ） (2020-12-29T18:05:05Z)
Generalizing Variational Autoencoders with Hierarchical Empirical Bayes [6.273154057349038]
確率的生成モデルのための計算的に安定なフレームワークである階層的経験的ベイズオートエンコーダ(HEBAE)を提案する。鍵となる貢献は2つであり、まず、符号化分布を階層的に優先することで、再構成損失関数の最小化と過正規化の回避とのトレードオフを適応的にバランスさせることで、利益を得る。
論文参考訳（メタデータ） (2020-07-20T18:18:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。