論文の概要: Approximation-Free Differentiable Oblique Decision Trees
- arxiv url: http://arxiv.org/abs/2605.07837v1
- Date: Fri, 08 May 2026 15:04:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.140669
- Title: Approximation-Free Differentiable Oblique Decision Trees
- Title(参考訳): 近似自由微分可能な斜め決定木
- Authors: Subrat Prasad Panda, Blaise Genest, Arvind Easwaran,
- Abstract要約: 複雑な最適化ランドスケープと過度に適合するリスクのために、正確な斜め決定木(DT)のトレーニングは難しい。
我々は、ニューラルネットワークとしてハード斜めDTの新規で意味論的に等価で可逆表現であるDTSemNetを提案する。
DTSemNet-trained oblique DTs は最先端の微分可能 DT よりも優れていた。
- 参考スコア(独自算出の注目度): 3.224547255825731
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Decision Trees (DTs) are widely used in safety-critical domains such as medical diagnosis, valued for their interpretability and effectiveness on tabular data. However, training accurate oblique DTs is challenging due to complex optimization landscapes and overfitting risks, particularly in regression. Recent advances have introduced differentiable formulations that enable gradient-based training and joint optimization of decision boundaries and leaf regressors. Yet, existing approaches typically rely on approximations, either through probabilistic softening of boundaries (soft DTs) or quantized gradients such as the Straight-Through Estimator (STE). To overcome these limitations, we propose DTSemNet, a novel, semantically equivalent, and invertible representation of hard oblique DTs as neural networks. DTSemNet enables end-to-end training with standard gradient descent, eliminating the need for approximations in both classification and regression. While classification aligns naturally with this formulation, regression remains challenging due to the joint optimization of internal nodes and leaf regressors. To address this, we analyze the limitations of STE and introduce an annealed Top-k method that provides accurate gradient signals without approximation. Extensive experiments on classification and regression benchmarks show that DTSemNet-trained oblique DTs outperform state-of-the-art differentiable DTs. Furthermore, we demonstrate that DTSemNet can serve as programmatic DT policies in reinforcement learning environments, thereby broadening their applicability.
- Abstract(参考訳): 決定木 (Decision Trees, DT) は, 診断などの安全上重要な領域で広く用いられている。
しかし、複雑な最適化環境と、特に回帰において過度に適合するリスクのために、正確な斜めDTのトレーニングは困難である。
最近の進歩は、勾配に基づくトレーニングと、決定境界と葉の回帰器の協調最適化を可能にする、微分可能な定式化を導入している。
しかし、既存のアプローチは一般に、境界の確率的軟化(ソフトDT)またはSTE(Straight-Through Estimator)のような量子化勾配によって近似に依存する。
これらの制限を克服するために、ニューラルネットワークとしてハード斜めDTの新規で意味論的に等価で可逆な表現であるDTSemNetを提案する。
DTSemNetは、標準勾配降下によるエンドツーエンドのトレーニングを可能にし、分類と回帰の両方で近似を不要にする。
分類は、この定式化と自然に一致するが、内部ノードと葉の回帰器の共同最適化のため、回帰は依然として困難である。
そこで本研究では,STEの限界を解析し,近似を伴わずに正確な勾配信号を提供するTop-k法を提案する。
DTSemNetで訓練された斜めDTは最先端の微分可能DTよりも優れていた。
さらに,DTSemNetは強化学習環境においてプログラムによるDTポリシーとして機能し,適用性の向上を図っている。
関連論文リスト
- Decentralized Nonconvex Composite Federated Learning with Gradient Tracking and Momentum [78.27945336558987]
分散サーバ(DFL)はクライアント・クライアント・アーキテクチャへの依存をなくす。
非滑らかな正規化はしばしば機械学習タスクに組み込まれる。
本稿では,これらの問題を解決する新しいDNCFLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-04-17T08:32:25Z) - Dual Cone Gradient Descent for Training Physics-Informed Neural Networks [0.0]
物理インフォームド・デュアルニューラルネットワーク(PINN)は偏微分方程式の解法として注目されている。
コーン領域内に落下するのを確実にするために、更新された勾配の方向を調節する新しいフレームワークであるDual Cone Gradient Descent (DCGD)を提案する。
論文 参考訳(メタデータ) (2024-09-27T03:27:46Z) - Complexity-Aware Deep Symbolic Regression with Robust Risk-Seeking Policy Gradients [20.941908494137806]
本稿では,データ駆動型数式発見の堅牢性と解釈可能性を高めるために,新しい記号回帰手法を提案する。
我々の研究は、データ固有の式生成器の学習に焦点を当てた、一般的なDSRフレームワークと一致しています。
論文 参考訳(メタデータ) (2024-06-10T19:29:10Z) - Non-adversarial training of Neural SDEs with signature kernel scores [4.721845865189578]
不規則な時系列生成のための最先端性能は、これらのモデルをGANとして逆向きに訓練することで既に得られている。
本稿では,シグネチャカーネルに基づくパス空間のスコアリングルールを新たに導入する。
論文 参考訳(メタデータ) (2023-05-25T17:31:18Z) - Implicit Stochastic Gradient Descent for Training Physics-informed
Neural Networks [51.92362217307946]
物理インフォームドニューラルネットワーク(PINN)は、前方および逆微分方程式問題の解法として効果的に実証されている。
PINNは、近似すべきターゲット関数が高周波またはマルチスケールの特徴を示す場合、トレーニング障害に閉じ込められる。
本稿では,暗黙的勾配降下法(ISGD)を用いてPINNを訓練し,トレーニングプロセスの安定性を向上させることを提案する。
論文 参考訳(メタデータ) (2023-03-03T08:17:47Z) - Truncated tensor Schatten p-norm based approach for spatiotemporal
traffic data imputation with complicated missing patterns [77.34726150561087]
本研究は, モード駆動繊維による3症例の欠失を含む, 4症例の欠失パターンについて紹介する。
本モデルでは, 目的関数の非性にもかかわらず, 乗算器の交互データ演算法を統合することにより, 最適解を導出する。
論文 参考訳(メタデータ) (2022-05-19T08:37:56Z) - Improving Generalization via Uncertainty Driven Perturbations [107.45752065285821]
トレーニングデータポイントの不確実性による摂動について考察する。
損失駆動摂動とは異なり、不確実性誘導摂動は決定境界を越えてはならない。
線形モデルにおいて,UDPがロバスト性マージン決定を達成することが保証されていることを示す。
論文 参考訳(メタデータ) (2022-02-11T16:22:08Z) - Adversarial Training for Gradient Descent: Analysis Through its
Continuous-time Approximation [11.389868267342491]
敵対的トレーニングは、ディープニューラルネットワークの最も効果的な防御の1つとして、大いに人気を集めている。
本稿では,対戦訓練のミニマックスゲームに対する連続時間近似を確立する。
論文 参考訳(メタデータ) (2021-05-17T17:41:56Z) - AdaS: Adaptive Scheduling of Stochastic Gradients [50.80697760166045]
我々は、textit "knowledge gain" と textit "mapping condition" の概念を導入し、Adaptive Scheduling (AdaS) と呼ばれる新しいアルゴリズムを提案する。
実験によると、AdaSは派生した指標を用いて、既存の適応学習手法よりも高速な収束と優れた一般化、そして(b)いつトレーニングを中止するかを決定するための検証セットへの依存の欠如を示す。
論文 参考訳(メタデータ) (2020-06-11T16:36:31Z) - Extrapolation for Large-batch Training in Deep Learning [72.61259487233214]
我々は、バリエーションのホストが、我々が提案する統一されたフレームワークでカバー可能であることを示す。
本稿では,この手法の収束性を証明し,ResNet,LSTM,Transformer上での経験的性能を厳格に評価する。
論文 参考訳(メタデータ) (2020-06-10T08:22:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。