論文の概要: Scalable Tree Ensemble Proximities in Python
- arxiv url: http://arxiv.org/abs/2601.02735v1
- Date: Tue, 06 Jan 2026 05:57:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-07 17:02:12.819255
- Title: Scalable Tree Ensemble Proximities in Python
- Title(参考訳): Pythonにおけるスケーラブルなツリーアンサンブルの近さ
- Authors: Adrien Aumon, Guy Wolf, Kevin R. Moon, Jake S. Rhodes,
- Abstract要約: 本稿では,分離重み付きリーフ衝突確率の族を定義することによって,効率的な近接計算のための一般的なフレームワークを提案する。
この家系の任意の近接測度は、厳密なスパース行列の分解を認め、計算を葉面衝突に制限し、明示的なペアワイズ比較を避けることを示します。
この定式化により、Pythonのスパース線形代数を用いた低メモリでスケーラブルな近接計算が可能となる。
- 参考スコア(独自算出の注目度): 13.276175025794794
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Tree ensemble methods such as Random Forests naturally induce supervised similarity measures through their decision tree structure, but existing implementations of proximities derived from tree ensembles typically suffer from quadratic time or memory complexity, limiting their scalability. In this work, we introduce a general framework for efficient proximity computation by defining a family of Separable Weighted Leaf-Collision Proximities. We show that any proximity measure in this family admits an exact sparse matrix factorization, restricting computation to leaf-level collisions and avoiding explicit pairwise comparisons. This formulation enables low-memory, scalable proximity computation using sparse linear algebra in Python. Empirical benchmarks demonstrate substantial runtime and memory improvements over traditional approaches, allowing tree ensemble proximities to scale efficiently to datasets with hundreds of thousands of samples on standard CPU hardware.
- Abstract(参考訳): ランダムフォレストのような木のアンサンブル法は自然に木の構造を通じて類似度を誘導するが、木アンサンブルから派生した既存の確率の実装は2次時間またはメモリの複雑さに悩まされ、スケーラビリティが制限される。
本研究では,分離重み付きリーフ衝突確率の族を定義することによって,効率的な近接計算のための一般的なフレームワークを提案する。
この家系の任意の近接測度は、厳密なスパース行列分解を認め、計算を葉面衝突に制限し、明示的なペアワイズ比較を避けることを示します。
この定式化により、Pythonのスパース線形代数を用いた低メモリでスケーラブルな近接計算が可能となる。
経験的なベンチマークでは、従来のアプローチよりも大幅にランタイムとメモリが改善されており、ツリーアンサンブルの確率は、標準CPUハードウェア上で数十万のサンプルを持つデータセットに効率的にスケールできる。
関連論文リスト
- Oxytrees: Model Trees for Bipartite Learning [1.3854111346209868]
Oxytreesはプロキシベースのビクラスタリングモデルツリーで、相互作用行列を行および列のプロキシ行列に圧縮する。
Oxytrees は Kronecker の製品カーネルを葉に用いた線形モデルを採用しており、結果としてより浅い木が生まれ、より高速な訓練が行われている。
我々は、最先端の二群林と比較して、訓練時間の最大30倍の改善を実現した。
論文 参考訳(メタデータ) (2025-11-16T17:57:13Z) - TreePO: Bridging the Gap of Policy Optimization and Efficacy and Inference Efficiency with Heuristic Tree-based Modeling [65.46347858249295]
TreePOは自己誘導型ロールアウトアルゴリズムで、シーケンス生成を木構造検索プロセスとして見る。
TreePOは基本的に、探索の多様性を保存または強化しながら、更新毎の計算負担を削減します。
論文 参考訳(メタデータ) (2025-08-24T16:52:37Z) - Bridging Arbitrary and Tree Metrics via Differentiable Gromov Hyperbolicity [12.942913564426272]
任意の計量空間が与えられると、ツリー計量からの偏差はグロモフの$delta$-hyperbolicityによって定量化できる。
本稿では,差分最適化フレームワーク DeltaZero を導入し,この問題を解決する。
我々の手法は一貫して最先端の歪みを実現する。
論文 参考訳(メタデータ) (2025-05-27T11:58:37Z) - Terminating Differentiable Tree Experts [77.2443883991608]
本稿では,変圧器と表現生成器の組み合わせを用いて木操作を学習するニューラルシンボリック微分木機械を提案する。
まず、専門家の混在を導入することで、各ステップで使用される一連の異なるトランスフォーマーレイヤを取り除きます。
また,モデルが自動生成するステップ数を選択するための新しい終端アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-02T08:45:38Z) - A Unified Approach to Extract Interpretable Rules from Tree Ensembles via Integer Programming [2.1408617023874443]
ツリーアンサンブルは非常に人気のある機械学習モデルであり、教師付き分類と回帰タスクの有効性で知られている。
我々の研究は、訓練された木アンサンブルから最適化されたルールのリストを抽出することを目的としており、ユーザーは完全なモデルの予測力をほとんど保持する凝縮された解釈可能なモデルを提供する。
我々の広範な計算実験は,木アンサンブルに対する予測性能と忠実度の観点から,本手法が他のルール抽出法と競合することを示す統計的に有意な証拠を提供する。
論文 参考訳(メタデータ) (2024-06-30T22:33:47Z) - Learning a Decision Tree Algorithm with Transformers [75.96920867382859]
メタ学習によってトレーニングされたトランスフォーマーベースのモデルであるMetaTreeを導入し、強力な決定木を直接生成する。
我々は、多くのデータセットに欲求決定木とグローバルに最適化された決定木の両方を適合させ、MetaTreeを訓練して、強力な一般化性能を実現する木のみを生成する。
論文 参考訳(メタデータ) (2024-02-06T07:40:53Z) - Hexatagging: Projective Dependency Parsing as Tagging [63.5392760743851]
文中の単語を有限個の可能なタグの要素でタグ付けすることで、依存関係木を構成する新しい依存性であるヘキサトガーを導入する。
私たちのアプローチは、トレーニング時に完全に並列化可能です。すなわち、依存関係のパースを構築するのに必要な構造構築アクションは、互いに並列に予測できます。
我々はPenn Treebankテストセット上で96.4 LASと97.4 UASの最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-08T18:02:07Z) - An Efficient Adversarial Attack for Tree Ensembles [91.05779257472675]
傾斜促進決定木(DT)や無作為林(RF)などの木に基づくアンサンブルに対する敵対的攻撃
提案手法は,従来のMILP (Mixed-integer linear programming) よりも数千倍高速であることを示す。
私たちのコードはhttps://chong-z/tree-ensemble- attackで利用可能です。
論文 参考訳(メタデータ) (2020-10-22T10:59:49Z) - Convex Polytope Trees [57.56078843831244]
コンベックスポリトープ木(CPT)は、決定境界の解釈可能な一般化によって決定木の系統を拡張するために提案される。
木構造が与えられたとき,木パラメータに対するCPTおよび拡張性のあるエンドツーエンドトレーニングアルゴリズムを効率的に構築する。
論文 参考訳(メタデータ) (2020-10-21T19:38:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。