論文の概要: Mixed-curvature decision trees and random forests
- arxiv url: http://arxiv.org/abs/2410.13879v1
- Date: Thu, 03 Oct 2024 00:48:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-27 06:14:42.163425
- Title: Mixed-curvature decision trees and random forests
- Title(参考訳): 混合曲率決定木とランダム森林
- Authors: Philippe Chlenski, Quentin Chu, Raiyan R. Khan, Antonio Khalil Moretti, Itsik Pe'er,
- Abstract要約: 決定木(DT)とそのランダム森林(RF)拡張はユークリッド空間における分類と回帰の作業場である。
DTおよびRFアルゴリズムを、いくつかの双曲的、超球的、ユークリッド的成分の積多様体積に拡張する。
我々の新しい DT の角的再構成は積多様体の幾何学を尊重し、測地的に凸であり、最大マージンであり、構成可能な分割を与える。
- 参考スコア(独自算出の注目度): 0.9175022232984708
- License:
- Abstract: Decision trees (DTs) and their random forest (RF) extensions are workhorses of classification and regression in Euclidean spaces. However, algorithms for learning in non-Euclidean spaces are still limited. We extend DT and RF algorithms to product manifolds: Cartesian products of several hyperbolic, hyperspherical, or Euclidean components. Such manifolds handle heterogeneous curvature while still factorizing neatly into simpler components, making them compelling embedding spaces for complex datasets. Our novel angular reformulation of DTs respects the geometry of the product manifold, yielding splits that are geodesically convex, maximum-margin, and composable. In the special cases of single-component manifolds, our method simplifies to its Euclidean or hyperbolic counterparts, or introduces hyperspherical DT algorithms, depending on the curvature. We benchmark our method on various classification, regression, and link prediction tasks on synthetic data, graph embeddings, mixed-curvature variational autoencoder latent spaces, and empirical data. Compared to six other classifiers, product DTs and RFs ranked first on 21 of 22 single-manifold benchmarks and 18 of 35 product manifold benchmarks, and placed in the top 2 on 53 of 57 benchmarks overall. This highlights the value of product DTs and RFs as straightforward yet powerful new tools for data analysis in product manifolds. Code for our paper is available at https://github.com/pchlenski/embedders.
- Abstract(参考訳): 決定木(DT)とそのランダム森林(RF)拡張はユークリッド空間における分類と回帰の作業場である。
しかし、非ユークリッド空間での学習のアルゴリズムはまだ限られている。
DT と RF のアルゴリズムを積多様体に拡張する。
このような多様体は不均質な曲率を扱うが、それでもより単純な成分に分解され、複雑なデータセットに対する魅力的な埋め込み空間となる。
我々の新しい DT の角的再構成は積多様体の幾何学を尊重し、測地的に凸であり、最大マージンであり、構成可能な分割を与える。
単成分多様体の特別の場合、この手法はユークリッドあるいは双曲型に単純化するか、あるいは曲率に応じて超球面DTアルゴリズムを導入する。
本手法は, 合成データ, グラフ埋め込み, 混合曲率変動型オートエンコーダ潜時空間, 経験的データに対する各種分類, 回帰, リンク予測タスクについてベンチマークを行った。
他の6つの分類器と比較して、製品DTとRFは、22の1次元ベンチマークの21位、35の製品多様体ベンチマークの18位にランクインし、57のベンチマークの53位にランクインした。
これは、製品 DT と RF の価値を、製品多様体におけるデータ分析のための単純かつ強力な新しいツールとして強調する。
私たちの論文のコードはhttps://github.com/pchlenski/embedders.comで公開されている。
関連論文リスト
- Highly Adaptive Ridge [84.38107748875144]
直交可積分な部分微分を持つ右連続函数のクラスにおいて,$n-2/3$自由次元L2収束率を達成する回帰法を提案する。
Harは、飽和ゼロオーダーテンソル積スプライン基底展開に基づいて、特定のデータ適応型カーネルで正確にカーネルリッジレグレッションを行う。
我々は、特に小さなデータセットに対する最先端アルゴリズムよりも経験的性能が優れていることを示す。
論文 参考訳(メタデータ) (2024-10-03T17:06:06Z) - Mixed-Curvature Decision Trees and Random Forests [0.6656737591902598]
決定木とランダムフォレストアルゴリズムを積空間多様体に拡張する。
本手法は積多様体の分類と回帰のための単純で表現力豊かな方法を実現する。
実装と実験のコードはhttps://github.com/pchlenski/embedders.comで公開されている。
論文 参考訳(メタデータ) (2024-06-07T19:29:55Z) - Scaling Riemannian Diffusion Models [68.52820280448991]
非自明な多様体上の高次元タスクにスケールできることを示す。
我々は、$SU(n)$格子上のQCD密度と高次元超球面上の対照的に学習された埋め込みをモデル化する。
論文 参考訳(メタデータ) (2023-10-30T21:27:53Z) - Principal Component Analysis in Space Forms [7.822210329345704]
空間形式における主成分分析(PCA)について検討する。
空間形式における与えられた点に対する最適の低次元アフィン部分空間を見つけることは次元減少に等しい。
最適アフィン部分空間は等式への解であり、(2)異なる次元の最適アフィン部分空間はネスト集合を形成する。
論文 参考訳(メタデータ) (2023-01-06T23:48:37Z) - Combating Mode Collapse in GANs via Manifold Entropy Estimation [70.06639443446545]
Generative Adversarial Networks (GAN) は、様々なタスクやアプリケーションにおいて魅力的な結果を示している。
GANのモード崩壊問題に対処するための新しいトレーニングパイプラインを提案する。
論文 参考訳(メタデータ) (2022-08-25T12:33:31Z) - Dimension Reduction and Data Visualization for Fr\'echet Regression [8.713190936209156]
Fr'echet回帰モデルは、計量空間値応答を用いた回帰分析のための有望なフレームワークを提供する。
本研究では,Fr'echet回帰のためのフレキシブルな十分次元縮小法(SDR)を導入し,二つの目的を達成した。
論文 参考訳(メタデータ) (2021-10-01T15:01:32Z) - Linear Classifiers in Mixed Constant Curvature Spaces [40.82908295137667]
我々は、ユークリッド空間、球面空間、双曲空間の混合である積空間形式の線形分類の問題に対処する。
我々は、$d$-次元定数曲率空間の線形分類子が正確に$d+1$点を粉砕できることを証明した。
新規なパーセプトロン分類アルゴリズムを記述し、厳密な収束結果を確立する。
論文 参考訳(メタデータ) (2021-02-19T23:29:03Z) - Manifold learning with arbitrary norms [8.433233101044197]
本研究では,アースモーバー距離に基づく多様体学習が,分子形状空間を学習する標準的なユークリッド変種よりも優れていることを示す。
数値シミュレーションにより,アースモーバー距離に基づく多様体学習は,分子形状空間を学習するための標準ユークリッド変種よりも優れていることを示した。
論文 参考訳(メタデータ) (2020-12-28T10:24:30Z) - Joint and Progressive Subspace Analysis (JPSA) with Spatial-Spectral
Manifold Alignment for Semi-Supervised Hyperspectral Dimensionality Reduction [48.73525876467408]
本稿では,超スペクトル部分空間解析のための新しい手法を提案する。
この手法はジョイント・アンド・プログレッシブ・サブスペース分析(JPSA)と呼ばれる。
2つの広帯域超スペクトルデータセットに対して提案したJPSAの優位性と有効性を示す実験を行った。
論文 参考訳(メタデータ) (2020-09-21T16:29:59Z) - Manifold Learning via Manifold Deflation [105.7418091051558]
次元削減法は、高次元データの可視化と解釈に有用な手段を提供する。
多くの一般的な手法は単純な2次元のマニフォールドでも劇的に失敗する。
本稿では,グローバルな構造を座標として組み込んだ,新しいインクリメンタルな空間推定器の埋め込み手法を提案する。
実験により,本アルゴリズムは実世界および合成データセットに新規で興味深い埋め込みを復元することを示した。
論文 参考訳(メタデータ) (2020-07-07T10:04:28Z) - Improved guarantees and a multiple-descent curve for Column Subset
Selection and the Nystr\"om method [76.73096213472897]
我々は,データ行列のスペクトル特性を利用して近似保証を改良する手法を開発した。
我々のアプローチは、特異値減衰の既知の速度を持つデータセットのバウンダリが大幅に向上する。
RBFパラメータを変更すれば,改良された境界線と多重発振曲線の両方を実データセット上で観測できることが示される。
論文 参考訳(メタデータ) (2020-02-21T00:43:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。