論文の概要: Unmasking Trees for Tabular Data
- arxiv url: http://arxiv.org/abs/2407.05593v3
- Date: Sun, 29 Sep 2024 22:03:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-01 22:01:25.420416
- Title: Unmasking Trees for Tabular Data
- Title(参考訳): 語彙データのための木を解き放つ
- Authors: Calvin McCarter,
- Abstract要約: 勾配型決定木を用いた表計算(および生成)の簡易な方法であるUnmaskingTreesを提案する。
条件生成サブプロブレムを解決するために,木分類器のバランス木に適合するBaltoBotを提案する。
従来の方法とは異なり、条件分布のパラメトリックな仮定は必要とせず、多重モーダル分布を持つ特徴を収容する。
我々はついに2つのアプローチをメタアルゴリズムとみなし、TabPFNを用いた文脈内学習に基づく生成モデリングを実証した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Despite much work on advanced deep learning and generative modeling techniques for tabular data generation and imputation, traditional methods have continued to win on imputation benchmarks. We herein present UnmaskingTrees, a simple method for tabular imputation (and generation) employing gradient-boosted decision trees which are used to incrementally unmask individual features. This approach offers state-of-the-art performance on imputation, and on generation given training data with missingness; and it has competitive performance on vanilla generation. To solve the conditional generation subproblem, we propose a tabular probabilistic prediction method, BaltoBot, which fits a balanced tree of boosted tree classifiers. Unlike older methods, it requires no parametric assumption on the conditional distribution, accommodating features with multimodal distributions; unlike newer diffusion methods, it offers fast sampling, closed-form density estimation, and flexible handling of discrete variables. We finally consider our two approaches as meta-algorithms, demonstrating in-context learning-based generative modeling with TabPFN.
- Abstract(参考訳): 表形式のデータ生成と計算のための高度なディープラーニングと生成モデリング技術に関する研究にもかかわらず、従来の手法は計算ベンチマークで勝利し続けている。
本稿では,個々の特徴を段階的に解き放つために,勾配型決定木を用いた表計算(および生成)の簡単な方法であるUnmaskingTreesを提案する。
このアプローチは、命令処理における最先端のパフォーマンスと、不足したトレーニングデータを生成時に提供し、バニラ生成に対する競合的なパフォーマンスを提供する。
条件生成サブプロブレムを解決するために,木分類器のバランス木に適合する表型確率予測手法BaltoBotを提案する。
従来の方法とは異なり、条件分布のパラメトリックな仮定は不要であり、より新しい拡散法とは異なり、高速サンプリング、クローズドフォーム密度推定、離散変数のフレキシブルハンドリングを提供する。
我々はついに2つのアプローチをメタアルゴリズムとみなし、TabPFNを用いた文脈内学習に基づく生成モデリングを実証した。
関連論文リスト
- Learning a Decision Tree Algorithm with Transformers [80.49817544396379]
本稿では,従来のアルゴリズムから出力されたフィルタを用いてトランスフォーマーモデルを用いて,分類のための強力な決定木を生成するメタトレーについて紹介する。
次にMetaTreeをトレーニングして、強力な一般化パフォーマンスを実現するツリーを生成します。
論文 参考訳(メタデータ) (2024-02-06T07:40:53Z) - On the Two Sides of Redundancy in Graph Neural Networks [6.14580854336436]
我々は近所の木に基づく新しい集約手法を開発した。
近傍木をコンパクトに表現し,それらをマージし,計算冗長性を生かした。
我々の手法は従来のメッセージパッシングニューラルネットワークよりも過度に理解されにくい。
論文 参考訳(メタデータ) (2023-10-06T12:09:09Z) - GRANDE: Gradient-Based Decision Tree Ensembles for Tabular Data [9.107782510356989]
そこで本研究では,エンドツーエンドの勾配勾配勾配を用いた軸方向決定木アンサンブルの学習手法を提案する。
Grandeはツリーアンサンブルの密度の高い表現に基づいており、ストレートスルー演算子でバックプロパゲーションを使用することができる。
提案手法は,ほとんどのデータセットにおいて,既存の勾配ブースティングおよびディープラーニングフレームワークよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-09-29T10:49:14Z) - TreeLearn: A Comprehensive Deep Learning Method for Segmenting
Individual Trees from Ground-Based LiDAR Forest Point Clouds [42.87502453001109]
森林点雲のツリーインスタンスセグメンテーションのためのディープラーニングに基づくアプローチであるTreeLearnを提案する。
TreeLearnは、すでにセグメンテーションされたポイントクラウドにデータ駆動でトレーニングされているため、事前に定義された機能やアルゴリズムに依存しない。
我々は、Lidar360ソフトウェアを使って6665本の木の森林点雲上でTreeLearnを訓練した。
論文 参考訳(メタデータ) (2023-09-15T15:20:16Z) - Hierarchical clustering with dot products recovers hidden tree structure [53.68551192799585]
本稿では,階層構造の回復に着目した凝集クラスタリングアルゴリズムの新しい視点を提案する。
クラスタを最大平均点積でマージし、例えば最小距離やクラスタ内分散でマージしないような、標準的なアルゴリズムの単純な変種を推奨する。
このアルゴリズムにより得られた木は、汎用確率的グラフィカルモデルの下で、データ中の生成的階層構造をボナフェイド推定することを示した。
論文 参考訳(メタデータ) (2023-05-24T11:05:12Z) - Smart-Tree: Neural Medial Axis Approximation of Point Clouds for 3D Tree
Skeletonization [0.0]
Smart-Treeは、ツリーポイントクラウドから分岐骨格の中間軸を近似する教師付き手法である。
グリーディアルゴリズムは、推定メディア軸を用いてロバストな骨格化を行う。
我々は,多種合成ツリーデータセットを用いてSmart-Treeを評価し,実世界のツリーポイントクラウド上で定性解析を行う。
論文 参考訳(メタデータ) (2023-03-21T03:03:46Z) - RLET: A Reinforcement Learning Based Approach for Explainable QA with
Entailment Trees [47.745218107037786]
本稿では,強化学習に基づくEntailment Tree生成フレームワークであるRLETを提案する。
RLETは文の選択と推論生成モジュールによる単一ステップ推論を反復的に行う。
EntailmentBankデータセットの3つの設定の実験では、RLフレームワークを使用することの強みが示されている。
論文 参考訳(メタデータ) (2022-10-31T06:45:05Z) - TreeMix: Compositional Constituency-based Data Augmentation for Natural
Language Understanding [56.794981024301094]
自然言語理解のための合成データ拡張手法であるTreeMixを提案する。
具体的には、TreeMixは、選択構文解析木を利用して、文章を構成要素のサブ構造に分解し、ミックスアップデータ拡張技術を使って、それらを再結合して新しい文を生成する。
従来のアプローチと比較して、TreeMixは生成されたサンプルにより多様性を導入し、NLPデータの合成性を学ぶようモデルに促している。
論文 参考訳(メタデータ) (2022-05-12T15:25:12Z) - Incorporating Constituent Syntax for Coreference Resolution [50.71868417008133]
本稿では,構成構文構造をグラフベースで組み込む手法を提案する。
また、高次近傍情報を利用して構成木に富んだ構造をエンコードすることも検討する。
on the English and Chinese parts of OntoNotes 5.0 benchmark shows that our proposed model beats a strong baseline or a new-of-the-art performance。
論文 参考訳(メタデータ) (2022-02-22T07:40:42Z) - Visualizing hierarchies in scRNA-seq data using a density tree-biased
autoencoder [50.591267188664666]
本研究では,高次元scRNA-seqデータから意味のある木構造を同定する手法を提案する。
次に、低次元空間におけるデータのツリー構造を強調する木バイアスオートエンコーダDTAEを紹介する。
論文 参考訳(メタデータ) (2021-02-11T08:48:48Z) - Tree! I am no Tree! I am a Low Dimensional Hyperbolic Embedding [7.381113319198104]
本稿では,メタボリック・ファースト・アプローチを用いて,双曲表現を学習する新しい手法について検討する。
低次元の双曲的埋め込みを直接決定するのではなく、データ上の木構造を学習する。
この木構造は、双曲多様体に埋め込まれた階層的な情報を抽出するために直接使用できる。
論文 参考訳(メタデータ) (2020-05-08T04:30:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。