論文の概要: flexBART: Flexible Bayesian regression trees with categorical predictors
- arxiv url: http://arxiv.org/abs/2211.04459v2
- Date: Wed, 21 Jun 2023 15:40:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-22 18:03:38.595348
- Title: flexBART: Flexible Bayesian regression trees with categorical predictors
- Title(参考訳): flexBART:カテゴリー予測子を持つ柔軟なベイズ回帰木
- Authors: Sameer K. Deshpande
- Abstract要約: ベイズ加法回帰木 (BART) のほとんどの実装は、カテゴリ予測を符号化し、それぞれを複数のバイナリインジケータに置き換えている。
決定ツリーノードの両ブランチに複数のレベルを割り当てるレグレッションツリーでBARTを再実装します。
flexBARTパッケージで利用可能な再実装は、しばしばサンプル外の予測性能を改善し、より大きなデータセットにスケールする。
- 参考スコア(独自算出の注目度): 1.0152838128195467
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Most implementations of Bayesian additive regression trees (BART) one-hot
encode categorical predictors, replacing each one with several binary
indicators, one for every level or category. Regression trees built with these
indicators partition the discrete set of categorical levels by repeatedly
removing one level at a time. Unfortunately, the vast majority of partitions
cannot be built with this strategy, severely limiting BART's ability to
partially pool data across groups of levels. Motivated by analyses of baseball
data and neighborhood-level crime dynamics, we overcame this limitation by
re-implementing BART with regression trees that can assign multiple levels to
both branches of a decision tree node. To model spatial data aggregated into
small regions, we further proposed a new decision rule prior that creates
spatially contiguous regions by deleting a random edge from a random spanning
tree of a suitably defined network. Our re-implementation, which is available
in the flexBART package, often yields improved out-of-sample predictive
performance and scales better to larger datasets than existing implementations
of BART.
- Abstract(参考訳): ベイズ加法回帰木 (BART) のほとんどの実装は、分類的予測を符号化し、それぞれを複数のバイナリ指標に置き換えている。
これらの指標で構築された回帰木は、カテゴリレベルの離散的な集合を、一度に1つのレベルを繰り返すことで分割する。
残念ながら、ほとんどのパーティションは、この戦略で構築できないため、BARTのレベルでデータを部分的にプールする能力は極めて制限されている。
野球データと近隣犯罪動態の分析により,決定木ノードの両枝に複数のレベルを割り当てる回帰木を用いてBARTを再実装することで,この制限を克服する。
そこで我々は,小領域に集約された空間データをモデル化するために,適宜定義されたネットワークのランダムスパンニングツリーからランダムエッジを削除し,空間的に連続した領域を生成する新しい決定ルールを提案する。
flexBARTパッケージで利用可能な再実装は、しばしばサンプル外の予測性能を改善し、既存のBART実装よりも大きなデータセットにスケールする。
関連論文リスト
- Oblique Bayesian additive regression trees [0.5356944479760104]
BART(Bayesian Additive Regression Tree)の現在の実装は軸整列決定規則に基づいている。
我々は、データ適応型決定ルールを利用するBARTの斜めバージョンを開発する。
斜めのBARTと軸方向のBARTや他の木のアンサンブル手法を体系的に比較し、斜めのBARTが -- 時として -- より優れていたことを発見した。
論文 参考訳(メタデータ) (2024-11-13T18:29:58Z) - Learning a Decision Tree Algorithm with Transformers [75.96920867382859]
メタ学習によってトレーニングされたトランスフォーマーベースのモデルであるMetaTreeを導入し、強力な決定木を直接生成する。
我々は、多くのデータセットに欲求決定木とグローバルに最適化された決定木の両方を適合させ、MetaTreeを訓練して、強力な一般化性能を実現する木のみを生成する。
論文 参考訳(メタデータ) (2024-02-06T07:40:53Z) - Large-scale Fully-Unsupervised Re-Identification [78.47108158030213]
大規模未ラベルデータから学ぶための2つの戦略を提案する。
第1の戦略は、近傍関係に違反することなく、それぞれのデータセットサイズを減らすために、局所的な近傍サンプリングを行う。
第2の戦略は、低時間上限の複雑さを持ち、メモリの複雑さを O(n2) から O(kn) に k n で還元する新しい再帰的手法を利用する。
論文 参考訳(メタデータ) (2023-07-26T16:19:19Z) - Hierarchical clustering with dot products recovers hidden tree structure [53.68551192799585]
本稿では,階層構造の回復に着目した凝集クラスタリングアルゴリズムの新しい視点を提案する。
クラスタを最大平均点積でマージし、例えば最小距離やクラスタ内分散でマージしないような、標準的なアルゴリズムの単純な変種を推奨する。
このアルゴリズムにより得られた木は、汎用確率的グラフィカルモデルの下で、データ中の生成的階層構造をボナフェイド推定することを示した。
論文 参考訳(メタデータ) (2023-05-24T11:05:12Z) - Theory of Posterior Concentration for Generalized Bayesian Additive
Regression Trees [0.685316573653194]
ベイズ木とその加法的アンサンブルに対する一般化された枠組みについて述べる。
応答分布について十分な条件を導出し, 後部が最小マックスで集中する条件を対数係数まで導出する。
論文 参考訳(メタデータ) (2023-04-25T00:52:48Z) - Hierarchical Embedded Bayesian Additive Regression Trees [0.0]
HE-BARTは、レグレッションツリーのセットの終端ノードレベルにランダムエフェクトを含めることができる。
シミュレーションおよび実世界の例を用いて、HE-BARTは標準的な混合効果モデルのサンプルデータセットの多くに対して優れた予測が得られることを示した。
この論文の今後のバージョンでは、より大きく、より高度なデータセットと構造での使用について概説する。
論文 参考訳(メタデータ) (2022-04-14T19:56:03Z) - GP-BART: a novel Bayesian additive regression trees approach using
Gaussian processes [1.03590082373586]
GP-BARTモデル(GP-BART model)は、すべての木間の各終端ノードの予測にGP先行を仮定することで制限に対処するBARTの拡張である。
モデルの有効性は、シミュレーションおよび実世界のデータへの応用を通じて実証され、様々なシナリオにおける従来のモデリング手法のパフォーマンスを上回る。
論文 参考訳(メタデータ) (2022-04-05T11:18:44Z) - Improved Branch and Bound for Neural Network Verification via Lagrangian
Decomposition [161.09660864941603]
ニューラルネットワークの入出力特性を公式に証明するためのブランチとバウンド(BaB)アルゴリズムのスケーラビリティを改善します。
活性化に基づく新しい分岐戦略とBaBフレームワークであるブランチとデュアルネットワーク境界(BaDNB)を提案する。
BaDNBは、従来の完全検証システムを大きなマージンで上回り、対数特性で平均検証時間を最大50倍に削減した。
論文 参考訳(メタデータ) (2021-04-14T09:22:42Z) - Rethinking Learnable Tree Filter for Generic Feature Transform [71.77463476808585]
Learnable Tree Filterはセマンティックセグメンテーションのためのモデル構造保存関係に対する顕著なアプローチを示す。
幾何学的制約を緩和するために,マルコフ確率場として再構成して解析を行い,学習可能な不定項を導入する。
セマンティックセグメンテーションでは、ベルとホイッスルなしでCityscapesベンチマークでトップパフォーマンス(82.1% mIoU)を達成しています。
論文 参考訳(メタデータ) (2020-12-07T07:16:47Z) - Convex Polytope Trees [57.56078843831244]
コンベックスポリトープ木(CPT)は、決定境界の解釈可能な一般化によって決定木の系統を拡張するために提案される。
木構造が与えられたとき,木パラメータに対するCPTおよび拡張性のあるエンドツーエンドトレーニングアルゴリズムを効率的に構築する。
論文 参考訳(メタデータ) (2020-10-21T19:38:57Z) - Bayesian Additive Regression Trees with Model Trees [0.0]
モデルツリーBART(MOTR-BART)と呼ばれるBARTの拡張を導入する。
MOTR-BARTは、分数定数ではなく、ノードレベルでの分数線形関数を考える。
提案手法では, 局所的な線形性がより効率的に取得され, BARTと同等以上の性能を達成するために, 木を少なくする。
論文 参考訳(メタデータ) (2020-06-12T22:19:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。