論文の概要: Boost-R: Gradient Boosted Trees for Recurrence Data
- arxiv url: http://arxiv.org/abs/2107.08784v1
- Date: Sat, 3 Jul 2021 02:44:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-25 14:08:25.417269
- Title: Boost-R: Gradient Boosted Trees for Recurrence Data
- Title(参考訳): boost-r:gradient boosted trees for repeat data
- Authors: Xiao Liu, Rong Pan
- Abstract要約: 本稿では,静的および動的両方の特徴を持つイベントデータに対して,Boost-R(Boosting for Recurrence Data)と呼ばれる付加木に基づくアプローチを検討する。
Boost-Rは、繰り返しイベントプロセスの累積強度関数を推定するために、勾配増進付加木の集合を構成する。
- 参考スコア(独自算出の注目度): 13.40931458200203
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recurrence data arise from multi-disciplinary domains spanning reliability,
cyber security, healthcare, online retailing, etc. This paper investigates an
additive-tree-based approach, known as Boost-R (Boosting for Recurrence Data),
for recurrent event data with both static and dynamic features. Boost-R
constructs an ensemble of gradient boosted additive trees to estimate the
cumulative intensity function of the recurrent event process, where a new tree
is added to the ensemble by minimizing the regularized L2 distance between the
observed and predicted cumulative intensity. Unlike conventional regression
trees, a time-dependent function is constructed by Boost-R on each tree leaf.
The sum of these functions, from multiple trees, yields the ensemble estimator
of the cumulative intensity. The divide-and-conquer nature of tree-based
methods is appealing when hidden sub-populations exist within a heterogeneous
population. The non-parametric nature of regression trees helps to avoid
parametric assumptions on the complex interactions between event processes and
features. Critical insights and advantages of Boost-R are investigated through
comprehensive numerical examples. Datasets and computer code of Boost-R are
made available on GitHub. To our best knowledge, Boost-R is the first gradient
boosted additive-tree-based approach for modeling large-scale recurrent event
data with both static and dynamic feature information.
- Abstract(参考訳): 再発データは、信頼性、サイバーセキュリティ、ヘルスケア、オンライン小売など幅広い分野から生じる。
本稿では,静的および動的両方の特徴を持つイベントデータに対して,Boost-R(Boosting for Recurrence Data)と呼ばれる付加木に基づくアプローチを検討する。
boost-rは勾配強化付加木のアンサンブルを構築し、再帰事象過程の累積強度関数を推定し、観測値と予測値の間の正規化l2距離を最小化し、新しい木をアンサンブルに追加する。
従来の回帰木とは異なり、時間依存関数は各木の葉にBoost-Rによって構築される。
これらの関数の和は、複数の木から、累積強度のアンサンブル推定子が得られる。
不均質な集団内に隠れたサブ集団が存在する場合、木に基づく方法の分断・対数性は魅力的である。
回帰木の非パラメトリックな性質は、イベントプロセスと特徴の間の複雑な相互作用に関するパラメトリックな仮定を避けるのに役立つ。
boost-rの批判的知見と利点を包括的数値例を通して検討した。
boost-rのデータセットとコンピュータコードはgithubから入手できる。
私たちの知る限り、Boost-Rは、静的および動的特徴情報の両方で大規模なリカレントイベントデータをモデル化するための、最初のグラデーション強化付加木ベースのアプローチです。
関連論文リスト
- Forecasting with Hyper-Trees [50.72190208487953]
Hyper-Treesは時系列モデルのパラメータを学習するために設計されている。
対象とする時系列モデルのパラメータを特徴に関連付けることで、Hyper-Treesはパラメータ非定常性の問題にも対処する。
この新しいアプローチでは、木はまず入力特徴から情報表現を生成し、浅いネットワークはターゲットモデルパラメータにマップする。
論文 参考訳(メタデータ) (2024-05-13T15:22:15Z) - Understanding Augmentation-based Self-Supervised Representation Learning
via RKHS Approximation and Regression [53.15502562048627]
最近の研究は、自己教師付き学習とグラフラプラシアン作用素のトップ固有空間の近似との関係を構築している。
この研究は、増強に基づく事前訓練の統計的分析に発展する。
論文 参考訳(メタデータ) (2023-06-01T15:18:55Z) - Individualized and Global Feature Attributions for Gradient Boosted
Trees in the Presence of $\ell_2$ Regularization [0.0]
本稿では,プレデコン(PreDecomp)を提案する。プレデコン(PreDecomp,PreDecomp,PreDecomp)は,正規化を$ell$で訓練した場合に,増木に対する新規な個別化特徴属性である。
また、各ツリーのアウトサンプルデータに個々の特徴属性とラベルの内積で定義される、偏りのないグローバルな特徴属性のファミリーであるTreeInnerを提案する。
論文 参考訳(メタデータ) (2022-11-08T17:56:22Z) - Lassoed Tree Boosting [53.56229983630983]
有界断面変動のカドラー関数の大きな非パラメトリック空間において,早期に停止するn-1/4$ L2の収束速度を持つ勾配向上木アルゴリズムを証明した。
我々の収束証明は、ネストしたドンスカー類の経験的損失最小化子による早期停止に関する新しい一般定理に基づいている。
論文 参考訳(メタデータ) (2022-05-22T00:34:41Z) - To Boost or not to Boost: On the Limits of Boosted Neural Networks [67.67776094785363]
ブースティングは分類器のアンサンブルを学ぶ方法である。
ブースティングは決定木に非常に有効であることが示されているが、ニューラルネットワークへの影響は広く研究されていない。
単一のニューラルネットワークは通常、同じ数のパラメータを持つ小さなニューラルネットワークの強化されたアンサンブルよりもよく一般化される。
論文 参考訳(メタデータ) (2021-07-28T19:10:03Z) - Relational Boosted Regression Trees [1.14179290793997]
多くのタスクはデータベースに格納されたデータを使用して、強化された回帰ツリーモデルをトレーニングする。
回帰木をトレーニングするためのグレディミネーションアルゴリズムを適応させる。
論文 参考訳(メタデータ) (2021-07-25T20:29:28Z) - Gradient Boosted Binary Histogram Ensemble for Large-scale Regression [60.16351608335641]
本研究では,2値ヒストグラム分割とアンサンブル学習に基づくテキストグラディエント2値ヒストグラムアンサンブル(GBBHE)と呼ばれる大規模回帰問題に対する勾配向上アルゴリズムを提案する。
実験では, 勾配向上回帰木 (GBRT) などの他の最先端アルゴリズムと比較して, GBBHEアルゴリズムは大規模データセット上での実行時間が少なく, 有望な性能を示す。
論文 参考訳(メタデータ) (2021-06-03T17:05:40Z) - Spectral Top-Down Recovery of Latent Tree Models [13.681975313065477]
スペクトルトップダウン・リカバリ (STDR) は、大きな潜在木モデルを推定するための分割・コンカレントアプローチである。
STDRの分割ステップは非ランダムです。
代わりに、観測されたノードに関連する適切なラプラシア行列のFiedlerベクトルに基づいている。
私達はSTDRが統計的に一貫性があることを証明し、高い確率で木を正確に回復するために必要なサンプルの数を縛ります。
論文 参考訳(メタデータ) (2021-02-26T02:47:42Z) - SGA: A Robust Algorithm for Partial Recovery of Tree-Structured
Graphical Models with Noisy Samples [75.32013242448151]
ノードからの観測が独立しているが非識別的に分散ノイズによって破損した場合、Ising Treeモデルの学習を検討する。
Katiyarら。
(2020) は, 正確な木構造は復元できないが, 部分木構造を復元できることを示した。
統計的に堅牢な部分木回復アルゴリズムであるSymmetrized Geometric Averaging(SGA)を提案する。
論文 参考訳(メタデータ) (2021-01-22T01:57:35Z) - agtboost: Adaptive and Automatic Gradient Tree Boosting Computations [0.0]
agtboostは高速勾配木強化計算を実装している。
有用なモデル検証関数は、学習された分布に関するコルモゴロフ・スミルノフテストを実行する。
論文 参考訳(メタデータ) (2020-08-28T12:42:19Z) - BoostTree and BoostForest for Ensemble Learning [27.911350375268576]
BoostForestは、BoostTreeをベースラーナーとして使用したアンサンブル学習アプローチで、分類と回帰の両方に使用することができる。
一般的に、35の分類と回帰データセットにおいて、4つの古典的なアンサンブル学習アプローチ(ランサムフォレスト、エクストラトリー、XGBoost、LightGBM)より優れていた。
論文 参考訳(メタデータ) (2020-03-21T19:52:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。