論文の概要: Uncovering Feature Interdependencies in High-Noise Environments with
Stepwise Lookahead Decision Forests
- arxiv url: http://arxiv.org/abs/2009.14572v5
- Date: Wed, 31 Mar 2021 14:24:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 22:42:23.895886
- Title: Uncovering Feature Interdependencies in High-Noise Environments with
Stepwise Lookahead Decision Forests
- Title(参考訳): ステップワイズ・ルックアヘッド決定森林を用いた高ノイズ環境における特徴相互依存性の解明
- Authors: Delilah Donick and Sandro Claudio Lera
- Abstract要約: ランダムフォレストアルゴリズムの「Stepwise lookahead」変異は、二項特徴相互依存性をよりよく発見する能力を示す。
銅先物取引の長期的戦略は、毎日の物価リターンの兆候を予測するために、欲望と無作為な森林の両方を訓練することで実証される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conventionally, random forests are built from "greedy" decision trees which
each consider only one split at a time during their construction. The
sub-optimality of greedy implementation has been well-known, yet mainstream
adoption of more sophisticated tree building algorithms has been lacking. We
examine under what circumstances an implementation of less greedy decision
trees actually yields outperformance. To this end, a "stepwise lookahead"
variation of the random forest algorithm is presented for its ability to better
uncover binary feature interdependencies. In contrast to the greedy approach,
the decision trees included in this random forest algorithm, each
simultaneously consider three split nodes in tiers of depth two. It is
demonstrated on synthetic data and financial price time series that the
lookahead version significantly outperforms the greedy one when (a) certain
non-linear relationships between feature-pairs are present and (b) if the
signal-to-noise ratio is particularly low. A long-short trading strategy for
copper futures is then backtested by training both greedy and stepwise
lookahead random forests to predict the signs of daily price returns. The
resulting superior performance of the lookahead algorithm is at least partially
explained by the presence of "XOR-like" relationships between long-term and
short-term technical indicators. More generally, across all examined datasets,
when no such relationships between features are present, performance across
random forests is similar. Given its enhanced ability to understand the
feature-interdependencies present in complex systems, this lookahead variation
is a useful extension to the toolkit of data scientists, in particular for
financial machine learning, where conditions (a) and (b) are typically met.
- Abstract(参考訳): 伝統的に無作為な森林は、建設中に一度に1つの分割しか考慮しない「欲求」決定木から構築されている。
greedyの実装の準最適性はよく知られているが、より洗練されたツリー構築アルゴリズムの主流は不足している。
欲求の少ない決定木の実装が実際にパフォーマンスを損なう状況について検討する。
この目的のために、ランダムフォレストアルゴリズムの「ステップワイズ・ルックアヘッド」変異を、二項特徴相互依存性をよりよく発見する能力として提示する。
欲深いアプローチとは対照的に、このランダムフォレストアルゴリズムに含まれる決定木は、深さ2階層の3つの分割ノードを同時に考慮している。
合成データと金融価格の時系列で、ルックアヘッド版がグリーディ版を著しく上回っていることを実証した。
(a)特徴ペア間のある非線形関係が存在すること、及び
(b)特に信号対雑音比が低い場合。
銅先物取引の長期的戦略は、日々の物価リターンの兆候を予測するために、欲望と利己的な無作為な森林の両方を訓練することで実証される。
その結果得られたルックアヘッドアルゴリズムの性能は、少なくとも、長期的な技術指標と短期的な技術指標の「XORライクな」関係の存在によって部分的に説明できる。
より一般的に、すべての調査されたデータセットにおいて、特徴間のそのような関係が存在しない場合、ランダムな森林におけるパフォーマンスは類似している。
複雑なシステムに存在する機能相互依存性を理解する能力が強化されていることから、このルックアヘッドのバリエーションはデータサイエンティストのツールキット、特に金融機械学習において有用な拡張である。
(a)及び
(b) は通常満たされる。
関連論文リスト
- Soft Hoeffding Tree: A Transparent and Differentiable Model on Data Streams [2.6524539020042663]
Hoeffding Treeのようなストリームマイニングアルゴリズムは、入ってくるデータストリームに基づいて成長する。
我々は,データストリームを無限に変化させる可能性のある,新しい微分可能かつ透明なモデルとして,ソフトなHoeffding Tree (SoHoT)を提案する。
論文 参考訳(メタデータ) (2024-11-07T15:49:53Z) - Learning a Decision Tree Algorithm with Transformers [75.96920867382859]
メタ学習によってトレーニングされたトランスフォーマーベースのモデルであるMetaTreeを導入し、強力な決定木を直接生成する。
我々は、多くのデータセットに欲求決定木とグローバルに最適化された決定木の両方を適合させ、MetaTreeを訓練して、強力な一般化性能を実現する木のみを生成する。
論文 参考訳(メタデータ) (2024-02-06T07:40:53Z) - Lookback for Learning to Branch [77.32867454769936]
Bipartite Graph Neural Networks (GNN) は、ディープラーニングに基づくMixed-Integer Linear Program (MILP) の重要コンポーネントであることが示されている。
近年の研究では、分岐とバウンド(B&B)の解法における分岐(可変選択)を置き換える上で、そのようなGNNの有効性が実証されている。
論文 参考訳(メタデータ) (2022-06-30T02:33:32Z) - Social Interpretable Tree for Pedestrian Trajectory Prediction [75.81745697967608]
本稿では,このマルチモーダル予測課題に対処するため,SIT(Social Interpretable Tree)と呼ばれる木に基づく手法を提案する。
木の根から葉までの経路は、個々の将来の軌跡を表す。
ETH-UCYとStanford Droneのデータセットによる実験結果からは,手作り木にもかかわらず,我々の手法が最先端の手法の性能に適合または超えることを示した。
論文 参考訳(メタデータ) (2022-05-26T12:18:44Z) - Hierarchical Shrinkage: improving the accuracy and interpretability of
tree-based methods [10.289846887751079]
木構造を改変しないポストホックアルゴリズムである階層収縮(Hierarchical Shrinkage, HS)を導入する。
HSは、他の正規化技術と併用しても、決定木の予測性能を大幅に向上させる。
すべてのコードとモデルはGithubにある本格的なパッケージでリリースされている。
論文 参考訳(メタデータ) (2022-02-02T02:43:23Z) - Complex Event Forecasting with Prediction Suffix Trees: Extended
Technical Report [70.7321040534471]
複合イベント認識(CER)システムは、イベントのリアルタイムストリーム上のパターンを"即時"検出する能力によって、過去20年間に人気が高まっている。
このような現象が実際にCERエンジンによって検出される前に、パターンがいつ発生するかを予測する方法が不足している。
複雑なイベント予測の問題に対処しようとする形式的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-01T09:52:31Z) - Data-driven advice for interpreting local and global model predictions
in bioinformatics problems [17.685881417954782]
条件付き特徴コントリビューション(CFC)は、予測のテキストローカルでケースバイケースの説明を提供する。
両手法で計算した説明を, 公開されている164の分類問題に対して比較した。
ランダム林では,地域とグローバルのSHAP値とCFCスコアの相関関係が極めて高い。
論文 参考訳(メタデータ) (2021-08-13T12:41:39Z) - Growing Deep Forests Efficiently with Soft Routing and Learned
Connectivity [79.83903179393164]
この論文は、いくつかの重要な側面で深い森林のアイデアをさらに拡張します。
我々は、ノードがハードバイナリ決定ではなく、確率的ルーティング決定、すなわちソフトルーティングを行う確率的ツリーを採用する。
MNISTデータセットの実験は、私たちの力のある深部森林が[1]、[3]よりも優れたまたは匹敵するパフォーマンスを達成できることを示しています。
論文 参考訳(メタデータ) (2020-12-29T18:05:05Z) - MurTree: Optimal Classification Trees via Dynamic Programming and Search [61.817059565926336]
動的プログラミングと探索に基づいて最適な分類木を学習するための新しいアルゴリズムを提案する。
当社のアプローチでは,最先端技術が必要とする時間のごく一部しか使用せず,数万のインスタンスでデータセットを処理することが可能です。
論文 参考訳(メタデータ) (2020-07-24T17:06:55Z) - Estimation and Inference with Trees and Forests in High Dimensions [23.732259124656903]
浅い木は、CARTの実証的なMSE基準により、周囲の次元$d$に対数的にのみ依存するMSEレートを達成する。
また,本研究の結果から,完全に成長した森林はMSEの速さを達成でき,その予測も正直に正常であることが示唆された。
論文 参考訳(メタデータ) (2020-07-07T05:45:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。