論文の概要: CART Random Forests as Sequential Allocation over Random Opportunity Sets: A Stochastic-Control Theory of Ensemble Risk
- arxiv url: http://arxiv.org/abs/2605.26675v1
- Date: Tue, 26 May 2026 08:13:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.743454
- Title: CART Random Forests as Sequential Allocation over Random Opportunity Sets: A Stochastic-Control Theory of Ensemble Risk
- Title(参考訳): ランダム・オポチュニティ・セットの逐次配置としてのCARTランダム・フォレスト--アンサンブル・リスクの確率-制御理論-
- Authors: Tianxing Mei, Yingying Fan, Mingming Leng, Jinchi Lv,
- Abstract要約: 我々は、CARTランダムチャンスセットアロケーション(CART-ROSA)と呼ばれるCARTランダム森林の力学的視点を開発する。
しかし、システムレベルでは、森林目標に対して世界規模で最適である可能性がある。
この結果から,操作-検索の視点がトラクタブルを理論的ギャップとして利用し難いことを示す。
- 参考スコア(独自算出の注目度): 3.258768210783843
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: CART random forests are among the most widely used modern predictive methods, with well-documented empirical success. Yet, at the mechanistic level, the algorithm is often treated as a black box because of its complexity. In this paper, we develop a stochastic-control perspective on feature-subsampled CART random forests, named CART random opportunity-set allocation (CART-ROSA). At each node, the random subset of features is interpreted as a random feasible action set, and the CART split rule as a masked-action allocation policy. This policy induces a controlled stochastic process over informative split-count states, whose terminal law determines both single-tree error and cross-tree interaction terms in the forest mean squared error (MSE). Such representation opens the black box of CART-forests by separating two design levers: the informative-opportunity rate induced by feature subsampling, and the contraction strength from the within-mask split policy. We establish that the CART policy is locally stabilizing: it contracts imbalances in informative split allocations and concentrates terminal tree geometry. At the system level, however, it can be globally suboptimal for the forest objective. Specializing to the linear model, we derive the MSE risk expansion explicitly. Our results show how an operations-research perspective makes tractable a theoretical gap difficult to access from the standard algorithmic description of CART forests.
- Abstract(参考訳): CARTランダム森林は、よく文書化された実証的な成功と共に、最も広く使われている近代的な予測手法の1つである。
しかし、力学レベルでは、アルゴリズムはその複雑さのため、しばしばブラックボックスとして扱われる。
本稿では,CART-ROSA (CART-ROSA) と呼ばれる,特徴サブサンプリングされたCARTランダム林の確率制御的視点を開発する。
各ノードにおいて、特徴のランダムなサブセットはランダムな実行可能なアクションセットとして解釈され、CARTスプリットルールはマスクされたアクション割り当てポリシーとして解釈される。
このポリシーは、森林平均二乗誤差(MSE)における単木誤差とクロスツリー相互作用項を終端法で決定する情報分割状態に対する制御確率過程を誘導する。
このような表現は、特徴サブサンプリングによって引き起こされる情報・機会率と、マスク内分割ポリシーからの収縮強度という、2つのデザインレバーを分離することで、CARTフォレストのブラックボックスを開く。
我々はCARTポリシーが,情報分割割当の不均衡と終端木形状の集中を両立させ,局所安定化を図っていることを証明した。
しかし、システムレベルでは、森林目標に対して世界規模で最適である可能性がある。
線形モデルに特化して、MSEのリスク拡張を明示的に導き出す。
本研究は,CART林の標準的なアルゴリズム記述から,トラクタブルをアクセスし難い理論的ギャップを,オペレーション・リサーチの観点から示すものである。
関連論文リスト
- RTMC: Step-Level Credit Assignment via Rollout Trees [6.813908435773822]
RTMC(Rollout-Tree Monte Carlo)の利点について述べる。
SWE-bench Verifiedでは、RTMCはGRPOよりもパス@1を3.2ポイント改善している。
論文 参考訳(メタデータ) (2026-04-13T06:01:51Z) - An LP-based Sampling Policy for Multi-Armed Bandits with Side-Observations and Stochastic Availability [40.54677625701658]
本稿では,ネットワーク構造が関連する動作を横取り可能なマルチアーム・バンディット(MAB)問題について検討する。
我々は、アクションを未知の集合にリンクするために二部グラフを使用し、アクションを選択すると、それが関連付けられているすべての未知の観測結果が明らかになる。
論文 参考訳(メタデータ) (2026-03-27T17:50:42Z) - Policy-Oriented Binary Classification: Improving (KD-)CART Final Splits for Subpopulation Targeting [1.9754011041953696]
本稿では, 学生モデルがKD-CARTであるCARTと知識蒸留法が潜在確率分類に最適であることを示す。
本稿では,CART/KD-CARTを厳格に支配する分割規則を生成するMDFS(Maximizing Distance Final Split)を提案する。
MDFSはCART/KD-CARTよりも脆弱なサブ集団をターゲットにしている。
論文 参考訳(メタデータ) (2025-02-20T22:08:43Z) - Numerically assisted determination of local models in network scenarios [55.2480439325792]
統計的振る舞いを再現する明示的な局所モデルを見つけるための数値ツールを開発する。
グリーンベルガー・ホルン・ザイリンガー(GHZ)およびW分布の臨界振動性に関する予想を提供する。
開発されたコードとドキュメントは、281.com/mariofilho/localmodelsで公開されている。
論文 参考訳(メタデータ) (2023-03-17T13:24:04Z) - General Cutting Planes for Bound-Propagation-Based Neural Network
Verification [144.7290035694459]
任意の切削平面制約を加えることができるような境界伝搬手順を一般化する。
MIPソルバは、境界プロパゲーションベースの検証器を強化するために高品質な切削面を生成することができる。
本手法は,oval20ベンチマークを完全解き,oval21ベンチマークの2倍のインスタンスを検証できる最初の検証器である。
論文 参考訳(メタデータ) (2022-08-11T10:31:28Z) - Fuzzy C-means-based scenario bundling for stochastic service network
design [0.0]
一連のシナリオで表現される不確実な需要を持つサービスネットワークの設計をモデル化することができる。
この問題に対処するために,ファジィなc-meansベースのシナリオバンドル手法を提案する。
論文 参考訳(メタデータ) (2020-11-16T02:41:47Z) - Implicit Distributional Reinforcement Learning [61.166030238490634]
2つのディープジェネレータネットワーク(DGN)上に構築された暗黙の分布型アクター批判(IDAC)
半単純アクター (SIA) は、フレキシブルなポリシー分布を利用する。
我々は,代表的OpenAI Gym環境において,IDACが最先端のアルゴリズムより優れていることを観察する。
論文 参考訳(メタデータ) (2020-07-13T02:52:18Z) - Best Arm Identification for Cascading Bandits in the Fixed Confidence
Setting [81.70513857417106]
CascadeBAIを設計し、分析する。これは、$K$アイテムのベストセットを見つけるアルゴリズムである。
CascadeBAIの時間的複雑さの上限は、決定的な分析課題を克服することによって導かれる。
その結果,カスケードBAIの性能は,時間的複雑性の低い境界の導出により,いくつかの実践的状況において最適であることが示唆された。
論文 参考訳(メタデータ) (2020-01-23T16:47:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。