Fugu-MT 論文翻訳(概要): Tree Ensembles for Contextual Bandits

論文の概要: Tree Ensembles for Contextual Bandits

arxiv url: http://arxiv.org/abs/2402.06963v3
Date: Fri, 01 Nov 2024 11:46:22 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:30.717574
Title: Tree Ensembles for Contextual Bandits
Title（参考訳）: コンテキストバンドのためのツリーアンサンブル
Authors: Hannes Nilsson, Rikard Johansson, Niklas Åkerblom, Morteza Haghir Chehreghani,
Abstract要約: 木アンサンブルに基づくコンテキスト型マルチアームバンディットのための新しいフレームワークを提案する。この枠組みの一環として,木組予測の不確かさを推定する新しい手法を提案する。
参考スコア（独自算出の注目度）: 2.9623902973073375
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We propose a new framework for contextual multi-armed bandits based on tree ensembles. Our framework adapts two widely used bandit methods, Upper Confidence Bound and Thompson Sampling, for both standard and combinatorial settings. As part of this framework, we propose a novel method of estimating the uncertainty in tree ensemble predictions. We further demonstrate the effectiveness of our framework via several experimental studies, employing XGBoost and random forests, two popular tree ensemble methods. Compared to state-of-the-art methods based on decision trees and neural networks, our methods exhibit superior performance in terms of both regret minimization and computational runtime, when applied to benchmark datasets and the real-world application of navigation over road networks.
Abstract（参考訳）: 木アンサンブルに基づくコンテキスト型マルチアームバンディットのための新しいフレームワークを提案する。我々のフレームワークは、標準設定と組合せ設定の両方に広く使われている2つの帯域幅法、アッパー信頼境界法とトンプソンサンプリングを適用している。この枠組みの一環として,木組予測の不確かさを推定する新しい手法を提案する。我々はさらに,XGBoostとランダム林,2つの人気の樹木アンサンブル手法を用いて,いくつかの実験的研究を通じて,我々のフレームワークの有効性を実証した。提案手法は,決定木やニューラルネットワークに基づく最先端の手法と比較して,ベンチマークデータセットに適用した場合の,後悔の最小化と計算ランタイムの両方の観点から,優れた性能を示す。

関連論文リスト

A novel gradient-based method for decision trees optimizing arbitrary differential loss functions [2.4861619769660637]
本研究では、任意の微分可微分損失関数を最適化する勾配に基づく決定木を構築する新しい手法を提案する。本手法の分類・回帰・生存分析への適用性を示す。この方法の実装は公開されており、研究者や実践者に実用的なツールを提供している。
論文参考訳（メタデータ） (2025-03-22T20:25:30Z)
Online Clustering of Dueling Bandits [59.09590979404303]
本稿では、優先フィードバックに基づく協調的な意思決定を可能にするために、最初の「デュエルバンディットアルゴリズムのクラスタリング」を導入する。本稿では,(1)ユーザ報酬関数をコンテキストベクトルの線形関数としてモデル化する線形デューリング帯域のクラスタリング(COLDB)と,(2)ニューラルネットワークを用いて複雑な非線形ユーザ報酬関数をモデル化するニューラルデューリング帯域のクラスタリング(CONDB)の2つの新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-02-04T07:55:41Z)
Learning Deep Tree-based Retriever for Efficient Recommendation: Theory and Method [76.31185707649227]
効率的なレコメンデーションのために,Deep Tree-based Retriever (DTR)を提案する。 DTRは、トレーニングタスクを、同じレベルでツリーノード上のソフトマックスベースのマルチクラス分類としてフレーム化している。非リーフノードのラベル付けによって引き起こされる準最適性を緩和するため、損失関数の補正法を提案する。
論文参考訳（メタデータ） (2024-08-21T05:09:53Z)
Neural Dueling Bandits [58.90189511247936]
ニューラルネットワークを用いて、予め選択した腕の好みフィードバックを用いて報酬関数を推定する。次に、理論結果を二項フィードバックによる文脈的帯域幅問題に拡張し、それはそれ自体は自明な寄与ではない。
論文参考訳（メタデータ） (2024-07-24T09:23:22Z)
Forest-ORE: Mining Optimal Rule Ensemble to interpret Random Forest models [0.0]
本研究では,局所的およびグローバル的解釈のための最適化されたルールアンサンブル(ORE)を用いて,ランダムフォレスト(RF)を解釈可能にする手法であるフォレスト-OREを提案する。良く知られた手法の比較分析は、フォレスト-OREが予測性能、解釈可能性カバレッジ、モデルサイズの間の優れたトレードオフを提供することを示している。
論文参考訳（メタデータ） (2024-03-26T10:54:07Z)
An Algorithmic Framework for Constructing Multiple Decision Trees by Evaluating Their Combination Performance Throughout the Construction Process [1.8749305679160366]
決定木の組み合わせによる予測は機械学習に有効であることが知られている。本稿では,決定木を同時に構築し,それらの組み合わせ性能を評価するアルゴリズムフレームワークを提案する。
論文参考訳（メタデータ） (2024-02-09T14:58:07Z)
Graph Neural Bandits [49.85090929163639]
グラフニューラルネットワーク(GNN)によって強化されたユーザ間の協調性を生かしたグラフニューラルバンド(GNB)というフレームワークを提案する。提案手法を改良するために,推定ユーザグラフ上の別々のGNNモデルを用いて,エクスプロイトと適応探索を行う。
論文参考訳（メタデータ） (2023-08-21T15:57:57Z)
Contextual Decision Trees [62.997667081978825]
学習アンサンブルの1つの浅い木を特徴量ベースで選択するための,マルチアームのコンテキスト付きバンドレコメンデーションフレームワークを提案する。トレーニングされたシステムはランダムフォレスト上で動作し、最終的な出力を提供するためのベース予測器を動的に識別する。
論文参考訳（メタデータ） (2022-07-13T17:05:08Z)
Scalable Whitebox Attacks on Tree-based Models [2.3186641356561646]
本稿では,木アンサンブルモデルに対する新しいホワイトボックス対逆ロバスト性試験手法を提案する。サンプリングとログデリバティブのトリックを活用することで、提案手法は以前管理不能だったタスクのテストまでスケールアップできる。
論文参考訳（メタデータ） (2022-03-31T21:36:20Z)
Explaining random forest prediction through diverse rulesets [0.0]
Local Tree eXtractor (LTreeX)は、与えられたテストインスタンスのフォレスト予測を、いくつかの異なるルールで説明することができる。提案手法は予測性能の点で他の説明可能な手法よりも大幅に優れていることを示す。
論文参考訳（メタデータ） (2022-03-29T12:54:57Z)
Improved Branch and Bound for Neural Network Verification via Lagrangian Decomposition [161.09660864941603]
ニューラルネットワークの入出力特性を公式に証明するためのブランチとバウンド(BaB)アルゴリズムのスケーラビリティを改善します。活性化に基づく新しい分岐戦略とBaBフレームワークであるブランチとデュアルネットワーク境界(BaDNB)を提案する。 BaDNBは、従来の完全検証システムを大きなマージンで上回り、対数特性で平均検証時間を最大50倍に削減した。
論文参考訳（メタデータ） (2021-04-14T09:22:42Z)
MurTree: Optimal Classification Trees via Dynamic Programming and Search [61.817059565926336]
動的プログラミングと探索に基づいて最適な分類木を学習するための新しいアルゴリズムを提案する。当社のアプローチでは,最先端技術が必要とする時間のごく一部しか使用せず,数万のインスタンスでデータセットを処理することが可能です。
論文参考訳（メタデータ） (2020-07-24T17:06:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。