Fugu-MT 論文翻訳(概要): Tree Ensembles for Contextual Bandits

論文の概要: Tree Ensembles for Contextual Bandits

arxiv url: http://arxiv.org/abs/2402.06963v1
Date: Sat, 10 Feb 2024 14:36:31 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-13 18:18:45.824003
Title: Tree Ensembles for Contextual Bandits
Title（参考訳）: コンテキストバンドのためのツリーアンサンブル
Authors: Hannes Nilsson and Rikard Johansson and Niklas {\AA}kerblom and Morteza Haghir Chehreghani
Abstract要約: 木アンサンブルに基づくコンテキスト型マルチアームバンディットのための新しいフレームワークを提案する。本フレームワークでは,アッパー信頼境界法とトンプソンサンプリング法という,広範に使用されている帯域幅法を標準法と設定法の両方で統合する。
参考スコア（独自算出の注目度）: 2.498836880652668
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We propose a novel framework for contextual multi-armed bandits based on tree ensembles. Our framework integrates two widely used bandit methods, Upper Confidence Bound and Thompson Sampling, for both standard and combinatorial settings. We demonstrate the effectiveness of our framework via several experimental studies, employing XGBoost, a popular tree ensemble method. Compared to state-of-the-art methods based on neural networks, our methods exhibit superior performance in terms of both regret minimization and computational runtime, when applied to benchmark datasets and the real-world application of navigation over road networks.
Abstract（参考訳）: 木アンサンブルに基づくコンテキスト型マルチアームバンディットのための新しいフレームワークを提案する。本フレームワークは,標準設定と組合せ設定の両方に,アッパー信頼境界とトンプソンサンプリングという2つの広範に使用されている帯域幅法を統合する。木アンサンブル手法であるXGBoostを応用した実験により,本フレームワークの有効性を実証した。ニューラルネットワークに基づく最先端手法と比較して,提案手法は,ベンチマークデータセットに適用した場合の,後悔の最小化と計算ランタイムの両方の観点から,優れた性能を示す。

関連論文リスト

A novel gradient-based method for decision trees optimizing arbitrary differential loss functions [2.4861619769660637]
本研究では、任意の微分可微分損失関数を最適化する勾配に基づく決定木を構築する新しい手法を提案する。本手法の分類・回帰・生存分析への適用性を示す。この方法の実装は公開されており、研究者や実践者に実用的なツールを提供している。
論文参考訳（メタデータ） (2025-03-22T20:25:30Z)
Online Clustering of Dueling Bandits [59.09590979404303]
本稿では、優先フィードバックに基づく協調的な意思決定を可能にするために、最初の「デュエルバンディットアルゴリズムのクラスタリング」を導入する。本稿では,(1)ユーザ報酬関数をコンテキストベクトルの線形関数としてモデル化する線形デューリング帯域のクラスタリング(COLDB)と,(2)ニューラルネットワークを用いて複雑な非線形ユーザ報酬関数をモデル化するニューラルデューリング帯域のクラスタリング(CONDB)の2つの新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-02-04T07:55:41Z)
Learning Deep Tree-based Retriever for Efficient Recommendation: Theory and Method [76.31185707649227]
効率的なレコメンデーションのために,Deep Tree-based Retriever (DTR)を提案する。 DTRは、トレーニングタスクを、同じレベルでツリーノード上のソフトマックスベースのマルチクラス分類としてフレーム化している。非リーフノードのラベル付けによって引き起こされる準最適性を緩和するため、損失関数の補正法を提案する。
論文参考訳（メタデータ） (2024-08-21T05:09:53Z)
Neural Dueling Bandits [58.90189511247936]
ニューラルネットワークを用いて、予め選択した腕の好みフィードバックを用いて報酬関数を推定する。次に、理論結果を二項フィードバックによる文脈的帯域幅問題に拡張し、それはそれ自体は自明な寄与ではない。
論文参考訳（メタデータ） (2024-07-24T09:23:22Z)
Forest-ORE: Mining Optimal Rule Ensemble to interpret Random Forest models [0.0]
本研究では,局所的およびグローバル的解釈のための最適化されたルールアンサンブル(ORE)を用いて,ランダムフォレスト(RF)を解釈可能にする手法であるフォレスト-OREを提案する。良く知られた手法の比較分析は、フォレスト-OREが予測性能、解釈可能性カバレッジ、モデルサイズの間の優れたトレードオフを提供することを示している。
論文参考訳（メタデータ） (2024-03-26T10:54:07Z)
An Algorithmic Framework for Constructing Multiple Decision Trees by Evaluating Their Combination Performance Throughout the Construction Process [1.8749305679160366]
決定木の組み合わせによる予測は機械学習に有効であることが知られている。本稿では,決定木を同時に構築し,それらの組み合わせ性能を評価するアルゴリズムフレームワークを提案する。
論文参考訳（メタデータ） (2024-02-09T14:58:07Z)
Graph Neural Bandits [49.85090929163639]
グラフニューラルネットワーク(GNN)によって強化されたユーザ間の協調性を生かしたグラフニューラルバンド(GNB)というフレームワークを提案する。提案手法を改良するために,推定ユーザグラフ上の別々のGNNモデルを用いて,エクスプロイトと適応探索を行う。
論文参考訳（メタデータ） (2023-08-21T15:57:57Z)
Contextual Decision Trees [62.997667081978825]
学習アンサンブルの1つの浅い木を特徴量ベースで選択するための,マルチアームのコンテキスト付きバンドレコメンデーションフレームワークを提案する。トレーニングされたシステムはランダムフォレスト上で動作し、最終的な出力を提供するためのベース予測器を動的に識別する。
論文参考訳（メタデータ） (2022-07-13T17:05:08Z)
Scalable Whitebox Attacks on Tree-based Models [2.3186641356561646]
本稿では,木アンサンブルモデルに対する新しいホワイトボックス対逆ロバスト性試験手法を提案する。サンプリングとログデリバティブのトリックを活用することで、提案手法は以前管理不能だったタスクのテストまでスケールアップできる。
論文参考訳（メタデータ） (2022-03-31T21:36:20Z)
Explaining random forest prediction through diverse rulesets [0.0]
Local Tree eXtractor (LTreeX)は、与えられたテストインスタンスのフォレスト予測を、いくつかの異なるルールで説明することができる。提案手法は予測性能の点で他の説明可能な手法よりも大幅に優れていることを示す。
論文参考訳（メタデータ） (2022-03-29T12:54:57Z)
Improved Branch and Bound for Neural Network Verification via Lagrangian Decomposition [161.09660864941603]
ニューラルネットワークの入出力特性を公式に証明するためのブランチとバウンド(BaB)アルゴリズムのスケーラビリティを改善します。活性化に基づく新しい分岐戦略とBaBフレームワークであるブランチとデュアルネットワーク境界(BaDNB)を提案する。 BaDNBは、従来の完全検証システムを大きなマージンで上回り、対数特性で平均検証時間を最大50倍に削減した。
論文参考訳（メタデータ） (2021-04-14T09:22:42Z)
MurTree: Optimal Classification Trees via Dynamic Programming and Search [61.817059565926336]
動的プログラミングと探索に基づいて最適な分類木を学習するための新しいアルゴリズムを提案する。当社のアプローチでは,最先端技術が必要とする時間のごく一部しか使用せず,数万のインスタンスでデータセットを処理することが可能です。
論文参考訳（メタデータ） (2020-07-24T17:06:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。