論文の概要: Towards Scalable and Robust Structured Bandits: A Meta-Learning
Framework
- arxiv url: http://arxiv.org/abs/2202.13227v1
- Date: Sat, 26 Feb 2022 20:54:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-01 17:22:23.015037
- Title: Towards Scalable and Robust Structured Bandits: A Meta-Learning
Framework
- Title(参考訳): スケーラブルでロバストな構造化バンドに向けて:メタ学習フレームワーク
- Authors: Runzhe Wan, Lin Ge, Rui Song
- Abstract要約: 本稿では,パラメータ空間をアイテムレベルに分解できる構造化バンディット問題に対する統一メタラーニングフレームワークを提案する。
新たなバンディットアルゴリズムは、多くの一般的な問題に適用可能であり、巨大なパラメータやアクション空間にスケール可能であり、一般化モデルの仕様に頑健である。
- 参考スコア(独自算出の注目度): 11.778985277618354
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online learning in large-scale structured bandits is known to be challenging
due to the curse of dimensionality. In this paper, we propose a unified
meta-learning framework for a general class of structured bandit problems where
the parameter space can be factorized to item-level. The novel bandit algorithm
is general to be applied to many popular problems,scalable to the huge
parameter and action spaces, and robust to the specification of the
generalization model. At the core of this framework is a Bayesian hierarchical
model that allows information sharing among items via their features, upon
which we design a meta Thompson sampling algorithm. Three representative
examples are discussed thoroughly. Both theoretical analysis and numerical
results support the usefulness of the proposed method.
- Abstract(参考訳): 大規模構造化されたバンディットにおけるオンライン学習は、次元の呪いのために難しいことが知られている。
本稿では,パラメータ空間をアイテムレベルに分解可能な,構造化バンディット問題の一般的なクラスに対する統一メタラーニングフレームワークを提案する。
新しいbanditアルゴリズムは一般に、多くの一般的な問題に適用でき、巨大なパラメータとアクション空間に拡張可能であり、一般化モデルの仕様に頑健である。
このフレームワークの中核となるのはベイズ的階層モデルであり、その特徴によってアイテム間の情報共有を可能にし、メタトンプソンサンプリングアルゴリズムを設計する。
代表的な例が3つある。
理論的解析と数値計算の両方が提案手法の有用性を支持する。
関連論文リスト
- Discrete Choice Multi-Armed Bandits [0.0]
本稿では,個別選択モデルのカテゴリとオンライン学習とマルチアームバンディットアルゴリズムの領域の関連性を確立する。
我々は、Exp3アルゴリズムを特定のケースとして包含して、包括的アルゴリズム群に対するサブ線形後悔境界を提供する。
一般化されたネストロジットモデルからインスピレーションを得た,対向多重武装バンディットアルゴリズムの新たなファミリーを導入する。
論文 参考訳(メタデータ) (2023-10-01T03:41:04Z) - Knowledge Base Question Answering by Case-based Reasoning over Subgraphs [81.22050011503933]
本モデルでは,既存のKG補完アルゴリズムよりも複雑な推論パターンを必要とする問合せに対して,より効果的に答えることを示す。
提案モデルは、KBQAベンチマークの最先端モデルよりも優れているか、競合的に動作する。
論文 参考訳(メタデータ) (2022-02-22T01:34:35Z) - Metadata-based Multi-Task Bandits with Bayesian Hierarchical Models [7.458639397686894]
効果的に探索する方法は、多腕バンディットにおける中心的な問題である。
メタデータに基づくマルチタスクバンディット問題を導入する。
ベイズ階層モデルのレンズを通してタスク関係を捉えることを提案する。
論文 参考訳(メタデータ) (2021-08-13T22:45:05Z) - A Simple Unified Framework for High Dimensional Bandit Problems [33.139925285802825]
本稿では,アルゴリズムの上界を後悔する一般的な解析フレームワークを提案する。
本アルゴリズムは,異なる高次元バンディット問題に適用できることを示した。
論文 参考訳(メタデータ) (2021-02-18T21:35:32Z) - Captum: A unified and generic model interpretability library for PyTorch [49.72749684393332]
我々は,PyTorch用の新しい,統一されたオープンソースモデル解釈可能性ライブラリを紹介する。
このライブラリには、多くの勾配と摂動に基づく属性アルゴリズムの汎用的な実装が含まれている。
分類モデルと非分類モデルの両方に使用できる。
論文 参考訳(メタデータ) (2020-09-16T18:57:57Z) - Information Theoretic Meta Learning with Gaussian Processes [74.54485310507336]
情報理論の概念,すなわち相互情報と情報のボトルネックを用いてメタ学習を定式化する。
相互情報に対する変分近似を用いることで、メタ学習のための汎用的かつトラクタブルな枠組みを導出する。
論文 参考訳(メタデータ) (2020-09-07T16:47:30Z) - Multi-view Orthonormalized Partial Least Squares: Regularizations and
Deep Extensions [8.846165479467324]
最小二乗を基本としたマルチビュー学習のためのサブスペース学習手法のファミリーを確立する。
全ビューで共有される共通潜在空間上の分類器を学習するための統合された多視点学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-09T19:00:39Z) - Influence Diagram Bandits: Variational Thompson Sampling for Structured
Bandit Problems [40.957688390621385]
我々のフレームワークは、アクション、潜伏変数、観察の間の複雑な統計的依存関係をキャプチャする。
我々のモデルで効率的に行動することを学ぶ新しいオンライン学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-07-09T16:25:40Z) - A general framework for defining and optimizing robustness [74.67016173858497]
分類器の様々な種類の堅牢性を定義するための厳密でフレキシブルなフレームワークを提案する。
我々の概念は、分類器の堅牢性は正確性とは無関係な性質と考えるべきであるという仮定に基づいている。
我々は,任意の分類モデルに適用可能な,非常に一般的なロバスト性フレームワークを開発する。
論文 参考訳(メタデータ) (2020-06-19T13:24:20Z) - An Integer Linear Programming Framework for Mining Constraints from Data [81.60135973848125]
データから制約をマイニングするための一般的なフレームワークを提案する。
特に、構造化された出力予測の推論を整数線形プログラミング(ILP)問題とみなす。
提案手法は,9×9のスドクパズルの解法を学習し,基礎となるルールを提供することなく,例からツリー問題を最小限に分散させることが可能であることを示す。
論文 参考訳(メタデータ) (2020-06-18T20:09:53Z) - Parameterizing Branch-and-Bound Search Trees to Learn Branching Policies [76.83991682238666]
Branch and Bound (B&B) は、Mixed-Integer Linear Programming Problem (MILP) の解法として一般的に用いられる木探索法である。
本稿では,新しい模倣学習フレームワークを提案し,分岐を表現するための新しい入力機能とアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-12T17:43:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。