論文の概要: Bandits on graphs and structures
- arxiv url: http://arxiv.org/abs/2605.03493v1
- Date: Tue, 05 May 2026 08:33:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.838573
- Title: Bandits on graphs and structures
- Title(参考訳): グラフと構造上の帯域
- Authors: Michal Valko,
- Abstract要約: この論文の目的は、解を実用に近づけるために、特定の問題の構造的特性を調べることである。
最初の部分では、アクションのグラフとして表現できる構造に特に重点を置いています。
第2部では、基本作用の個数や無限大の指数的サイズの大きな作用空間について検討する。
- 参考スコア(独自算出の注目度): 19.66115828957497
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The goal of this thesis is to investigate the structural properties of certain sequential problems in order to bring the solutions closer to a practical use. In the first part, we put a special emphasis on structures that can be represented as graphs on actions. In the second part, we study the large action spaces that can be of exponential size in the number of base actions or even infinite. For graph bandits, we consider the settings of smoothness of rewards (spectral bandits), side observations, and influence maximization. For large structured domains, we cover kernel bandits, polymatroid bandits, bandits for function optimization (including unknown smoothness), and infinitely many-arms bandits. The thesis aspires to be a survey of the author's contributions on graph and structured bandits.
- Abstract(参考訳): この論文の目的は、解を実用に近づけるために、ある逐次問題の構造的性質を調べることである。
最初の部分では、アクションのグラフとして表現できる構造に特に重点を置いています。
第2部では、基本作用の個数や無限大の指数的サイズの大きな作用空間について検討する。
グラフブレイディットでは、報酬の滑らかさ(スペクトルブレイディット)、側面観察、影響の最大化について考察する。
大規模構造領域に対しては、カーネル・バンドイット、ポリマトロイド・バンドイット、関数最適化のためのバンドイット(未知の滑らかさを含む)、無限に多くのアーム・バンドイットをカバーしている。
この論文は、著者のグラフおよび構造化バンディットに関する貢献のサーベイになることを意図している。
関連論文リスト
- Revealing graph bandits for maximizing local influence [64.91400609178565]
本研究では,学習者の目的がグラフの最も影響力のあるノードをできるだけ少ない情報で検出することであるグラフ帯域設定について検討する。
この設定の関連アプリケーションの1つは、ソーシャルネットワークにおけるマーケティングであり、マーケターは最も影響力のある顧客を見つけ、活用することを目指している。
論文 参考訳(メタデータ) (2026-05-01T07:54:58Z) - Bridging Rested and Restless Bandits with Graph-Triggering: Rising and Rotting [67.1631453378926]
Graph-Triggered Banditsは、安静と安静のバンディットを一般化するフレームワークである。
本研究は,2種類の単調包帯に焦点をあてる: 立ち上がり, 腕の期待される報酬が増加する, 引き金の数が増える, 回転する, 反対の行動が起こる。
論文 参考訳(メタデータ) (2024-09-09T18:23:07Z) - Stochastic contextual bandits with graph feedback: from independence number to MAS number [28.10186884181921]
グラフフィードバックによる文脈的帯域幅について検討する。
マルチアームのバンディット設定とは異なり、文脈的なバンディット設定では明らかにされていない。
我々は、コンテキストシーケンスやフィードバックグラフの重要なクラスに対して、ほぼ最適に後悔するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2024-02-12T06:56:13Z) - Causal Bandits with Unknown Graph Structure [24.58691421788476]
因果グラフを知らずに新たな因果バンディットアルゴリズムを開発する。
我々のアルゴリズムは、因果樹、因果樹、および一般的な因果グラフに対してうまく機能する。
論文 参考訳(メタデータ) (2021-06-05T23:41:38Z) - Efficient Pure Exploration for Combinatorial Bandits with Semi-Bandit
Feedback [51.21673420940346]
コンビナーシャルバンディットはマルチアームバンディットを一般化し、エージェントが腕のセットを選択し、選択したセットに含まれる各腕の騒々しい報酬を観察します。
我々は, 最善の腕を一定の信頼度で識別する純粋爆発問題と, 応答集合の構造が動作集合の1つと異なるような, より一般的な設定に注目する。
有限多面体に対するプロジェクションフリーオンライン学習アルゴリズムに基づいて、凸的に最適であり、競争力のある経験的性能を持つ最初の計算効率の良いアルゴリズムである。
論文 参考訳(メタデータ) (2021-01-21T10:35:09Z) - Best Arm Identification in Graphical Bilinear Bandits [9.052414772641011]
本稿では,学習者がグラフのノードにアームを割り当てる,新しいグラフィカル双線形帯域問題を提案する。
学習者が双線形報酬の合計を最大化するグラフ割り当てを見つけたいと思う最良の腕識別問題について研究する。
論文 参考訳(メタデータ) (2020-12-14T15:25:23Z) - Adversarial Linear Contextual Bandits with Graph-Structured Side
Observations [80.95090605985042]
学習エージェントは、$d$-dimensionalコンテキストベクトルで提示された後、一連の$k$アクションから繰り返し選択する。
エージェントは選択されたアクションの損失を誘発し、観察するが、観察構造における隣り合うアクションの損失も観察する。
textttEXP3に基づく2つの効率的なアルゴリズムが開発された。
論文 参考訳(メタデータ) (2020-12-10T15:40:07Z) - A Novel Confidence-Based Algorithm for Structured Bandits [129.30402124516507]
両腕の報酬が他の腕の報酬と相関する可能性のある有限腕包帯について検討した。
本稿では、与えられた構造を利用して、真のバンディット問題のパラメータに対する信頼セットを構築する新しい位相アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-23T19:52:44Z) - Predictive Bandits [68.8204255655161]
我々は,予測的盗賊と呼ばれる,新たな盗賊問題を紹介し,研究する。
各ラウンドで、意思決定者はまず、特定の武器の報酬に関する情報を集めるかどうかを決定する。
意思決定者は、ラウンドで実際にプレイされる腕を選択する。
論文 参考訳(メタデータ) (2020-04-02T17:12:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。