論文の概要: Semi-Parametric Contextual Bandits with Graph-Laplacian Regularization
- arxiv url: http://arxiv.org/abs/2205.08295v1
- Date: Tue, 17 May 2022 12:51:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-18 13:01:04.008852
- Title: Semi-Parametric Contextual Bandits with Graph-Laplacian Regularization
- Title(参考訳): グラフラプラシアン正則化を伴う半パラメトリック文脈バンディット
- Authors: Young-Geun Choi, Gi-Soo Kim, Seunghoon Paik and Myunghee Cho Paik
- Abstract要約: セミグラフTSはグラフに基づく半パラメトリック報酬モデルのための新しい文脈型トンプソンサンプリングアルゴリズムである。
累積的後悔の上限は、グラフ構造に依存する因子の倍数として表すことができる。
- 参考スコア(独自算出の注目度): 9.864260997723976
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Non-stationarity is ubiquitous in human behavior and addressing it in the
contextual bandits is challenging. Several works have addressed the problem by
investigating semi-parametric contextual bandits and warned that ignoring
non-stationarity could harm performances. Another prevalent human behavior is
social interaction which has become available in a form of a social network or
graph structure. As a result, graph-based contextual bandits have received much
attention. In this paper, we propose "SemiGraphTS," a novel contextual
Thompson-sampling algorithm for a graph-based semi-parametric reward model. Our
algorithm is the first to be proposed in this setting. We derive an upper bound
of the cumulative regret that can be expressed as a multiple of a factor
depending on the graph structure and the order for the semi-parametric model
without a graph. We evaluate the proposed and existing algorithms via
simulation and real data example.
- Abstract(参考訳): 非定常性は人間の行動においてユビキタスであり、コンテキストバンディットでそれに対処することは困難である。
いくつかの研究は、半パラメトリックな文脈的包帯の調査によってこの問題に対処し、非定常性を無視することはパフォーマンスに悪影響を及ぼすと警告した。
もう一つの一般的な人間の行動は、ソーシャルネットワークやグラフ構造の形で利用できるようになった社会的相互作用である。
その結果、グラフベースのコンテキストバンディットが注目を集めている。
本稿では,グラフに基づく半パラメトリック報酬モデルのための新しい文脈型トンプソンサンプリングアルゴリズムであるSemiGraphTSを提案する。
我々のアルゴリズムはこの設定で最初に提案される。
グラフ構造や半パラメトリックモデルの順序に依存する因子の倍数として表現できる累積的後悔の上限をグラフなしで導出する。
提案手法と既存アルゴリズムをシミュレーションと実データ例を用いて評価する。
関連論文リスト
- Shedding Light on Problems with Hyperbolic Graph Learning [2.3743504594834635]
グラフ機械学習文学における近年の論文は、双曲表現学習に多くのアプローチを導入している。
現在、双曲グラフ表現学習の分野を注意深く見ていく。
多くの論文では,アルゴリズム構築時にベースラインの厳密な提示に失敗し,ミスリード指標を用いてグラフデータセットの幾何を定量化している。
論文 参考訳(メタデータ) (2024-11-11T03:12:41Z) - Graph Neural Thompson Sampling [18.83205413952483]
グラフ構造データ上に定義された報酬関数を持つオンライン意思決定問題を考える。
次に,グラフニューラルネットワークを用いたトンプソンサンプリング(TS)アルゴリズムであるtextttGNN-TSを提案する。
論文 参考訳(メタデータ) (2024-06-15T16:45:27Z) - Rethinking Explaining Graph Neural Networks via Non-parametric Subgraph
Matching [68.35685422301613]
そこで我々はMatchExplainerと呼ばれる新しい非パラメトリックな部分グラフマッチングフレームワークを提案し、説明的部分グラフを探索する。
ターゲットグラフと他のインスタンスを結合し、ノードに対応する距離を最小化することで最も重要な結合部分構造を識別する。
合成および実世界のデータセットの実験は、最先端のパラメトリックベースラインをかなりのマージンで上回り、MatchExplainerの有効性を示す。
論文 参考訳(メタデータ) (2023-01-07T05:14:45Z) - Improved High-Probability Regret for Adversarial Bandits with
Time-Varying Feedback Graphs [62.52390282012508]
我々は、T$ラウンド以上の時間変化フィードバックグラフを持つ、敵対的な$K$武器付きバンディットに対する高い確率的後悔境界について検討する。
提案アルゴリズムは,高い確率で最適に後悔する$widetildemathcalO((sum_t=1Talpha_t)1/2+max_tin[T]alpha_t]$を達成するアルゴリズムを開発した。
また,弱可観測グラフに対する最適高確率残差を求めるアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-10-04T04:36:15Z) - Node Copying: A Random Graph Model for Effective Graph Sampling [35.957719744856696]
本稿では,グラフ上の分布を構成するノードコピーモデルを提案する。
コピーモデルの有用性を3つのタスクで示す。
提案モデルを用いて,グラフトポロジに対する敵攻撃の効果を緩和する。
論文 参考訳(メタデータ) (2022-08-04T04:04:49Z) - Neighborhood Random Walk Graph Sampling for Regularized Bayesian Graph
Convolutional Neural Networks [0.6236890292833384]
本稿では,近隣ランダムウォークサンプリング(BGCN-NRWS)を用いたベイジアングラフ畳み込みネットワーク(Bayesian Graph Convolutional Network)を提案する。
BGCN-NRWSは、グラフ構造を利用したマルコフ・チェイン・モンテカルロ(MCMC)に基づくグラフサンプリングアルゴリズムを使用し、変分推論層を用いてオーバーフィッティングを低減し、半教師付きノード分類における最先端と比較して一貫して競合する分類結果を得る。
論文 参考訳(メタデータ) (2021-12-14T20:58:27Z) - Graphon based Clustering and Testing of Networks: Algorithms and Theory [11.3700474413248]
ネットワークに価値のあるデータは、幅広いアプリケーションで遭遇し、学習の課題を提起する。
本稿では,2つのクラスタリングアルゴリズムについて述べる。
さらに、グラフ2サンプルテスト問題に対する提案した距離の適用性について検討する。
論文 参考訳(メタデータ) (2021-10-06T13:14:44Z) - Partition and Code: learning how to compress graphs [50.29024357495154]
まず、分割アルゴリズムがグラフを基本構造に分解し、これらを確率分布を学習する小さな辞書の要素にマッピングし、エントロピーエンコーダが表現をビットに変換する。
提案アルゴリズムは,非パラメトリックおよびパラメトリックグラフ圧縮器の異なるファミリーに対して,多種多様な実世界のネットワーク上で定量的に評価し,大幅な性能向上を実現している。
論文 参考訳(メタデータ) (2021-07-05T11:41:16Z) - ExplaGraphs: An Explanation Graph Generation Task for Structured
Commonsense Reasoning [65.15423587105472]
スタンス予測のための説明グラフ生成の新しい生成および構造化コモンセンスリゾニングタスク(および関連するデータセット)を紹介します。
具体的には、信念と議論が与えられた場合、モデルは、議論が信念を支持しているかどうかを予測し、予測されたスタンスに対する非自明で完全で曖昧な説明として機能する常識強化グラフを生成する必要がある。
グラフの83%は、様々な構造と推論深度を持つ外部のコモンセンスノードを含んでいる。
論文 参考訳(メタデータ) (2021-04-15T17:51:36Z) - Adversarial Linear Contextual Bandits with Graph-Structured Side
Observations [80.95090605985042]
学習エージェントは、$d$-dimensionalコンテキストベクトルで提示された後、一連の$k$アクションから繰り返し選択する。
エージェントは選択されたアクションの損失を誘発し、観察するが、観察構造における隣り合うアクションの損失も観察する。
textttEXP3に基づく2つの効率的なアルゴリズムが開発された。
論文 参考訳(メタデータ) (2020-12-10T15:40:07Z) - Line Graph Neural Networks for Link Prediction [71.00689542259052]
実世界の多くのアプリケーションにおいて古典的なグラフ解析問題であるグラフリンク予測タスクについて検討する。
このフォーマリズムでは、リンク予測問題をグラフ分類タスクに変換する。
本稿では,線グラフをグラフ理論に用いて,根本的に異なる新しい経路を求めることを提案する。
特に、線グラフの各ノードは、元のグラフのユニークなエッジに対応するため、元のグラフのリンク予測問題は、グラフ分類タスクではなく、対応する線グラフのノード分類問題として等価に解決できる。
論文 参考訳(メタデータ) (2020-10-20T05:54:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。