論文の概要: Neural Bandit with Arm Group Graph
- arxiv url: http://arxiv.org/abs/2206.03644v2
- Date: Fri, 10 Jun 2022 03:34:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-13 11:47:11.011303
- Title: Neural Bandit with Arm Group Graph
- Title(参考訳): Arm Group Graph を用いたニューラルバンド
- Authors: Yunzhe Qi, Yikun Ban, Jingrui He
- Abstract要約: コンテキストブレイディットは、コンテキスト情報に基づいて最も高い報酬を持つ最適なアームのセットを識別することを目的としている。
我々は新しいモデルであるArm Group Graph (AGG)を導入し、ノードはアームのグループを表し、重み付きエッジはグループ間の相関を定式化する。
本稿では,AGGの豊富な情報を活用するために,ニューラルネットワークが報酬を推定するように設計された帯域幅アルゴリズムAGG-UCBを提案する。
- 参考スコア(独自算出の注目度): 37.651541940052724
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Contextual bandits aim to identify among a set of arms the optimal one with
the highest reward based on their contextual information. Motivated by the fact
that the arms usually exhibit group behaviors and the mutual impacts exist
among groups, we introduce a new model, Arm Group Graph (AGG), where the nodes
represent the groups of arms and the weighted edges formulate the correlations
among groups. To leverage the rich information in AGG, we propose a bandit
algorithm, AGG-UCB, where the neural networks are designed to estimate rewards,
and we propose to utilize graph neural networks (GNN) to learn the
representations of arm groups with correlations. To solve the
exploitation-exploration dilemma in bandits, we derive a new upper confidence
bound (UCB) built on neural networks (exploitation) for exploration.
Furthermore, we prove that AGG-UCB can achieve a near-optimal regret bound with
over-parameterized neural networks, and provide the convergence analysis of GNN
with fully-connected layers which may be of independent interest. In the end,
we conduct extensive experiments against state-of-the-art baselines on multiple
public data sets, showing the effectiveness of the proposed algorithm.
- Abstract(参考訳): コンテキストブレイディットは、コンテキスト情報に基づいて最も高い報酬を持つ最適なアームのセットを識別することを目的としている。
両腕が通常集団行動を示し,相互の影響が群間に存在するという事実に触発されて,ノードが群群を表し,重み付きエッジが群間の相関を定式化する新たなモデルであるArm Group Graph(AGG)を導入する。
aggの豊富な情報を活用するために,ニューラルネットワークが報酬を推定するために設計されたバンドイットアルゴリズム agg-ucb を提案し,グラフニューラルネットワーク (gnn) を用いて相関関係を持つアーム群の表現を学ぶ。
バンディットにおけるエクスプロレーション-探索ジレンマを解決するために、探索のためのニューラルネットワーク(探索)上に構築された新しい上部信頼境界(UCB)を導出する。
さらに、AGG-UCBは、過度にパラメータ化されたニューラルネットワークに縛られたほぼ最適の後悔を達成できることを証明し、GNNを独立した関心を持つような完全に接続された層で収束解析する。
最後に,複数の公開データセットに対する最先端ベースラインに対する広範な実験を行い,提案アルゴリズムの有効性を示す。
関連論文リスト
- Influence Maximization via Graph Neural Bandits [54.45552721334886]
IM問題を多ラウンド拡散キャンペーンに設定し,影響を受けやすいユーザ数を最大化することを目的とした。
IM-GNB(Influence Maximization with Graph Neural Bandits)を提案する。
論文 参考訳(メタデータ) (2024-06-18T17:54:33Z) - Graph Neural Bandits [49.85090929163639]
グラフニューラルネットワーク(GNN)によって強化されたユーザ間の協調性を生かしたグラフニューラルバンド(GNB)というフレームワークを提案する。
提案手法を改良するために,推定ユーザグラフ上の別々のGNNモデルを用いて,エクスプロイトと適応探索を行う。
論文 参考訳(メタデータ) (2023-08-21T15:57:57Z) - Disparity, Inequality, and Accuracy Tradeoffs in Graph Neural Networks
for Node Classification [2.8282906214258796]
グラフニューラルネットワーク(GNN)は、属性付きグラフのノードラベルを予測するための重要な人間のアプリケーションで、ますます使われている。
保護されたグループと保護されていないグループのノード間の分離性を減少させるPFR-AXと、ブラックボックスポリシーに基づいたモデル予測を更新するPostProcessという2つの新しいGNN非依存的介入を提案する。
PFR-AXとPostProcessは,保護群におけるノードの正の結果を正確に予測した場合に,粒度制御とモデル信頼度の向上を図っている。
論文 参考訳(メタデータ) (2023-08-18T14:45:28Z) - Ranking-based Group Identification via Factorized Attention on Social
Tripartite Graph [68.08590487960475]
グループ識別のための文脈的要因認識(CFAG)という,GNNに基づく新しいフレームワークを提案する。
我々は3部グラフ畳み込み層を考案し、ユーザ、グループ、アイテム間の異なる種類の近隣からの情報を集約する。
データ疎度問題に対処するため,提案した因子化注意機構に基づく新しい伝搬増強層を考案した。
論文 参考訳(メタデータ) (2022-11-02T01:42:20Z) - BScNets: Block Simplicial Complex Neural Networks [79.81654213581977]
グラフ学習における最新の方向性として、SNN(Simplicial Neural Network)が最近登場した。
リンク予測のためのBlock Simplicial Complex Neural Networks (BScNets) モデルを提案する。
BScNetsは、コストを抑えながら最先端のモデルよりも大きなマージンを保っている。
論文 参考訳(メタデータ) (2021-12-13T17:35:54Z) - Self-supervised Graph Learning for Occasional Group Recommendation [28.337475919795008]
時々グループ(コールドスタートグループ)に商品を推薦する問題について検討する。
アイテムとの相互作用が極端に疎いため、これらのグループに対する高品質な埋め込みを学習することは困難である。
本稿では,グループ/ユーザ/イテムの埋め込みを再構築するために,バックボーンGNNモデルを協調訓練する自己教師付きグラフ学習パラダイムを提案する。
論文 参考訳(メタデータ) (2021-12-04T08:10:06Z) - Ranking Structured Objects with Graph Neural Networks [0.0]
RankGNNはグラフ間のペアワイズ選好のセットでトレーニングされており、一方が他方よりも好まれていることを示唆している。
この問題の実用的な適用の1つは薬剤の候補者の大規模なコレクションの最も有望な分子を見つけたいと思う薬剤のスクリーニングです。
提案するペアワイズrankgnnアプローチが,平均的なポイントワイズベースラインアプローチのランキング性能を有意に上回っているか,少なくとも同等であることを示す。
論文 参考訳(メタデータ) (2021-04-18T14:40:59Z) - Reinforced Neighborhood Selection Guided Multi-Relational Graph Neural
Networks [68.9026534589483]
RioGNNはReinforceed, recursive, flexible neighborhood selection guided multi-relational Graph Neural Network architectureである。
RioGNNは、各関係の個々の重要性の認識により、説明性を高めた差別的なノード埋め込みを学ぶことができる。
論文 参考訳(メタデータ) (2021-04-16T04:30:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。