論文の概要: Comparative Performance of Collaborative Bandit Algorithms: Effect of Sparsity and Exploration Intensity
- arxiv url: http://arxiv.org/abs/2410.12086v1
- Date: Tue, 15 Oct 2024 22:09:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-17 13:41:48.101898
- Title: Comparative Performance of Collaborative Bandit Algorithms: Effect of Sparsity and Exploration Intensity
- Title(参考訳): 協調帯域幅アルゴリズムの比較性能:空間性と探索強度の影響
- Authors: Eren Ozbay,
- Abstract要約: 協調的盗賊は、武器(またはアイテム)間の関係を導入することにより、文脈的盗賊のパフォーマンスを向上させることを目的としている
本稿では,協調バンディットアルゴリズムの包括的解析を行い,その性能を徹底的に比較する。
- 参考スコア(独自算出の注目度): 0.6526824510982802
- License:
- Abstract: This paper offers a comprehensive analysis of collaborative bandit algorithms and provides a thorough comparison of their performance. Collaborative bandits aim to improve the performance of contextual bandits by introducing relationships between arms (or items), allowing effective propagation of information. Collaboration among arms allows the feedback obtained through a single user (item) to be shared across related users (items). Introducing collaboration also alleviates the cold user (item) problem, i.e., lack of historical information when a new user (item) arriving to the platform with no prior record of interactions. In the context of modeling the relationships between arms (items), there are two main approaches: Hard and soft clustering. We call approaches that model the relationship between arms in an \textit{absolute} manner as hard clustering, i.e., the relationship is binary. Soft clustering relaxes membership constraints, allowing \textit{fuzzy} assignment. Focusing on the latter, we provide extensive experiments on the state-of-the-art collaborative contextual bandit algorithms and investigate the effect of sparsity and how the exploration intensity acts as a correction mechanism. Our numerical experiments demonstrate that controlling for sparsity in collaboration improves data efficiency and performance as it better informs learning. Meanwhile, increasing the exploration intensity acts as a correction because it effectively reduces variance due to potentially misspecified relationships among users. We observe that this misspecification is further remedied by introducing latent factors, and thus, increasing the dimensionality of the bandit parameters.
- Abstract(参考訳): 本稿では,協調バンディットアルゴリズムの包括的解析を行い,その性能を徹底的に比較する。
協調的盗賊は、武器(またはアイテム)間の関係を導入し、効果的な情報伝達を可能にすることにより、文脈的盗賊のパフォーマンスを向上させることを目的としている。
アーム間のコラボレーションにより、単一のユーザ(item)を通じて得られたフィードバックを、関連するユーザ(item)間で共有することができる。
コラボレーションの導入はまた、コールドユーザ(イテム)の問題、すなわち、新しいユーザ(イテム)が事前に対話の記録を持っていないプラットフォームに到着したときの履歴情報の欠如を緩和する。
武器間の関係をモデル化する文脈では、ハードとソフトのクラスタリングの2つの主要なアプローチがある。
我々は、ハードクラスタリング(すなわち、その関係はバイナリである)として、 \textit{absolute} 方式でアーム間の関係をモデル化するアプローチを呼ぶ。
ソフトクラスタリングはメンバーシップ制約を緩和し、 \textit{fuzzy} の割り当てを可能にする。
後者に焦点をあてて、最先端の協調的文脈的帯域幅アルゴリズムについて広範な実験を行い、空間効果と探索強度が補正メカニズムとしてどのように作用するかを考察する。
数値実験により,協調作業における疎結合の制御がデータ効率と性能を向上し,学習の質が向上することを示した。
一方、探索強度の増大は、ユーザ間の潜在的な不特定関係による分散を効果的に軽減するため、補正として機能する。
我々は,この不特定性は潜伏因子の導入によってさらに改善され,その結果,帯域幅パラメータの次元性が増大することが観察された。
関連論文リスト
- DeBaTeR: Denoising Bipartite Temporal Graph for Recommendation [38.87538556340487]
タイムアウェアなユーザ/イテムの埋め込みを生成するための,シンプルかつ効果的な機構を提案する。
提案手法は,2部分節時間グラフをレコメンデータシステムで記述する2つの方法である。
論文 参考訳(メタデータ) (2024-11-14T04:39:30Z) - Enhancing Graph Contrastive Learning with Reliable and Informative Augmentation for Recommendation [84.45144851024257]
CoGCLは、離散コードを通じてより強力な協調情報でコントラスト的なビューを構築することで、グラフのコントラスト学習を強化することを目的としている。
ユーザとアイテムの表現を離散コードに定量化するために,マルチレベルベクトル量化器をエンドツーエンドで導入する。
近傍構造に対しては,離散符号を仮想隣人として扱うことにより,仮想隣人拡張を提案する。
意味的関連性については、共有された離散コードと相互作用ターゲットに基づいて類似のユーザ/イテムを識別し、意味的関連性のあるビューを生成する。
論文 参考訳(メタデータ) (2024-09-09T14:04:17Z) - Pure Exploration in Asynchronous Federated Bandits [57.02106627533004]
マルチアームバンディットとリニアバンディットのフェデレートされた純粋な探索問題について検討し、M$エージェントが中央サーバとの通信を通じて最適なアームを協調的に識別する方法について検討した。
信頼度を固定した純粋探索のための非同期マルチアームバンディットおよび線形バンディットアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-17T06:04:00Z) - Provably Efficient Learning in Partially Observable Contextual Bandit [4.910658441596583]
古典的帯域幅アルゴリズムの改善に因果境界をどのように適用できるかを示す。
本研究は,実世界の応用における文脈的包括的エージェントの性能を高める可能性を秘めている。
論文 参考訳(メタデータ) (2023-08-07T13:24:50Z) - Federated Learning for Heterogeneous Bandits with Unobserved Contexts [0.0]
我々は、未知のコンテキストを持つ多腕コンテキスト包帯のフェデレーション問題について検討する。
線形パラメタライズされた報酬関数に対して,除去に基づくアルゴリズムを提案し,後悔の束縛を証明した。
論文 参考訳(メタデータ) (2023-03-29T22:06:24Z) - Batch Active Learning from the Perspective of Sparse Approximation [12.51958241746014]
アクティブな学習は、機械学習エージェントと人間のアノテーションとのインタラクションを活用することで、効率的なモデルトレーニングを可能にする。
スパース近似の観点からバッチアクティブラーニングを定式化する新しいフレームワークを提案し,提案する。
我々のアクティブラーニング手法は、ラベルのないデータプールから、対応するトレーニング損失関数が、そのフルデータプールに近似するように、情報的サブセットを見つけることを目的としている。
論文 参考訳(メタデータ) (2022-11-01T03:20:28Z) - CORE: A Retrieve-then-Edit Framework for Counterfactual Data Generation [91.16551253297588]
Counterfactual Generation via Retrieval and Editing (CORE) は、トレーニングのための多様な反事実摂動を生成するための検索強化された生成フレームワークである。
COREはまず、学習されたバイエンコーダを用いて、タスク関連未ラベルテキストコーパス上で密集した検索を行う。
COREはこれらを、反ファクト編集のために、数ショットの学習機能を備えた大規模な言語モデルへのプロンプトに組み込む。
論文 参考訳(メタデータ) (2022-10-10T17:45:38Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - Improving Long-Tail Relation Extraction with Collaborating
Relation-Augmented Attention [63.26288066935098]
本稿では,ニューラルネットワーク,コラボレーティング・リレーショナル・アテンション(CoRA)を提案する。
一般的なベンチマークデータセットNYTの実験では、提案されたCoRAは、最先端のパフォーマンスを大きなマージンで改善する。
論文 参考訳(メタデータ) (2020-10-08T05:34:43Z) - Relabel the Noise: Joint Extraction of Entities and Relations via
Cooperative Multiagents [52.55119217982361]
協調型マルチエージェント群を用いて,雑音の多いインスタンスを処理するための共同抽出手法を提案する。
ノイズの多いインスタンスをきめ細かな方法で処理するために、協調グループの各エージェントは、自身の視点で連続的な信頼スコアを算出してインスタンスを評価する。
信頼度コンセンサスモジュールは、すべてのエージェントの知恵を収集し、信頼度ラベル付きラベルでノイズの多いトレーニングセットを再分割するように設計されている。
論文 参考訳(メタデータ) (2020-04-21T12:03:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。