論文の概要: Creator Incentives in Recommender Systems: A Cooperative Game-Theoretic Approach for Stable and Fair Collaboration in Multi-Agent Bandits
- arxiv url: http://arxiv.org/abs/2604.08643v1
- Date: Thu, 09 Apr 2026 17:45:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.513623
- Title: Creator Incentives in Recommender Systems: A Cooperative Game-Theoretic Approach for Stable and Fair Collaboration in Multi-Agent Bandits
- Title(参考訳): Recommender Systemsにおけるクリエーターインセンティブ:マルチエージェントバンドにおける安定的で公正なコラボレーションのための協調ゲーム理論アプローチ
- Authors: Ramakrishnan Krishnamurthy, Arpit Agarwal, Lakshminarayanan Subramanian, Maximilian Nickel,
- Abstract要約: 我々は,移動可能ユーティリティ(TU)協調ゲーム定式化による多エージェント線形帯域問題として協調を解析する。
固定された動作集合を持つ同一(同種)エージェントに対して、誘導されたTUゲームは穏やかなアルゴリズム条件下で凸であることを示す。
4つのシャプリー公理のうち3つを満たす単純な後悔に基づくペイアウトルールを提案し、その中核にある。
- 参考スコア(独自算出の注目度): 18.15244869689104
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: User interactions in online recommendation platforms create interdependencies among content creators: feedback on one creator's content influences the system's learning and, in turn, the exposure of other creators' contents. To analyze incentives in such settings, we model collaboration as a multi-agent stochastic linear bandit problem with a transferable utility (TU) cooperative game formulation, where a coalition's value equals the negative sum of its members' cumulative regrets. We show that, for identical (homogenous) agents with fixed action sets, the induced TU game is convex under mild algorithmic conditions, implying a non-empty core that contains the Shapley value and ensures both stability and fairness. For heterogeneous agents, the game still admits a non-empty core, though convexity and Shapley value core-membership are no longer guaranteed. To address this, we propose a simple regret-based payout rule that satisfies three out of the four Shapley axioms and also lies in the core. Experiments on MovieLens-100k dataset illustrate when the empirical payout aligns with -- and diverges from -- the Shapley fairness across different settings and algorithms.
- Abstract(参考訳): オンラインレコメンデーションプラットフォームにおけるユーザインタラクションは、あるクリエイターのコンテンツに対するフィードバックがシステムの学習に影響を与え、他のクリエイターのコンテンツが露出する。
このような環境下でのインセンティブを解析するために、我々は、連立の値がメンバーの累積後悔の負の和に等しいような、転送可能なユーティリティ(TU)協調ゲーム定式化によるマルチエージェント確率線形バンドイット問題として協調をモデル化する。
固定された動作集合を持つ同一(同種)エージェントに対して、誘導されたTUゲームは穏やかなアルゴリズム条件下で凸であり、シャプリー値を含む空でないコアを暗示し、安定性と公平性の両方を保証する。
不均一なエージェントに対しては、ゲームは依然として空でないコアを認めているが、凸性やShapley値のコアメンバーシップはもはや保証されていない。
これを解決するために,4つのシャプリー公理のうち3つを満たす簡単な後悔に基づく支払ルールを提案し,その中核にある。
MovieLens-100kデータセットの実験では、経験的なペイアウトが -- そして、 -- 異なる設定とアルゴリズムでShapleyフェアネスと整合する様子が示されている。
関連論文リスト
- Byzantine-Robust and Differentially Private Federated Optimization under Weaker Assumptions [89.52532304099522]
フェデレートラーニング(FL)は、クライアントが生データを集中せずに共有モデルを共同でトレーニングすることを可能にし、固有のプライバシーレベルを提供する。
グラデーションとモデル更新は機密情報を漏洩する可能性があるが、悪意のあるサーバはビザンティン操作のような敵攻撃をマウントする可能性がある。
これらの脆弱性は、統合されたフレームワーク内の差分プライバシー(DP)とビザンチンの堅牢性に対処する必要性を強調している。
Byz-Clip21-SGD2Mを提案する。
論文 参考訳(メタデータ) (2026-03-24T17:39:09Z) - Learning to Collaborate: An Orchestrated-Decentralized Framework for Peer-to-Peer LLM Federation [0.9231476323484774]
本稿では,分散化を組織化するための新しいフレームワークであるKNEXA-FLを紹介する。
非集約型のCentral Profiler/Matchmakerを採用しており、P2Pコラボレーションを文脈的盗聴問題として定式化している。
実験の結果,KNEXA-FLはP2Pのランダムな協調に対して約50%の精度でPass@1を向上することがわかった。
論文 参考訳(メタデータ) (2026-01-23T19:18:43Z) - A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version [1.7778609937758325]
協調機械学習は、複数のデータ所有者が予測性能を改善するためにモデルを共同で訓練することを可能にする。
インセンティブの互換性と公正な貢献に基づく報酬を保証することは、依然として重要な課題である。
標準加法的定式化を相対的寄与尺度に置き換える比に基づくシェープリー値を導入する。
論文 参考訳(メタデータ) (2025-10-15T08:08:18Z) - Shapley Machine: A Game-Theoretic Framework for N-Agent Ad Hoc Teamwork [25.31548780542065]
我々は、NAHT(n-agent ad hoc teamwork)と呼ばれるオープンマルチエージェントシステムにおける最近提案された問題について検討することを目指している。
既存の手法は設計に基づいており、したがって理論的な厳密さとエージェント間のあいまいな信用割り当てが欠如している。
これらの制約に対処するため、協調ゲーム理論のレンズを用いてNAHTをモデル化し、解決する。
論文 参考訳(メタデータ) (2025-06-12T20:44:09Z) - Shapley Value Approximation Based on k-Additive Games [21.023521613326654]
シェープリー値(Shapley value)は、支払いを複数のエージェントに分けなければならない公平な分割問題に対する一般的な解である。
その人気と公理的な正当化にもかかわらず、Shapleyの値は、関係するエンティティの数と指数関数的にスケールする計算複雑性に悩まされている。
我々は、$k$-additive surrogateゲームに適合する新しい近似法であるSVA$k_textADD$を提案する。
論文 参考訳(メタデータ) (2025-02-07T08:52:57Z) - Self-Localized Collaborative Perception [49.86110931859302]
我々は,新しい自己局在型協調認識システムであるMathttCoBEVGlue$を提案する。
$mathttCoBEVGlue$は、エージェント間の相対的なポーズを提供する新しい空間アライメントモジュールである。
$mathttCoBEVGlue$は任意のローカライゼーションノイズとアタックの下で最先端の検出性能を達成する。
論文 参考訳(メタデータ) (2024-06-18T15:26:54Z) - PPA-Game: Characterizing and Learning Competitive Dynamics Among Online Content Creators [30.02006609876506]
本稿では, PPA-Game(Proportional Payoff Allocation Game)について紹介する。
こうしたダイナミクスは、YouTubeやTikTokなどのオンラインレコメンデーションシステム上でコンテンツクリエイターをシミュレートする。
本稿では,各エージェントの累積支払をT$ラウンドで行うことを容易にするオンラインアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-03-22T14:13:11Z) - Optimistic Policy Gradient in Multi-Player Markov Games with a Single
Controller: Convergence Beyond the Minty Property [89.96815099996132]
単一コントローラを用いたマルチプレイヤーゲームにおいて,楽観的なポリシー勾配手法を特徴付ける新しいフレームワークを開発した。
我々のアプローチは、我々が導入する古典的なミニティの自然一般化に依存しており、マルコフゲームを超えてさらなる応用が期待できる。
論文 参考訳(メタデータ) (2023-12-19T11:34:10Z) - Robust and Performance Incentivizing Algorithms for Multi-Armed Bandits with Strategic Agents [52.75161794035767]
性能インセンティブとロバストネスの2つの目的を同時に満たすバンディットアルゴリズムのクラスを導入する。
そこで本研究では,第2価格オークションのアイデアをアルゴリズムと組み合わせることで,プリンシパルが腕の性能特性に関する情報を持たないような設定が可能であることを示す。
論文 参考訳(メタデータ) (2023-12-13T06:54:49Z) - A Black-box Approach for Non-stationary Multi-agent Reinforcement Learning [53.83345471268163]
非定常マルチエージェントシステムにおける平衡の学習について検討する。
単エージェント学習へのブラックボックス還元による様々な平衡の検証方法を示す。
論文 参考訳(メタデータ) (2023-06-12T23:48:24Z) - Modeling Content Creator Incentives on Algorithm-Curated Platforms [76.53541575455978]
本研究では,アルゴリズムの選択が露出ゲームにおける(ナッシュ)平衡の存在と性格にどのように影響するかを検討する。
本研究では、露出ゲームにおける平衡を数値的に見つけるためのツールを提案し、MovieLensとLastFMデータセットの監査結果を示す。
論文 参考訳(メタデータ) (2022-06-27T08:16:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。