論文の概要: Incentive-Aware Recommender Systems in Two-Sided Markets
- arxiv url: http://arxiv.org/abs/2211.15381v2
- Date: Tue, 18 Jun 2024 05:45:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-20 05:43:26.227948
- Title: Incentive-Aware Recommender Systems in Two-Sided Markets
- Title(参考訳): 2層市場におけるインセンティブ・アウェア・レコメンダシステム
- Authors: Xiaowu Dai, Wenlu Xu, Yuan Qi, Michael I. Jordan,
- Abstract要約: 最適性能を達成しつつエージェントのインセンティブと整合する新しいレコメンデータシステムを提案する。
我々のフレームワークは、このインセンティブを意識したシステムを、両側市場におけるマルチエージェントバンディット問題としてモデル化する。
どちらのアルゴリズムも、エージェントが過剰な露出から保護する、ポストフェアネス基準を満たす。
- 参考スコア(独自算出の注目度): 49.692453629365204
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online platforms in the Internet Economy commonly incorporate recommender systems that recommend products (or "arms") to users (or "agents"). A key challenge in this domain arises from myopic agents who are naturally incentivized to exploit by choosing the optimal arm based on current information, rather than exploring various alternatives to gather information that benefits the collective. We propose a novel recommender system that aligns with agents' incentives while achieving asymptotically optimal performance, as measured by regret in repeated interactions. Our framework models this incentive-aware system as a multi-agent bandit problem in two-sided markets, where the interactions of agents and arms are facilitated by recommender systems on online platforms. This model incorporates incentive constraints induced by agents' opportunity costs. In scenarios where opportunity costs are known to the platform, we show the existence of an incentive-compatible recommendation algorithm. This algorithm pools recommendations between a genuinely good arm and an unknown arm using a randomized and adaptive strategy. Moreover, when these opportunity costs are unknown, we introduce an algorithm that randomly pools recommendations across all arms, utilizing the cumulative loss from each arm as feedback for strategic exploration. We demonstrate that both algorithms satisfy an ex-post fairness criterion, which protects agents from over-exploitation. All code for using the proposed algorithms and reproducing results is made available on GitHub.
- Abstract(参考訳): インターネット経済のオンラインプラットフォームは一般的に、製品(または「武器」)をユーザー(または「エージェント」)に推奨するレコメンデーターシステムを含んでいる。
この領域における重要な課題は、集団に有益な情報を集めるための様々な代替手段を探るのではなく、現在の情報に基づいて最適な腕を選択することによって、自然に活用にインセンティブを与えるミオピックエージェントから生じる。
本稿では,反復的相互作用における後悔によって測定された漸近的最適性能を達成しつつ,エージェントのインセンティブと整合する新しいレコメンデータシステムを提案する。
当社のフレームワークは,このインセンティブを意識したシステムを,オンラインプラットフォーム上での推奨システムによってエージェントとアームのインタラクションが促進される,双方向市場におけるマルチエージェントバンディット問題としてモデル化する。
このモデルにはエージェントの機会コストによるインセンティブ制約が組み込まれている。
プラットフォームに機会コストが知られているシナリオでは、インセンティブ互換のレコメンデーションアルゴリズムの存在を示す。
このアルゴリズムは、ランダムで適応的な戦略を用いて、真に良い腕と未知の腕の間のレコメンデーションをプールする。
さらに、これらの機会コストが不明な場合には、戦略探索のフィードバックとして各アームからの累積損失を利用して、全アームにランダムにレコメンデーションをプールするアルゴリズムを導入する。
両アルゴリズムは, エージェントが過剰な露出から保護される, ポストフェアネス基準を満たすことを実証する。
提案されたアルゴリズムの使用と結果の再現に関するすべてのコードはGitHubで公開されている。
関連論文リスト
- Algorithmic Collusion or Competition: the Role of Platforms' Recommender
Systems [2.551933457838182]
本研究は,AIに基づく価格アルゴリズムの競合的あるいは共謀的ダイナミクスを,レコメンデーションアルゴリズムがどのように決定するかを検討する。
実験結果から,販売者の利益最大化目標との一致により,収益ベースレコメンデータシステムにより,販売者間のアルゴリズム的共謀が促進されることが判明した。
需要ベースのレコメンデーションシステムは、売り手間の価格競争を促進させ、売り手の目標と不一致のため、価格を下げる。
論文 参考訳(メタデータ) (2023-09-25T21:45:30Z) - Pure Exploration under Mediators' Feedback [63.56002444692792]
マルチアームバンディット(Multi-armed bandits)は、各インタラクションステップにおいて、学習者が腕を選択し、報酬を観察する、シーケンシャルな意思決定フレームワークである。
本稿では,学習者が仲介者の集合にアクセスできるシナリオについて考察する。
本稿では,学習者には仲介者の方針が知られていると仮定して,最適な腕を発見するための逐次的意思決定戦略を提案する。
論文 参考訳(メタデータ) (2023-08-29T18:18:21Z) - Interactive Recommendations for Optimal Allocations in Markets with
Constraints [12.580391999838128]
本稿では,システムプロバイダがユーザへのレコメンデーションの質を高めるためのインタラクティブなフレームワークを提案する。
我々は,協調フィルタリング,帯域幅,最適資源配分といった手法を用いた統合的アプローチを採用する。
人工マトリックスと実世界のデータに関する実証研究は,本手法の有効性と性能を実証している。
論文 参考訳(メタデータ) (2022-07-08T22:16:51Z) - Information-Gathering in Latent Bandits [79.6953033727455]
本稿では,潜伏バンドにおける情報収集手法を提案する。
我々は、各州に対するエージェントの信念から、最高の腕を選ぶことは、より高い後悔を引き起こすことを示した。
また,腕を慎重に選択することで,状態分布の推定精度が向上することを示した。
論文 参考訳(メタデータ) (2022-07-08T01:15:12Z) - Incentivizing Combinatorial Bandit Exploration [87.08827496301839]
自己関心のあるユーザに対してレコメンデーションシステムでアクションを推奨するバンディットアルゴリズムを考える。
ユーザーは他のアクションを自由に選択でき、アルゴリズムの推奨に従うためにインセンティブを得る必要がある。
ユーザは悪用を好むが、アルゴリズムは、前のユーザから収集した情報を活用することで、探索にインセンティブを与えることができる。
論文 参考訳(メタデータ) (2022-06-01T13:46:25Z) - Modeling Attrition in Recommender Systems with Departing Bandits [84.85560764274399]
政策に依存した地平線を捉えた新しいマルチアームバンディット構成を提案する。
まず、全てのユーザが同じタイプを共有しているケースに対処し、最近の UCB ベースのアルゴリズムが最適であることを実証する。
次に、ユーザが2つのタイプに分けられる、より困難なケースを前進させます。
論文 参考訳(メタデータ) (2022-03-25T02:30:54Z) - GHRS: Graph-based Hybrid Recommendation System with Application to Movie
Recommendation [0.0]
本稿では,ユーザのレーティングの類似性に関連するグラフベースモデルを用いたレコメンデータシステムを提案する。
オートエンコーダの特徴抽出の利点を生かして,全ての属性を組み合わせて新しい特徴を抽出する。
The experimental results on the MovieLens dataset shows that the proposed algorithm developed many existing recommendation algorithm on recommendation accuracy。
論文 参考訳(メタデータ) (2021-11-06T10:47:45Z) - Learning the Optimal Recommendation from Explorative Users [38.332330484187395]
本研究では,レコメンデータシステムとユーザ間の逐次的インタラクションについて検討する。
効率的なシステム学習は依然として可能であるが、より困難であることを示す。
論文 参考訳(メタデータ) (2021-10-06T21:01:18Z) - Robust Multi-Agent Multi-Armed Bandits [26.26185074977412]
最近の研究によると、$Kの武器を持った盗賊の独立した事例に直面しているエージェントが、後悔を減らすために協力できることが示されている。
我々は、悪質なエージェントの振る舞いを仮定することなく、$m$が$K$よりも小さいと仮定すると、このアルゴリズムに対するコラボレーションは本当に後悔を減らせることを示した。
論文 参考訳(メタデータ) (2020-07-07T22:27:30Z) - Incentivizing Exploration with Selective Data Disclosure [70.11902902106014]
効率的な探索を促すレコメンデーションシステムを提案し設計する。
エージェントは順次到着し、固定されたが未知のアクション固有の分布から引き出されたアクションを選択し、報酬を受け取る。
フレキシブル・頻繁な行動モデルを用いた探索において,最適な後悔率が得られる。
論文 参考訳(メタデータ) (2018-11-14T19:29:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。