論文の概要: Incentive-Aware Recommender Systems in Two-Sided Markets
- arxiv url: http://arxiv.org/abs/2211.15381v1
- Date: Wed, 23 Nov 2022 22:20:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-04 13:48:12.501326
- Title: Incentive-Aware Recommender Systems in Two-Sided Markets
- Title(参考訳): 双方向市場におけるインセンティブアウェア推薦システム
- Authors: Xiaowu Dai, Yuan (Alan) Qi, and Michael I. Jordan
- Abstract要約: エージェントのインセンティブを尊重する新しい推薦システムを提案する。
両政策は, エージェントが過度の暴露から保護される, ポストフェアネス基準を満たすことを示す。
- 参考スコア(独自算出の注目度): 69.11586678637816
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online platforms in the Internet Economy commonly incorporate recommender
systems that recommend arms (e.g., products) to agents (e.g., users). In such
platforms, a myopic agent has a natural incentive to exploit, by choosing the
best product given the current information rather than to explore various
alternatives to collect information that will be used for other agents. We
propose a novel recommender system that respects agents' incentives and enjoys
asymptotically optimal performances expressed by the regret in repeated games.
We model such an incentive-aware recommender system as a multi-agent bandit
problem in a two-sided market which is equipped with an incentive constraint
induced by agents' opportunity costs. If the opportunity costs are known to the
principal, we show that there exists an incentive-compatible recommendation
policy, which pools recommendations across a genuinely good arm and an unknown
arm via a randomized and adaptive approach. On the other hand, if the
opportunity costs are unknown to the principal, we propose a policy that
randomly pools recommendations across all arms and uses each arm's cumulative
loss as feedback for exploration. We show that both policies also satisfy an
ex-post fairness criterion, which protects agents from over-exploitation.
- Abstract(参考訳): インターネット経済のオンラインプラットフォームは一般的に、エージェント(例えばユーザー)に武器(製品)を推奨するレコメンデーターシステムを含んでいる。
このようなプラットフォームでは、筋電図エージェントは、他のエージェントに使用される情報を収集する様々な代替手段を探索するよりも、現在の情報を与えられた最高の製品を選択することで、活用するための自然なインセンティブを持つ。
本稿では,エージェントのインセンティブを尊重し,繰り返しのゲームにおける後悔によって表現される漸近的に最適なパフォーマンスを享受する新しいレコメンデーションシステムを提案する。
エージェントの機会コストに起因したインセンティブ制約を備えた両面市場におけるマルチエージェントバンディット問題として,このようなインセンティブ対応リコメンデータシステムをモデル化する。
プリンシパルに機会コストが分かっている場合、真に良い腕と未知の腕にランダムで適応的なアプローチでレコメンデーションをプールするインセンティブに適合したレコメンデーションポリシーが存在することを示す。
一方、プリンシパルにとっての機会コストが不明な場合、全腕にランダムにレコメンデーションをプールし、各腕の累積損失を探索のフィードバックとして利用する政策を提案する。
いずれの政策も、エージェントが過度の暴露から保護する、ポストフェアネス基準を満たすことを示す。
関連論文リスト
- Algorithmic Collusion or Competition: the Role of Platforms' Recommender
Systems [2.551933457838182]
本研究は,AIに基づく価格アルゴリズムの競合的あるいは共謀的ダイナミクスを,レコメンデーションアルゴリズムがどのように決定するかを検討する。
実験結果から,販売者の利益最大化目標との一致により,収益ベースレコメンデータシステムにより,販売者間のアルゴリズム的共謀が促進されることが判明した。
需要ベースのレコメンデーションシステムは、売り手間の価格競争を促進させ、売り手の目標と不一致のため、価格を下げる。
論文 参考訳(メタデータ) (2023-09-25T21:45:30Z) - Pure Exploration under Mediators' Feedback [63.56002444692792]
マルチアームバンディット(Multi-armed bandits)は、各インタラクションステップにおいて、学習者が腕を選択し、報酬を観察する、シーケンシャルな意思決定フレームワークである。
本稿では,学習者が仲介者の集合にアクセスできるシナリオについて考察する。
本稿では,学習者には仲介者の方針が知られていると仮定して,最適な腕を発見するための逐次的意思決定戦略を提案する。
論文 参考訳(メタデータ) (2023-08-29T18:18:21Z) - Interactive Recommendations for Optimal Allocations in Markets with
Constraints [12.580391999838128]
本稿では,システムプロバイダがユーザへのレコメンデーションの質を高めるためのインタラクティブなフレームワークを提案する。
我々は,協調フィルタリング,帯域幅,最適資源配分といった手法を用いた統合的アプローチを採用する。
人工マトリックスと実世界のデータに関する実証研究は,本手法の有効性と性能を実証している。
論文 参考訳(メタデータ) (2022-07-08T22:16:51Z) - Information-Gathering in Latent Bandits [79.6953033727455]
本稿では,潜伏バンドにおける情報収集手法を提案する。
我々は、各州に対するエージェントの信念から、最高の腕を選ぶことは、より高い後悔を引き起こすことを示した。
また,腕を慎重に選択することで,状態分布の推定精度が向上することを示した。
論文 参考訳(メタデータ) (2022-07-08T01:15:12Z) - Incentivizing Combinatorial Bandit Exploration [87.08827496301839]
自己関心のあるユーザに対してレコメンデーションシステムでアクションを推奨するバンディットアルゴリズムを考える。
ユーザーは他のアクションを自由に選択でき、アルゴリズムの推奨に従うためにインセンティブを得る必要がある。
ユーザは悪用を好むが、アルゴリズムは、前のユーザから収集した情報を活用することで、探索にインセンティブを与えることができる。
論文 参考訳(メタデータ) (2022-06-01T13:46:25Z) - Modeling Attrition in Recommender Systems with Departing Bandits [84.85560764274399]
政策に依存した地平線を捉えた新しいマルチアームバンディット構成を提案する。
まず、全てのユーザが同じタイプを共有しているケースに対処し、最近の UCB ベースのアルゴリズムが最適であることを実証する。
次に、ユーザが2つのタイプに分けられる、より困難なケースを前進させます。
論文 参考訳(メタデータ) (2022-03-25T02:30:54Z) - GHRS: Graph-based Hybrid Recommendation System with Application to Movie
Recommendation [0.0]
本稿では,ユーザのレーティングの類似性に関連するグラフベースモデルを用いたレコメンデータシステムを提案する。
オートエンコーダの特徴抽出の利点を生かして,全ての属性を組み合わせて新しい特徴を抽出する。
The experimental results on the MovieLens dataset shows that the proposed algorithm developed many existing recommendation algorithm on recommendation accuracy。
論文 参考訳(メタデータ) (2021-11-06T10:47:45Z) - Learning the Optimal Recommendation from Explorative Users [38.332330484187395]
本研究では,レコメンデータシステムとユーザ間の逐次的インタラクションについて検討する。
効率的なシステム学習は依然として可能であるが、より困難であることを示す。
論文 参考訳(メタデータ) (2021-10-06T21:01:18Z) - Robust Multi-Agent Multi-Armed Bandits [26.26185074977412]
最近の研究によると、$Kの武器を持った盗賊の独立した事例に直面しているエージェントが、後悔を減らすために協力できることが示されている。
我々は、悪質なエージェントの振る舞いを仮定することなく、$m$が$K$よりも小さいと仮定すると、このアルゴリズムに対するコラボレーションは本当に後悔を減らせることを示した。
論文 参考訳(メタデータ) (2020-07-07T22:27:30Z) - Incentivizing Exploration with Selective Data Disclosure [70.11902902106014]
効率的な探索を促すレコメンデーションシステムを提案し設計する。
エージェントは順次到着し、固定されたが未知のアクション固有の分布から引き出されたアクションを選択し、報酬を受け取る。
フレキシブル・頻繁な行動モデルを用いた探索において,最適な後悔率が得られる。
論文 参考訳(メタデータ) (2018-11-14T19:29:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。