論文の概要: Interactive Recommendations for Optimal Allocations in Markets with
Constraints
- arxiv url: http://arxiv.org/abs/2207.04143v1
- Date: Fri, 8 Jul 2022 22:16:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-12 16:25:31.483926
- Title: Interactive Recommendations for Optimal Allocations in Markets with
Constraints
- Title(参考訳): 制約のある市場における最適割当のインタラクティブな推奨
- Authors: Yigit Efe Erginbas, Soham Phade, Kannan Ramchandran
- Abstract要約: 本稿では,システムプロバイダがユーザへのレコメンデーションの質を高めるためのインタラクティブなフレームワークを提案する。
我々は,協調フィルタリング,帯域幅,最適資源配分といった手法を用いた統合的アプローチを採用する。
人工マトリックスと実世界のデータに関する実証研究は,本手法の有効性と性能を実証している。
- 参考スコア(独自算出の注目度): 12.580391999838128
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recommendation systems when employed in markets play a dual role: they assist
users in selecting their most desired items from a large pool and they help in
allocating a limited number of items to the users who desire them the most.
Despite the prevalence of capacity constraints on allocations in many
real-world recommendation settings, a principled way of incorporating them in
the design of these systems has been lacking. Motivated by this, we propose an
interactive framework where the system provider can enhance the quality of
recommendations to the users by opportunistically exploring allocations that
maximize user rewards and respect the capacity constraints using appropriate
pricing mechanisms. We model the problem as an instance of a low-rank
combinatorial multi-armed bandit problem with selection constraints on the
arms. We employ an integrated approach using techniques from collaborative
filtering, combinatorial bandits, and optimal resource allocation to provide an
algorithm that provably achieves sub-linear regret, namely $\tilde{\mathcal{O}}
( \sqrt{N M (N+M) RT} )$ in $T$ rounds for a problem with $N$ users, $M$ items
and rank $R$ mean reward matrix. Empirical studies on synthetic and real-world
data also demonstrate the effectiveness and performance of our approach.
- Abstract(参考訳): 市場で働くときの推奨システムは、大きなプールから最も望ましいアイテムを選択するのを手助けし、最も望むユーザに対して限られた数のアイテムを割り当てるのを支援するという二重の役割を担っている。
多くの現実世界のレコメンデーション設定におけるアロケーションに対するキャパシティ制約の頻度にもかかわらず、これらのシステムの設計にそれらを組み込む原則的な方法が欠如している。
そこで本研究では,ユーザの報酬を最大化し,適切な価格設定機構を用いてキャパシティ制約を尊重するアロケーションを同時に探索することにより,システム提供者がユーザへのレコメンデーションの質を高めることのできる対話型フレームワークを提案する。
我々は,この問題を,腕に選択制約のある低ランクコンビネータ型多腕バンディット問題の例としてモデル化する。
我々は,協調フィルタリング,組合せバンディット,最適リソース割り当ての手法を用いた統合アプローチを採用し,従って$n$ユーザ問題に対して$\tilde{\mathcal{o}} ( \sqrt{n m (n+m) rt} )$ in $t$ rounds, $m$ item, rank $r$ mean reward matrix というサブ線形後悔を実現するアルゴリズムを提供する。
合成データと実世界のデータに関する実証研究も,このアプローチの有効性と性能を示している。
関連論文リスト
- LANE: Logic Alignment of Non-tuning Large Language Models and Online Recommendation Systems for Explainable Reason Generation [15.972926854420619]
大きな言語モデル(LLM)を活用することで、包括的なレコメンデーションロジック生成の新しい機会を提供する。
レコメンデーションタスクのための微調整LDMモデルは、計算コストと既存のシステムとのアライメントの問題を引き起こす。
本研究は,LLMとオンラインレコメンデーションシステムとの連携を,LLMのチューニングを伴わない効果的戦略LANEを提案する。
論文 参考訳(メタデータ) (2024-07-03T06:20:31Z) - Efficient Prompt Optimization Through the Lens of Best Arm Identification [50.56113809171805]
この作業は、明示的な予算制約の下でプロンプト選択を効率的に行うための、原則化されたフレームワークであるTRIPLEを提供する。
マルチアームバンディット(MAB)における即時最適化と固定予算ベストアーム識別(BAI-FB)の間に確立された新しい接続上に構築されている。
論文 参考訳(メタデータ) (2024-02-15T05:31:13Z) - Approaching Collateral Optimization for NISQ and Quantum-Inspired
Computing [0.0]
担保最適化(Collateral optimization)とは、債務又は担保取引を満たすための金融資産の体系的な配分を指す。
一般的な目的の1つは、特定のトランザクションや取引ポートフォリオに関連するリスクを軽減するのに必要な担保コストを最小限にすることである。
論文 参考訳(メタデータ) (2023-05-25T18:01:04Z) - A Bandit Approach to Online Pricing for Heterogeneous Edge Resource
Allocation [8.089950414444115]
ヘテロジニアスなエッジリソース割り当てのための2つの新しいオンライン価格設定機構が提案されている。
このメカニズムはリアルタイムで動作し、需要分布に関する事前の知識を必要としない。
提案した価格体系では, 利用者が好みのリソースを選択し, 支払うことができ, 観測された履歴データに基づいて動的に資源価格を調整できる。
論文 参考訳(メタデータ) (2023-02-14T10:21:14Z) - Interactive Learning with Pricing for Optimal and Stable Allocations in
Markets [12.580391999838128]
大規模オンラインレコメンデーションシステムは、ユーザのフィードバックから好みを学習しながら、競合するユーザ間で限られた数のアイテムの割り当てを容易にする必要がある。
我々のフレームワークは、報酬を楽観的に最大化するアロケーションを探索することで、レコメンデーションの品質を高める。
不安定性を最小限に抑えるため、推薦されたアロケーションから逸脱するユーザのインセンティブを測定するため、アルゴリズムはWalrasian equilibriaから派生したスキームに基づいてアイテムを価格設定する。
本手法は, 帯域幅, 最適資源配分, 協調フィルタリングの手法を統合し, サブリニアな社会福祉の後悔と, サブリニアな不安定性を実現するアルゴリズムを得るための最初の手法である。
論文 参考訳(メタデータ) (2022-12-13T20:33:54Z) - Incentive-Aware Recommender Systems in Two-Sided Markets [49.692453629365204]
最適性能を達成しつつエージェントのインセンティブと整合する新しいレコメンデータシステムを提案する。
我々のフレームワークは、このインセンティブを意識したシステムを、両側市場におけるマルチエージェントバンディット問題としてモデル化する。
どちらのアルゴリズムも、エージェントが過剰な露出から保護する、ポストフェアネス基準を満たす。
論文 参考訳(メタデータ) (2022-11-23T22:20:12Z) - A Unifying Framework for Online Optimization with Long-Term Constraints [62.35194099438855]
我々は,意思決定者が長期的制約の対象となる一連の意思決定をしなければならないオンライン学習問題について検討する。
目標は、全報酬を最大化し、同時に、$T$ラウンド全体で小さな累積違反を達成することである。
本稿では,この一般クラス問題に対して,未知のモデルに基づいて報酬と制約が選択された場合と,各ラウンドで敵が選択した場合の双方において,最良世界型アルゴリズムを提示する。
論文 参考訳(メタデータ) (2022-09-15T16:59:19Z) - Online Learning with Knapsacks: the Best of Both Worlds [54.28273783164608]
オンライン学習の課題として,意思決定者が,リソース制約の有限セットに違反することなく,期待する報酬を最大化したい,という課題を提起する。
当社のフレームワークは,意思決定者がそのエビデンスを柔軟かつコスト論的に扱えるようにします。
論文 参考訳(メタデータ) (2022-02-28T12:10:48Z) - Exploration in two-stage recommender systems [79.50534282841618]
2段階のレコメンデータシステムは、スケーラビリティと保守性のために業界で広く採用されている。
このセットアップの鍵となる課題は、各ステージの最適性能が最適なグローバルパフォーマンスを暗示していないことである。
そこで本研究では,ランクとノミネーター間の探索戦略を同期させる手法を提案する。
論文 参考訳(メタデータ) (2020-09-01T16:52:51Z) - Hierarchical Adaptive Contextual Bandits for Resource Constraint based
Recommendation [49.69139684065241]
コンテキスト多重武装バンディット(MAB)は、様々な問題において最先端のパフォーマンスを達成する。
本稿では,階層型適応型文脈帯域幅法(HATCH)を提案する。
論文 参考訳(メタデータ) (2020-04-02T17:04:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。