論文の概要: MESOB: Balancing Equilibria & Social Optimality
- arxiv url: http://arxiv.org/abs/2307.07911v1
- Date: Sun, 16 Jul 2023 00:43:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-18 17:10:09.524595
- Title: MESOB: Balancing Equilibria & Social Optimality
- Title(参考訳): MESOB:均衡均衡と社会的最適性
- Authors: Xin Guo, Lihong Li, Sareh Nabi, Rabih Salhab, Junzi Zhang
- Abstract要約: 本稿では,オンライン広告オークションにおける入札推薦を動機として,マルチレベルゲームとマルチエージェントゲームについて考察する。
本稿では, 平均場近似を用いた新規かつトラクタブルな2目的最適化法を提案する。
MESOB-OMOは、競合と協力の二重目的の観点から、ほぼ効率的な解を得ることができる。
- 参考スコア(独自算出の注目度): 12.702156510015628
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motivated by bid recommendation in online ad auctions, this paper considers a
general class of multi-level and multi-agent games, with two major
characteristics: one is a large number of anonymous agents, and the other is
the intricate interplay between competition and cooperation. To model such
complex systems, we propose a novel and tractable bi-objective optimization
formulation with mean-field approximation, called MESOB (Mean-field Equilibria
& Social Optimality Balancing), as well as an associated occupation measure
optimization (OMO) method called MESOB-OMO to solve it. MESOB-OMO enables
obtaining approximately Pareto efficient solutions in terms of the dual
objectives of competition and cooperation in MESOB, and in particular allows
for Nash equilibrium selection and social equalization in an asymptotic manner.
We apply MESOB-OMO to bid recommendation in a simulated pay-per-click ad
auction. Experiments demonstrate its efficacy in balancing the interests of
different parties and in handling the competitive nature of bidders, as well as
its advantages over baselines that only consider either the competitive or the
cooperative aspects.
- Abstract(参考訳): 本稿では,オンライン広告オークションにおける入札提案に動機づけられたマルチレベルゲームとマルチエージェントゲームという2つの主要な特徴について考察する。
このような複雑なシステムをモデル化するために,mesob(mean-field equilibria & social optimality balancing)と呼ばれる平均場近似による新規で扱いやすい二目的最適化定式化と,それを解決するためのmesob-omo法を提案する。
MESOB-OMOは、MESOBにおける競合と協力の二重目的という観点でおよそパレート効率の良い解を得ることができ、特に漸近的にナッシュ平衡の選択と社会的等化が可能である。
我々はMESOB-OMOを、クリック単価をシミュレーションした広告オークションで推薦する。
実験は、異なる政党の利益のバランスをとること、入札者の競争的な性質を扱うこと、および競争的側面と協力的側面のみを考慮するベースラインよりも有利であることを示す。
関連論文リスト
- LLaMA-Berry: Pairwise Optimization for O1-like Olympiad-Level Mathematical Reasoning [56.273799410256075]
このフレームワークはMonte Carlo Tree Search (MCTS)と反復的なSelf-Refineを組み合わせて推論パスを最適化する。
このフレームワークは、一般的なベンチマークと高度なベンチマークでテストされており、探索効率と問題解決能力の点で優れた性能を示している。
論文 参考訳(メタデータ) (2024-10-03T18:12:29Z) - Efficient Adaptation in Mixed-Motive Environments via Hierarchical Opponent Modeling and Planning [51.52387511006586]
本稿では,HOP(Hierarchical Opponent Modeling and Planning)を提案する。
HOPは階層的に2つのモジュールから構成される: 相手の目標を推論し、対応する目標条件のポリシーを学ぶ、反対モデリングモジュール。
HOPは、さまざまな未確認エージェントと相互作用する際、優れた少数ショット適応能力を示し、セルフプレイのシナリオで優れている。
論文 参考訳(メタデータ) (2024-06-12T08:48:06Z) - Sample-Efficient Multi-Agent RL: An Optimization Perspective [103.35353196535544]
一般関数近似に基づく汎用マルコフゲーム(MG)のためのマルチエージェント強化学習(MARL)について検討した。
汎用MGに対するマルチエージェントデカップリング係数(MADC)と呼ばれる新しい複雑性尺度を導入する。
我々のアルゴリズムは既存の研究に匹敵するサブリニアな後悔を与えることを示す。
論文 参考訳(メタデータ) (2023-10-10T01:39:04Z) - Interpolating Item and User Fairness in Multi-Sided Recommendations [13.635310806431198]
我々は、新しいフェアレコメンデーションフレームワーク、問題(FAIR)を紹介します。
本稿では,リアルタイム学習とフェアレコメンデーションを同時に行う低レベルのアルゴリズム形式を提案する。
我々は,プラットフォーム収益を維持する上でのフレームワークと手法の有効性を実証するとともに,アイテムとユーザ双方に望ましい公平性を確保した。
論文 参考訳(メタデータ) (2023-06-12T15:00:58Z) - Inducing Stackelberg Equilibrium through Spatio-Temporal Sequential
Decision-Making in Multi-Agent Reinforcement Learning [17.101534531286298]
我々は、すべてのエージェントが共有する条件付きハイパーネットワークに基づいて、ナッシュレベルのポリシーモデルを構築する。
このアプローチは対称的実行を伴う非対称なトレーニングを可能にし、各エージェントは、上位エージェントによる決定に最適な条件で応答する。
実験により,本手法は繰り返し行列ゲームシナリオにおいて,SEポリシーに効果的に収束することを示した。
論文 参考訳(メタデータ) (2023-04-20T14:47:54Z) - Faster Last-iterate Convergence of Policy Optimization in Zero-Sum
Markov Games [63.60117916422867]
本稿では,対戦型マルチエージェントRLの最も基本的な設定,すなわち2プレーヤゼロサムマルコフゲームに焦点を当てる。
両エージェントから対称更新を施した単一ループポリシー最適化手法を提案し,この手法はエントロピー規則化楽観的乗算重み更新法(OMWU)によって更新される。
我々の収束結果は、最もよく知られた複雑性を改善し、競合するマルコフゲームにおけるポリシー最適化をよりよく理解する。
論文 参考訳(メタデータ) (2022-10-03T16:05:43Z) - A Cooperative-Competitive Multi-Agent Framework for Auto-bidding in
Online Advertising [53.636153252400945]
本稿では,自動入札のための総合的マルチエージェント強化学習フレームワーク,すなわちMAABを提案し,自動入札戦略を学習する。
当社のアプローチは、社会的福祉の観点から、いくつかの基準的手法を上回り、広告プラットフォームの収益を保証します。
論文 参考訳(メタデータ) (2021-06-11T08:07:14Z) - Multi-Agent Cooperative Bidding Games for Multi-Objective Optimization
in e-Commercial Sponsored Search [26.117969395228503]
我々は,Multi-Agent Cooperative bidding Games (MACG) と呼ばれる新しい多目的協調入札最適化法を提案する。
すべての広告の全体的な利益を最大化するためのグローバルな目的が、より良い協力を奨励し、またセルフ入札の広告主を保護するために追加される。
タオバオプラットフォーム上でのオフライン実験とオンラインA/Bテストは、単一広告主の目標とグローバル利益の両方が大幅に改善されたことを示している。
論文 参考訳(メタデータ) (2021-06-08T03:18:28Z) - Model-based Multi-agent Policy Optimization with Adaptive Opponent-wise
Rollouts [52.844741540236285]
マルチエージェント強化学習(MARL)におけるモデルベース手法について検討する。
AORPO(Adaptive Opponent-wise Rollout Policy)と呼ばれる新しい分散型モデルベースのMARL法を提案する。
論文 参考訳(メタデータ) (2021-05-07T16:20:22Z) - Balancing Rational and Other-Regarding Preferences in
Cooperative-Competitive Environments [4.705291741591329]
混合環境は利己的で社会的利益の衝突で悪名高い。
個人と社会的インセンティブのバランスをとるBAROCCOを提案します。
メタアルゴリズムは、Qラーニングとアクタークリティカルの両方のフレームワークと互換性があります。
論文 参考訳(メタデータ) (2021-02-24T14:35:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。