論文の概要: Auctions Between Regret-Minimizing Agents
- arxiv url: http://arxiv.org/abs/2110.11855v1
- Date: Fri, 22 Oct 2021 15:44:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-25 16:50:18.339467
- Title: Auctions Between Regret-Minimizing Agents
- Title(参考訳): 後悔最小化エージェント間の競売
- Authors: Yoav Kolumbus and Noam Nisan
- Abstract要約: 我々は、第1価格と第2価格のオークションと、その一般化されたバージョン(例えば、広告オークションに使用されるもの)について研究する。
意外なことに、第2の価格オークションでは、プレイヤーは真のバリュエーションを自身の学習エージェントに誤って報告するインセンティブを持つ一方で、第1の価格オークションでは、すべてのプレイヤーが真にバリュエーションをエージェントに報告する主要な戦略であることを示す。
- 参考スコア(独自算出の注目度): 5.634825161148484
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We analyze a scenario in which software agents implemented as regret
minimizing algorithms engage in a repeated auction on behalf of their users. We
study first price and second price auctions, as well as their generalized
versions (e.g., as those used for ad auctions). Using both theoretical analysis
and simulations, we show that, surprisingly, in second price auctions the
players have incentives to mis-report their true valuations to their own
learning agents, while in the first price auction it is a dominant strategy for
all players to truthfully report their valuations to their agents.
- Abstract(参考訳): 後悔最小化アルゴリズムとして実装されたソフトウェアエージェントがユーザに代わって繰り返しオークションに参加するシナリオを分析した。
我々は、第1価格と第2価格のオークション、および一般化されたバージョン(例えば、広告オークションに使用されるもの)について研究する。
理論的解析とシミュレーションの両方を用いて、意外なことに第2の価格オークションでは、プレイヤーは真の評価を自身の学習エージェントに誤って報告するインセンティブを持つ一方で、第1の価格オークションでは、すべてのプレイヤーが真に彼らの評価をエージェントに報告する支配的な戦略であることを示す。
関連論文リスト
- A pragmatic policy learning approach to account for users' fatigue in repeated auctions [47.75983850930121]
MLモデルは、前回のオークションが現在の機会価値をどの程度獲得したかを予測することができる。
この予測を用いて、現在の競売の予想利益を最大化する政策を、患者と呼ぶことができる。
我々は、このコストの浸透の重要性について、実証的な2つの論証を提示した。
論文 参考訳(メタデータ) (2024-07-15T07:53:29Z) - Impact of Decentralized Learning on Player Utilities in Stackelberg Games [57.08270857260131]
多くの2エージェントシステムでは、各エージェントは別々に学習し、2つのエージェントの報酬は完全に一致しない。
分散学習を用いたStackelbergゲームとしてこれらのシステムをモデル化し、標準後悔ベンチマークが少なくとも1人のプレイヤーにとって最悪の線形後悔をもたらすことを示す。
我々は,これらのベンチマークに関して,両プレイヤーにとってほぼ最適な$O(T2/3)を後悔するアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-02-29T23:38:28Z) - Coordinated Dynamic Bidding in Repeated Second-Price Auctions with
Budgets [17.937079224726073]
予算を伴う第2価格の繰り返しオークションにおける協調オンライン入札アルゴリズムについて検討した。
我々は、すべてのクライアントに対して、独立入札で得られる最高のものよりも高いユーティリティを保証するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-13T11:55:04Z) - Improving Language Model Negotiation with Self-Play and In-Context
Learning from AI Feedback [97.54519989641388]
交渉ゲームにおいて,複数大言語モデル(LLM)が,遊び,振り返り,批判によって自律的に互いに改善できるかどうかを検討する。
私たちが考慮している言語モデルのサブセットだけが、AIフィードバックから自己プレイし、取引価格を改善することができます。
論文 参考訳(メタデータ) (2023-05-17T11:55:32Z) - Autobidders with Budget and ROI Constraints: Efficiency, Regret, and Pacing Dynamics [53.62091043347035]
オンライン広告プラットフォームで競合するオートバイディングアルゴリズムのゲームについて検討する。
本稿では,全ての制約を満たすことを保証し,個人の後悔を解消する勾配に基づく学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-30T21:59:30Z) - No-regret Learning in Repeated First-Price Auctions with Budget
Constraints [5.834615090865286]
定常競争下での最適非予測戦略に対して,RLに基づく入札アルゴリズムを提案する。
提案アルゴリズムは,各ラウンドの最後にすべての入札が明らかになった場合,$widetilde O(sqrt T)$-regretを求める。
論文 参考訳(メタデータ) (2022-05-29T04:32:05Z) - Artificial Intelligence and Auction Design [0.0]
付加的なフィードバックを伴わないファーストプライスのオークションが,暗黙的な結果につながることが判明した。
この違いは, 単価の競売において, 競争相手を1つの入札インクリメントで圧倒するインセンティブによって引き起こされることを示す。
また、Googleが第1価格のオークションに切り替えたときに導入した最低入札に関する情報が、オークションの競争力を高めることも示している。
論文 参考訳(メタデータ) (2022-02-12T00:54:40Z) - Fast Rate Learning in Stochastic First Price Bidding [0.0]
ファーストプライスのオークションは、プログラム広告におけるビックレーのオークションに基づく伝統的な入札アプローチを大きく置き換えている。
対戦相手の最大入札分布が分かっている場合, 後悔度を著しく低くする方法を示す。
我々のアルゴリズムは、様々な入札分布の文献で提案されている選択肢よりもはるかに高速に収束する。
論文 参考訳(メタデータ) (2021-07-05T07:48:52Z) - Certifying Strategyproof Auction Networks [53.37051312298459]
我々は、任意の数のアイテムと参加者でオークションを表現できるRegretNetアーキテクチャに焦点を当てる。
本稿では,ニューラルネットワーク検証文献から得られた手法を用いて,特定の評価プロファイルの下で戦略の安全性を明示的に検証する方法を提案する。
論文 参考訳(メタデータ) (2020-06-15T20:22:48Z) - Dynamic Incentive-aware Learning: Robust Pricing in Contextual Auctions [13.234975857626752]
我々は、文脈的な第2価格オークションにおいて、戦略的買い手に対する準備価格の堅牢な学習の問題を考察する。
このような戦略的行動に頑健な学習方針を提案する。
論文 参考訳(メタデータ) (2020-02-25T19:00:29Z) - Adversarial Attacks on Linear Contextual Bandits [87.08004581867537]
悪意のあるエージェントは、望ましい行動を実行するためにバンディットアルゴリズムを攻撃するインセンティブを持つ可能性がある。
悪意のあるエージェントは、線形コンテキストのバンドイットアルゴリズムに任意のアーム$T - o(T)$倍を$T$ステップで引き出すように強制することができる。
また,悪意のあるエージェントが単一コンテキストにおける帯域幅アルゴリズムの動作に影響を与えることに関心がある場合についても検討する。
論文 参考訳(メタデータ) (2020-02-10T15:04:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。