論文の概要: Double Auctions with Two-sided Bandit Feedback
- arxiv url: http://arxiv.org/abs/2208.06536v2
- Date: Mon, 10 Jul 2023 04:50:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-11 22:46:36.047568
- Title: Double Auctions with Two-sided Bandit Feedback
- Title(参考訳): 両側帯域フィードバックを用いたダブルオークション
- Authors: Soumya Basu and Abishek Sankararaman
- Abstract要約: ダブルオークションは、複数の買い手と売り手の間の商品の分散移動を可能にする。
信頼関係に基づく入札を行い、参加者の間には「平均価格」が効率的な価格発見をもたらすことを示す。
本論文は,両面の市場において,両面から学習が必要な不確実な嗜好を持つ分散学習アルゴリズムを初めて提供するものである。
- 参考スコア(独自算出の注目度): 11.334374665364214
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Double Auction enables decentralized transfer of goods between multiple
buyers and sellers, thus underpinning functioning of many online marketplaces.
Buyers and sellers compete in these markets through bidding, but do not often
know their own valuation a-priori. As the allocation and pricing happens
through bids, the profitability of participants, hence sustainability of such
markets, depends crucially on learning respective valuations through repeated
interactions. We initiate the study of Double Auction markets under bandit
feedback on both buyers' and sellers' side. We show with confidence bound based
bidding, and `Average Pricing' there is an efficient price discovery among the
participants. In particular, the regret on combined valuation of the buyers and
the sellers -- a.k.a. the social regret -- is $O(\log(T)/\Delta)$ in $T$
rounds, where $\Delta$ is the minimum price gap. Moreover, the buyers and
sellers exchanging goods attain $O(\sqrt{T})$ regret, individually. The buyers
and sellers who do not benefit from exchange in turn only experience
$O(\log{T}/ \Delta)$ regret individually in $T$ rounds. We augment our upper
bound by showing that $\omega(\sqrt{T})$ individual regret, and
$\omega(\log{T})$ social regret is unattainable in certain Double Auction
markets. Our paper is the first to provide decentralized learning algorithms in
a two-sided market where \emph{both sides have uncertain preference} that need
to be learned.
- Abstract(参考訳): 二重オークションは、複数の買い手と売り手の間の商品の分散移動を可能にし、多くのオンラインマーケットプレイスの機能を支える。
買い手と売り手は入札を通じてこれらの市場で競い合っているが、しばしば自身のバリュエーションa-prioriを知らない。
入札を通じて割り当てと価格設定が行われるため、参加者の収益性、すなわちそのような市場の持続性は、反復的な相互作用を通じてそれぞれの評価を習得することに大きく依存する。
我々は、買い手側と売り手の双方からの盗聴フィードバックの下で、ダブルオークション市場の研究を開始する。
参加者の間では,'平均価格'が効率的な価格発見の機会があることを確信して示します。
特に、買い手と売り手(つまり社会的な後悔)の合併に対する後悔は、$O(\log(T)/\Delta)$ in $T$のラウンドであり、$\Delta$は最小の価格差である。
さらに、商品を交換する買い手や売り手は、個別に$o(\sqrt{t})$ regretを得る。
交換の恩恵を受けない買い手や売り手は、個別に$T$ラウンドで後悔する$O(\log{T}/ \Delta)しか経験しない。
我々は、$\omega(\sqrt{T})$個人的後悔、$\omega(\log{T})$社会的後悔は、ある種のダブルオークション市場では達成不可能であることを示すことによって、上限を拡大する。
本稿は,両側が不確定な選好を持つ双方向市場において,学習が必要な分散学習アルゴリズムを初めて提供する。
関連論文リスト
- Market Making without Regret [15.588799679661637]
市場メーカが入札価格のB_t$と要求価格のA_t$を、入ってくるトレーダーに提示する、シーケンシャルな意思決定設定について検討する。
トレーダーのバリュエーションが入札価格よりも低い場合、または要求価格より高い場合は、取引(販売または購入)が発生する。
我々は、入札とペアの最良の選択に関して、メーカの後悔を特徴づける。
論文 参考訳(メタデータ) (2024-11-21T10:13:55Z) - Fair Online Bilateral Trade [20.243000364933472]
各取引が終わった後、プラットフォームは各トレーダーが現在の価格を受け入れたかどうかのみを学習するときに、取引から公平に利益を得るための後悔の完全な特徴を提示する。
それぞれのインタラクションの後に、プラットフォームが真のトレーダーのバリュエーションを観察できることを許す。
論文 参考訳(メタデータ) (2024-05-22T18:49:11Z) - An Online Learning Theory of Brokerage [3.8059763597999012]
オンライン学習の観点からトレーダー間のブローカーについて検討する。
既に研究されている他の二国間貿易問題とは異なり、指定された買い手や売り手の役割が存在しない場合に焦点を当てる。
第1の場合、最適率は$sqrtT$に低下し、第2の場合、問題は解けなくなる。
論文 参考訳(メタデータ) (2023-10-18T17:01:32Z) - Identifying key players in dark web marketplaces [58.720142291102135]
この論文は、暗黒市場に関連するBitcoin取引ネットワークのキープレーヤーを特定することを目的としている。
取引量の大部分は、エリート市場参加者の小さなグループに集中していることを示す。
ダークウェブのマーケットプレースにおけるキープレーヤーの行動を理解することは、違法行為を効果的に破壊するために重要であることを示唆している。
論文 参考訳(メタデータ) (2023-06-15T20:30:43Z) - Improving Language Model Negotiation with Self-Play and In-Context
Learning from AI Feedback [97.54519989641388]
交渉ゲームにおいて,複数大言語モデル(LLM)が,遊び,振り返り,批判によって自律的に互いに改善できるかどうかを検討する。
私たちが考慮している言語モデルのサブセットだけが、AIフィードバックから自己プレイし、取引価格を改善することができます。
論文 参考訳(メタデータ) (2023-05-17T11:55:32Z) - Repeated Bilateral Trade Against a Smoothed Adversary [5.939280057673226]
我々は、アダプティブ$sigma$-smooth敵が売り手と買い手のバリュエーションを生成する二国間取引について検討する。
本研究では、異なるフィードバックモデルの下での固定価格機構に対する後悔状態の完全な特徴付けを行う。
論文 参考訳(メタデータ) (2023-02-21T16:30:10Z) - Uniswap Liquidity Provision: An Online Learning Approach [49.145538162253594]
分散取引所(DEX)は、テクノロジーを活用した新しいタイプのマーケットプレイスである。
そのようなDECの1つ、Unixwap v3は、流動性プロバイダが資金のアクティブな価格間隔を指定することで、より効率的に資金を割り当てることを可能にする。
これにより、価格間隔を選択するための最適な戦略を見出すことが問題となる。
我々は、この問題を非確率的な報酬を伴うオンライン学習問題として定式化する。
論文 参考訳(メタデータ) (2023-02-01T17:21:40Z) - Autobidders with Budget and ROI Constraints: Efficiency, Regret, and Pacing Dynamics [53.62091043347035]
オンライン広告プラットフォームで競合するオートバイディングアルゴリズムのゲームについて検討する。
本稿では,全ての制約を満たすことを保証し,個人の後悔を解消する勾配に基づく学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-30T21:59:30Z) - A Reinforcement Learning Approach in Multi-Phase Second-Price Auction
Design [158.0041488194202]
多相第2価格オークションにおけるリザーブ価格の最適化について検討する。
売り手の視点からは、潜在的に非現実的な入札者の存在下で、環境を効率的に探索する必要がある。
第三に、売り手のステップごとの収益は未知であり、非線形であり、環境から直接観察することさえできない。
論文 参考訳(メタデータ) (2022-10-19T03:49:05Z) - Bilateral Trade: A Regret Minimization Perspective [5.031063690574698]
我々は、この二国間貿易問題を、売り手/買い手の相互作用のラウンドでT$以上の最小化フレームワークに配置した。
我々の主な貢献は、異なるフィードバックモデルとプライベートバリュエーションを持つ固定価格機構に対する後悔の体制の完全な評価である。
論文 参考訳(メタデータ) (2021-09-08T22:11:48Z) - Bandit Learning in Decentralized Matching Markets [82.39061186055775]
私たちは、一方の市場(プレーヤー)が他方の側(腕)の好みについて事前知識を持っていない両面マッチング市場を研究し、経験からその好みを学ぶ必要があります。
このモデルは、標準のマルチアームバンディットフレームワークを競合する分散型マルチプレイヤー設定に拡張します。
アームの選好が共有されるたびにアルゴリズムがインセンティブ互換であることが示されるが、選好が完全に一般的である場合には必ずしもそうではない。
論文 参考訳(メタデータ) (2020-12-14T08:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。