論文の概要: Bilateral Trade: A Regret Minimization Perspective
- arxiv url: http://arxiv.org/abs/2109.12974v1
- Date: Wed, 8 Sep 2021 22:11:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-10 16:12:14.114106
- Title: Bilateral Trade: A Regret Minimization Perspective
- Title(参考訳): バイラテラル取引:レグレット最小化の視点
- Authors: Nicol\`o Cesa-Bianchi, Tommaso Cesari, Roberto Colomboni, Federico
Fusco, Stefano Leonardi
- Abstract要約: 我々は、この二国間貿易問題を、売り手/買い手の相互作用のラウンドでT$以上の最小化フレームワークに配置した。
我々の主な貢献は、異なるフィードバックモデルとプライベートバリュエーションを持つ固定価格機構に対する後悔の体制の完全な評価である。
- 参考スコア(独自算出の注目度): 5.031063690574698
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bilateral trade, a fundamental topic in economics, models the problem of
intermediating between two strategic agents, a seller and a buyer, willing to
trade a good for which they hold private valuations. In this paper, we cast the
bilateral trade problem in a regret minimization framework over $T$ rounds of
seller/buyer interactions, with no prior knowledge on their private valuations.
Our main contribution is a complete characterization of the regret regimes for
fixed-price mechanisms with different feedback models and private valuations,
using as a benchmark the best fixed-price in hindsight. More precisely, we
prove the following tight bounds on the regret:
- $\Theta(\sqrt{T})$ for full-feedback (i.e., direct revelation mechanisms).
- $\Theta(T^{2/3})$ for realistic feedback (i.e., posted-price mechanisms)
and independent seller/buyer valuations with bounded densities.
- $\Theta(T)$ for realistic feedback and seller/buyer valuations with bounded
densities.
- $\Theta(T)$ for realistic feedback and independent seller/buyer valuations.
- $\Theta(T)$ for the adversarial setting.
- Abstract(参考訳): 経済の基本的なトピックであるバイラテラル取引は、売り手と買い手という2つの戦略的エージェントの仲介の問題をモデル化する。
本稿では,2国間貿易問題を,売り手/買い手の相互作用のラウンドT$以上の最小化枠組みに配置し,その個人価値について事前の知識を欠いた。
我々の主な貢献は、異なるフィードバックモデルとプライベートバリュエーションを持つ固定価格メカニズムに対する後悔の体制の完全な評価である。
より正確には、以下の後悔の厳密な境界を証明する: - $\theta(\sqrt{t})$ for full-feedback (すなわち直接啓示メカニズム)。
-$\theta(t^{2/3})$ 現実的なフィードバック(すなわち、ポストプライスメカニズム)と、境界密度を持つ独立売り手/買い手評価。
-$\theta(t)$ 有界密度を持つ現実的なフィードバックと売り手/買い手の評価のために。
-$\theta(t)$ 現実的なフィードバックと独立した売り手/買い手の評価のために。
-$\theta(t)$ である。
関連論文リスト
- Fair Online Bilateral Trade [20.243000364933472]
各取引が終わった後、プラットフォームは各トレーダーが現在の価格を受け入れたかどうかのみを学習するときに、取引から公平に利益を得るための後悔の完全な特徴を提示する。
それぞれのインタラクションの後に、プラットフォームが真のトレーダーのバリュエーションを観察できることを許す。
論文 参考訳(メタデータ) (2024-05-22T18:49:11Z) - Nearly Optimal Algorithms for Contextual Dueling Bandits from Adversarial Feedback [58.66941279460248]
人からのフィードバックから学ぶことは、大言語モデル(LLM)のような生成モデルを調整する上で重要な役割を果たす
本稿では,本問題の領域内モデルについて考察する。-文脈的デュエルバンディットと敵対的フィードバックを併用し,真の嗜好ラベルを敵によって反転させることができる。
本稿では,不確実性重み付き最大推定に基づく頑健なコンテキストデュエルバンドイット(アルゴ)を提案する。
論文 参考訳(メタデータ) (2024-04-16T17:59:55Z) - Contextual Dynamic Pricing with Strategic Buyers [93.97401997137564]
戦略的買い手によるコンテキスト動的価格問題について検討する。
売り手は買い手の真の特徴を観察せず、買い手の戦略行動に応じて操作された特徴を観察する。
本稿では,販売者の累積収益を最大化するために,購入者の戦略的行動をオンライン学習に取り入れた戦略的動的価格政策を提案する。
論文 参考訳(メタデータ) (2023-07-08T23:06:42Z) - Improving Language Model Negotiation with Self-Play and In-Context
Learning from AI Feedback [97.54519989641388]
交渉ゲームにおいて,複数大言語モデル(LLM)が,遊び,振り返り,批判によって自律的に互いに改善できるかどうかを検討する。
私たちが考慮している言語モデルのサブセットだけが、AIフィードバックから自己プレイし、取引価格を改善することができます。
論文 参考訳(メタデータ) (2023-05-17T11:55:32Z) - Borda Regret Minimization for Generalized Linear Dueling Bandits [65.09919504862496]
本稿では,ボルダスコアが最も高い項目を識別することを目的とした,デュエルバンディットに対するボルダ後悔最小化問題について検討する。
本稿では,多くの既存モデルをカバーする一般化線形デュエルバンドモデルのリッチクラスを提案する。
我々のアルゴリズムは$tildeO(d2/3 T2/3)$ regretを達成し、これも最適である。
論文 参考訳(メタデータ) (2023-03-15T17:59:27Z) - Repeated Bilateral Trade Against a Smoothed Adversary [5.939280057673226]
我々は、アダプティブ$sigma$-smooth敵が売り手と買い手のバリュエーションを生成する二国間取引について検討する。
本研究では、異なるフィードバックモデルの下での固定価格機構に対する後悔状態の完全な特徴付けを行う。
論文 参考訳(メタデータ) (2023-02-21T16:30:10Z) - A Reinforcement Learning Approach in Multi-Phase Second-Price Auction
Design [158.0041488194202]
多相第2価格オークションにおけるリザーブ価格の最適化について検討する。
売り手の視点からは、潜在的に非現実的な入札者の存在下で、環境を効率的に探索する必要がある。
第三に、売り手のステップごとの収益は未知であり、非線形であり、環境から直接観察することさえできない。
論文 参考訳(メタデータ) (2022-10-19T03:49:05Z) - An $α$-regret analysis of Adversarial Bilateral Trade [10.275531964940425]
我々は、売り手と買い手のバリュエーションが完全に任意であるシーケンシャルな二国間取引を調査する。
我々は、社会福祉よりも近づきにくい貿易からの利益を考えます。
論文 参考訳(メタデータ) (2022-10-13T08:57:30Z) - Double Auctions with Two-sided Bandit Feedback [11.334374665364214]
ダブルオークションは、複数の買い手と売り手の間の商品の分散移動を可能にする。
信頼関係に基づく入札を行い、参加者の間には「平均価格」が効率的な価格発見をもたらすことを示す。
本論文は,両面の市場において,両面から学習が必要な不確実な嗜好を持つ分散学習アルゴリズムを初めて提供するものである。
論文 参考訳(メタデータ) (2022-08-13T01:03:34Z) - A Regret Analysis of Bilateral Trade [5.031063690574698]
我々は、売り手/買い手の相互作用のラウンド上の後悔最小化フレームワークに二国間貿易問題で初めてキャストしました。
私達の主な貢献は異なったモデルのフィードバックおよび私用評価の固定価格のメカニズムのための後悔の体制の完全な特徴付けです。
論文 参考訳(メタデータ) (2021-02-16T08:53:17Z) - Adversarial Dueling Bandits [85.14061196945599]
本稿では,反逆デュエルバンドにおける後悔の問題を紹介する。
学習者は、繰り返し一対のアイテムを選択し、このペアに対する相対的な二項利得フィードバックのみを観察しなければならない。
我々の主な成果は、EmphBorda-winnerの1組の$K$アイテムと比較して、T$ラウンド後悔するアルゴリズムです。
論文 参考訳(メタデータ) (2020-10-27T19:09:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。