Fugu-MT 論文翻訳(概要): An $\alpha$-regret analysis of Adversarial Bilateral Trade

論文の概要: An $\alpha$-regret analysis of Adversarial Bilateral Trade

arxiv url: http://arxiv.org/abs/2210.06846v1
Date: Thu, 13 Oct 2022 08:57:30 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-14 17:54:31.268839
Title: An $\alpha$-regret analysis of Adversarial Bilateral Trade
Title（参考訳）: 対向貿易における$\alpha$-regret分析
Authors: Yossi Azar, Amos Fiat, Federico Fusco
Abstract要約: 我々は、売り手と買い手のバリュエーションが完全に任意であるシーケンシャルな二国間取引を調査する。我々は、社会福祉よりも近づきにくい貿易からの利益を考えます。
参考スコア（独自算出の注目度）: 4.244584441909098
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We study sequential bilateral trade where sellers and buyers valuations are completely arbitrary (i.e., determined by an adversary). Sellers and buyers are strategic agents with private valuations for the good and the goal is to design a mechanism that maximizes efficiency (or gain from trade) while being incentive compatible, individually rational and budget balanced. In this paper we consider gain from trade which is harder to approximate than social welfare. We consider a variety of feedback scenarios and distinguish the cases where the mechanism posts one price and when it can post different prices for buyer and seller. We show several surprising results about the separation between the different scenarios. In particular we show that (a) it is impossible to achieve sublinear $\alpha$-regret for any $\alpha<2$, (b) but with full feedback sublinear $2$-regret is achievable (c) with a single price and partial feedback one cannot get sublinear $\alpha$ regret for any constant $\alpha$ (d) nevertheless, posting two prices even with one-bit feedback achieves sublinear $2$-regret, and (e) there is a provable separation in the $2$-regret bounds between full and partial feedback.
Abstract（参考訳）: 我々は、売り手と買い手の評価が完全に任意である(すなわち、敵によって決定される)連続的な二国間貿易を研究する。売り手と買い手は、利益のためにプライベートなバリュエーションを持つ戦略的エージェントであり、目的は、インセンティブ互換で個別に合理的で予算バランスのとれた、効率を最大化(または取引から得る)するメカニズムを設計することである。本稿では,社会福祉よりも近似が難しい貿易からの利益を考える。我々は、様々なフィードバックシナリオを検討し、メカニズムが1つの価格を掲示し、買い手と売り手に異なる価格を掲示できる場合を区別する。異なるシナリオの分離について、いくつかの驚くべき結果を示す。特に私たちが示すのは (a)任意の$\alpha<2$に対してsublinear $\alpha$-regretを達成することは不可能である。 (b)しかし、全フィードバックのサブリニアで$$$-regretは実現可能 (c) 1 つの価格と部分的なフィードバックで、任意の定数 $\alpha$ に対して sublinear $\alpha$ regret を得ることはできない。 (d)それでも、1ビットフィードバックでも2つの価格を投稿すると2ドル以下になる。 (e)完全フィードバックと部分フィードバックの間には、$$-regret境界で証明可能な分離がある。

関連論文リスト

Contextual Online Bilateral Trade [18.8734045754182]
我々は、貿易と利益の2つの目的について研究する。我々は、取引の利益のために$O(dlog d)$後悔するアルゴリズムを設計し、利益のために$O(dlog T + dlog d)$後悔するアルゴリズムを設計する。
論文参考訳（メタデータ） (2026-02-13T13:03:10Z)
Online Fair Division for Personalized $2$-Value Instances [51.278096593080456]
オンラインフェアディビジョン(オンラインフェアディビジョン)では,商品が一度に1つずつ到着し,定額のエージェントが配置されている。善が現れると、各エージェントの持つ値が明らかになり、エージェントの1つに即時かつ不可逆的に割り当てられなければならない。我々は、よく知られた公平性の概念に関して、最悪の場合の保証を得る方法を示す。
論文参考訳（メタデータ） (2025-05-28T09:48:16Z)
Near-optimal Regret Using Policy Optimization in Online MDPs with Aggregate Bandit Feedback [49.84060509296641]
オンライン有限水平マルコフ決定過程を逆向きに変化した損失と総括的帯域幅フィードバック(フルバンド幅)を用いて研究する。この種のフィードバックの下では、エージェントは、軌跡内の各中間段階における個々の損失よりも、軌跡全体に生じる総損失のみを観察する。この設定のための最初のポリシー最適化アルゴリズムを紹介します。
論文参考訳（メタデータ） (2025-02-06T12:03:24Z)
Reinforcement Learning with Segment Feedback [56.54271464134885]
状態ごとの反応フィードバックと軌道フィードバックのギャップを埋める一般的なパラダイムを提供するRLというモデルを考える。バイナリフィードバックの下では、$m$のセグメント数の増加は指数率で後悔を減少させるが、驚くべきことに、和フィードバックの下では、$m$の増加は後悔を著しく減少させるものではない。
論文参考訳（メタデータ） (2025-02-03T23:08:42Z)
Market Making without Regret [15.588799679661637]
市場メーカが入札価格のB_t$と要求価格のA_t$を、入ってくるトレーダーに提示する、シーケンシャルな意思決定設定について検討する。トレーダーのバリュエーションが入札価格よりも低い場合、または要求価格より高い場合は、取引(販売または購入)が発生する。我々は、入札とペアの最良の選択に関して、メーカの後悔を特徴づける。
論文参考訳（メタデータ） (2024-11-21T10:13:55Z)
Mind the Gap: A Causal Perspective on Bias Amplification in Prediction & Decision-Making [58.06306331390586]
本稿では,閾値演算による予測値がS$変化の程度を測るマージン補数の概念を導入する。適切な因果仮定の下では、予測スコア$S$に対する$X$の影響は、真の結果$Y$に対する$X$の影響に等しいことを示す。
論文参考訳（メタデータ） (2024-05-24T11:22:19Z)
Nearly Optimal Algorithms for Contextual Dueling Bandits from Adversarial Feedback [58.66941279460248]
人からのフィードバックから学ぶことは、大言語モデル(LLM)のような生成モデルを調整する上で重要な役割を果たす本稿では,本問題の領域内モデルについて考察する。-文脈的デュエルバンディットと敵対的フィードバックを併用し,真の嗜好ラベルを敵によって反転させることができる。本稿では,不確実性重み付き最大推定に基づく頑健なコンテキストデュエルバンドイット(アルゴ)を提案する。
論文参考訳（メタデータ） (2024-04-16T17:59:55Z)
An Online Learning Theory of Brokerage [3.8059763597999012]
オンライン学習の観点からトレーダー間のブローカーについて検討する。既に研究されている他の二国間貿易問題とは異なり、指定された買い手や売り手の役割が存在しない場合に焦点を当てる。第1の場合、最適率は$sqrtT$に低下し、第2の場合、問題は解けなくなる。
論文参考訳（メタデータ） (2023-10-18T17:01:32Z)
Repeated Bilateral Trade Against a Smoothed Adversary [5.939280057673226]
我々は、アダプティブ$sigma$-smooth敵が売り手と買い手のバリュエーションを生成する二国間取引について検討する。本研究では、異なるフィードバックモデルの下での固定価格機構に対する後悔状態の完全な特徴付けを行う。
論文参考訳（メタデータ） (2023-02-21T16:30:10Z)
Autobidders with Budget and ROI Constraints: Efficiency, Regret, and Pacing Dynamics [53.62091043347035]
オンライン広告プラットフォームで競合するオートバイディングアルゴリズムのゲームについて検討する。本稿では,全ての制約を満たすことを保証し,個人の後悔を解消する勾配に基づく学習アルゴリズムを提案する。
論文参考訳（メタデータ） (2023-01-30T21:59:30Z)
A Reinforcement Learning Approach in Multi-Phase Second-Price Auction Design [158.0041488194202]
多相第2価格オークションにおけるリザーブ価格の最適化について検討する。売り手の視点からは、潜在的に非現実的な入札者の存在下で、環境を効率的に探索する必要がある。第三に、売り手のステップごとの収益は未知であり、非線形であり、環境から直接観察することさえできない。
論文参考訳（メタデータ） (2022-10-19T03:49:05Z)
Minimax-Optimal Multi-Agent RL in Zero-Sum Markov Games With a Generative Model [50.38446482252857]
2人プレイのゼロサムマルコフゲームは多エージェント強化学習においておそらく最も基本的な設定である。我々は,$$ widetildeObiggを用いて,$varepsilon$-approximate Markov NEポリシーを学習する学習アルゴリズムを開発した。我々は、分散型量の役割を明確にするFTRLに対する洗練された後悔境界を導出する。
論文参考訳（メタデータ） (2022-08-22T17:24:55Z)
Bilateral Trade: A Regret Minimization Perspective [5.031063690574698]
我々は、この二国間貿易問題を、売り手/買い手の相互作用のラウンドでT$以上の最小化フレームワークに配置した。我々の主な貢献は、異なるフィードバックモデルとプライベートバリュエーションを持つ固定価格機構に対する後悔の体制の完全な評価である。
論文参考訳（メタデータ） (2021-09-08T22:11:48Z)
A Regret Analysis of Bilateral Trade [5.031063690574698]
我々は、売り手/買い手の相互作用のラウンド上の後悔最小化フレームワークに二国間貿易問題で初めてキャストしました。私達の主な貢献は異なったモデルのフィードバックおよび私用評価の固定価格のメカニズムのための後悔の体制の完全な特徴付けです。
論文参考訳（メタデータ） (2021-02-16T08:53:17Z)
Dropout as a Regularizer of Interaction Effects [76.84531978621143]
ドロップアウトは高次相互作用に対する正則化器である。我々はこの視点を分析的かつ実証的に証明する。また、高次相互作用に対して同じ選択的な圧力を得ることも困難である。
論文参考訳（メタデータ） (2020-07-02T01:11:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。