論文の概要: Tight Regret Bounds for Bilateral Trade under Semi Feedback
- arxiv url: http://arxiv.org/abs/2601.16412v1
- Date: Fri, 23 Jan 2026 02:58:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-26 14:27:27.516862
- Title: Tight Regret Bounds for Bilateral Trade under Semi Feedback
- Title(参考訳): トワイト・レグレト・バウンド、バイラテラル取引へ-半フィードバックで
- Authors: Yaonan Jin,
- Abstract要約: この機構は、[CJLZ25] から[CJLZ25] までの$(T2 / 3)$$のバウンドをポリ対数因子にマッチさせる。
- 参考スコア(独自算出の注目度): 0.805458491503507
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The study of \textit{regret minimization in fixed-price bilateral trade} has received considerable attention in recent research. Previous works [CCC+24a, CCC+24b, AFF24, BCCF24, CJLZ25, LCM25a, GDFS25] have acquired a thorough understanding of the problem, except for determining the tight regret bound for GBB semi-feedback fixed-price mechanisms under adversarial values. In this paper, we resolve this open question by devising an $\widetilde{O}(T^{2 / 3})$-regret mechanism, matching the $Ω(T^{2 / 3})$ lower bound from [CJLZ25] up to polylogarithmic factors.
- Abstract(参考訳): 固定価格二国間貿易における「textit{regret minimization」の研究は近年大きな注目を集めている。
従来の研究(CCC+24a, CCC+24b, AFF24, BCCF24, CJLZ25, LCM25a, GDFS25)は, GBB半フィードバック固定価格機構の逆値による厳密な後悔境界を決定する以外は, この問題の完全な理解を得た。
本稿では、[CJLZ25] から [CJLZ25] への下界の $Ω(T^{2 / 3})$-regret 機構をポリ対数因子に整合させて、この開問題を解決する。
関連論文リスト
- Phase Transition for Stochastic Block Model with more than $\sqrt{n}$ Communities (II) [51.320599504997745]
コミュニティの$K$が$sqrtn$より小さい場合、Kesten-Stigumしきい値を超えれば、非自明なコミュニティリカバリが可能になる。
また、適度にスパースな設定では、最適なアルゴリズムがスペクトル法と根本的に異なることを示す。
論文 参考訳(メタデータ) (2025-11-26T15:54:17Z) - Tight Regret Bounds for Fixed-Price Bilateral Trade [9.12082890580808]
両貿易における固定価格機構について, 後悔最小化レンズを用いて検討した。
独立値の場合、$widetildeTheta(T2/3)$ tight bound for $textsfGlobal Budget Balance$ fixed-price mechanism with two-bit/one-bit feedback。
相関値/逆値の場合、$Omega(T3/4)$ lower bound for $textsfGlobal Budget Balance$ fixed-price mechanism with two-bit/one-bit feedback。
論文 参考訳(メタデータ) (2025-04-06T03:56:42Z) - Barriers to Welfare Maximization with No-Regret Learning [68.66209476382213]
我々は、ほぼ最適の$T$-sparse CCEの計算限界を低く証明する。
特に,最大傾斜角の不適応性は,時間内に非自明な間隔を達成できないことを示す。
論文 参考訳(メタデータ) (2024-11-04T00:34:56Z) - An $α$-regret analysis of Adversarial Bilateral Trade [10.275531964940425]
我々は、売り手と買い手のバリュエーションが完全に任意であるシーケンシャルな二国間取引を調査する。
我々は、社会福祉よりも近づきにくい貿易からの利益を考えます。
論文 参考訳(メタデータ) (2022-10-13T08:57:30Z) - Near-Optimal $\Phi$-Regret Learning in Extensive-Form Games [85.78272987312343]
我々は、効率よく非結合な学習力学を確立し、各プレイヤーのトリガー後悔は、プレイの繰り返しの後に$O(log T)$として成長する。
これにより、これまでよく知られていた$O(T1/4)$よりも指数関数的に改善される。
論文 参考訳(メタデータ) (2022-08-20T20:48:58Z) - First-Order Regret in Reinforcement Learning with Linear Function
Approximation: A Robust Estimation Approach [57.570201404222935]
我々は,大規模状態空間を用いた強化学習において,$mathcalO(sqrtV_1star K)$として,後悔のスケーリングが得られることを示す。
この結果を得るためには,少なくとも2乗推定に基づく既存手法は不十分であることを示す。
論文 参考訳(メタデータ) (2021-12-07T00:29:57Z) - A Regret Analysis of Bilateral Trade [5.031063690574698]
我々は、売り手/買い手の相互作用のラウンド上の後悔最小化フレームワークに二国間貿易問題で初めてキャストしました。
私達の主な貢献は異なったモデルのフィードバックおよび私用評価の固定価格のメカニズムのための後悔の体制の完全な特徴付けです。
論文 参考訳(メタデータ) (2021-02-16T08:53:17Z) - Upper Confidence Primal-Dual Reinforcement Learning for CMDP with
Adversarial Loss [145.54544979467872]
マルコフ決定過程(CMDP)に対するオンライン学習の検討
本稿では,遷移モデルから標本化した軌跡のみを必要とする,新しいEmphupper confidence primal-dualアルゴリズムを提案する。
我々の分析では、ラグランジュ乗算過程の新たな高確率ドリフト解析を、高信頼強化学習の記念後悔解析に組み入れている。
論文 参考訳(メタデータ) (2020-03-02T05:02:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。