論文の概要: Optimal Online Bookmaking for Binary Games
- arxiv url: http://arxiv.org/abs/2501.06923v1
- Date: Sun, 12 Jan 2025 20:23:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-14 14:20:24.403313
- Title: Optimal Online Bookmaking for Binary Games
- Title(参考訳): バイナリゲームのための最適オンラインブックメイキング
- Authors: Alankrita Bhatt, Or Ordentlich, Oron Sabag,
- Abstract要約: 最悪の場合のリターンを最大化することを目的として,本作成の問題について検討する。
我々はこの問題をemph Optimal Online Bookmakingゲームとして定式化し、バイナリケースの正確な解決策を提供する。
- 参考スコア(独自算出の注目度): 19.70394327203169
- License:
- Abstract: In online betting, the bookmaker can update the payoffs it offers on a particular event many times before the event takes place, and the updated payoffs may depend on the bets accumulated thus far. We study the problem of bookmaking with the goal of maximizing the return in the worst-case, with respect to the gamblers' behavior and the event's outcome. We formalize this problem as the \emph{Optimal Online Bookmaking game}, and provide the exact solution for the binary case. To this end, we develop the optimal bookmaking strategy, which relies on a new technique called bi-balancing trees, that assures that the house loss is the same for all \emph{decisive} betting sequences, where the gambler bets all its money on a single outcome in each round.
- Abstract(参考訳): オンラインの賭けでは、書店はイベントが行われる前に特定のイベントの支払いを何回も更新でき、更新された支払いはこれまでに蓄積された賭けに依存する可能性がある。
本研究は, ギャンブラーの行動とイベントの結果に関して, 最悪の場合におけるリターンの最大化を目標として, 製本問題について検討する。
この問題を \emph{Optimal Online Bookmaking Game} として定式化し、バイナリケースの正確な解を提供する。
この目的のために,両バランス木と呼ばれる新しい手法を取り入れた最適製本戦略を開発し,各ラウンドにおいて,ギャンブラーが全資金を賭ける,すべての「emph{decisive}」ベッティングシーケンスに対して,家計損失が同じであることを保証した。
関連論文リスト
- Autobidders with Budget and ROI Constraints: Efficiency, Regret, and Pacing Dynamics [53.62091043347035]
オンライン広告プラットフォームで競合するオートバイディングアルゴリズムのゲームについて検討する。
本稿では,全ての制約を満たすことを保証し,個人の後悔を解消する勾配に基づく学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-30T21:59:30Z) - Online Optimization with Untrusted Predictions [7.895232155155041]
本稿では, オンライン最適化の課題について検討し, 意思決定者は, ラウンドごと, 非競争的打撃コスト, ラウンド間切替コストの合計に対して, 一般的な計量空間内の点を選択する必要がある。
本稿では,新しいアルゴリズムであるAdaptive Online Switching (AOS)を提案し,予測が完全であれば$tildecalO(alphadelta)$が不正確であっても$tildecalO(alphadelta)$であることを示す。
論文 参考訳(メタデータ) (2022-02-07T21:08:02Z) - No-Regret Learning in Time-Varying Zero-Sum Games [99.86860277006318]
固定ゼロサムゲームにおける繰り返しプレイからの学習は、ゲーム理論とオンライン学習における古典的な問題である。
提案手法は,3つの性能基準の下で,良好な保証を同時に享受できる1つのパラメータフリーアルゴリズムである。
本アルゴリズムは,ある特性を満たすブラックボックスベースラーナー群に対するメタアルゴリズムを用いた2層構造に基づく。
論文 参考訳(メタデータ) (2022-01-30T06:10:04Z) - Bandit Linear Optimization for Sequential Decision Making and
Extensive-Form Games [102.23975166536326]
tree-form sequential decision making (tfsdm) は、エージェントと潜在的に敵対的な環境の間のツリー形式の相互作用をモデル化することで、古典的なワンショット意思決定を拡張する。
これは、各プレイヤーが幅広い形式のゲームで直面するオンライン意思決定問題、およびマルコフ決定プロセス、およびエージェントが観測された履歴を条件とする部分観察可能なマルコフ決定プロセスをキャプチャする。
本稿では, (i) 線形時間損失と (ii) $o(sqrtt)$ cumulative regret の両方を提供する拡張dmのバンディット線形最適化問題に対する最初のアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-08T05:00:13Z) - Online Markov Decision Processes with Aggregate Bandit Feedback [74.85532145498742]
本稿では,オンライン有限水平マルコフ決定過程の新たな変種について検討する。
各エピソードにおいて、学習者は、エピソードの選択した方針によって実現された軌道に沿って蓄積された損失を被り、総括的盗聴フィードバックを観察する。
我々の主な結果は計算効率のよいアルゴリズムで、$O(sqrtK)$ regret for this set, where $K$ is the number of episodes。
論文 参考訳(メタデータ) (2021-01-31T16:49:07Z) - Online Prediction With History-Dependent Experts: The General Case [1.52292571922932]
本稿では,オンライン・機械学習の古典的な例である,オンライン・セッティングにおけるエキスパート・アドバイスによるバイナリ・シーケンスの予測問題について検討する。
我々は、バイナリシーケンスを株価の価格履歴と解釈し、予測器を投資家とみなし、その問題を株価予測問題に変換する。
論文 参考訳(メタデータ) (2020-07-31T19:40:20Z) - Accumulator Bet Selection Through Stochastic Diffusion Search [0.0]
アキュムレータ(英: accumulator)とは、複数の賭けを賭け子に組み合わせて、その部分の個々の確率の乗算によって与えられる合計の支払いを発生させる賭けである。
オンラインやオフラインのブックメーカーに簡単にアクセスできるようになると、アキュミュレータの賭けを行うために一組のマッチを選択するのが複雑になる。
そこで本研究では,最も期待できる組み合わせを選択する問題に対する二進最適化モデルを提案する。
論文 参考訳(メタデータ) (2020-04-18T12:42:23Z) - Optimal strategies in the Fighting Fantasy gaming system: influencing
stochastic dynamics by gambling with limited resource [0.0]
Fighting Fantasyは、世界で人気のあるレクリエーションファンタジーゲームシステムである。
各ラウンドでは、限られた資源(Luck')がギャンブルに費やされ、勝利の利益を増幅したり、損失から赤字を軽減したりすることができる。
我々は,システムに対するベルマン方程式の解法と,ゲーム中の任意の状態に対する最適な戦略を特定するために,後方帰納法を用いる。
論文 参考訳(メタデータ) (2020-02-24T11:31:25Z) - From Poincar\'e Recurrence to Convergence in Imperfect Information
Games: Finding Equilibrium via Regularization [49.368421783733815]
モノトーンゲームにおいて,報酬の適応が強い収束保証を与えることを示す。
また、この報酬適応手法を用いて、Nash平衡に正確に収束するアルゴリズムを構築する方法を示す。
論文 参考訳(メタデータ) (2020-02-19T21:36:58Z) - Learning Zero-Sum Simultaneous-Move Markov Games Using Function
Approximation and Correlated Equilibrium [116.56359444619441]
両プレイヤーのゼロサム有限ホライゾンマルコフゲームに対する効率の良い強化学習アルゴリズムを開発した。
オフライン環境では、両プレイヤーを制御し、双対性ギャップを最小化してナッシュ平衡を求める。
オンライン環境では、任意の相手と対戦する1人のプレイヤーを制御し、後悔を最小限に抑える。
論文 参考訳(メタデータ) (2020-02-17T17:04:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。