論文の概要: Feedback Control for Small Budget Pacing
- arxiv url: http://arxiv.org/abs/2509.25429v1
- Date: Mon, 29 Sep 2025 19:38:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 17:09:04.290982
- Title: Feedback Control for Small Budget Pacing
- Title(参考訳): 小予算舗装に対するフィードバック制御
- Authors: Sreeja Apparaju, Yichuan Niu, Xixi Qi,
- Abstract要約: 予算削減はオンライン広告において、ダイナミックオークションのキャンペーン目標に費用を合わせるために重要である。
本研究では,バケット化と比例フィードバックを組み合わせることで,安定かつ適応的な消費制御を実現する原理的制御器を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Budget pacing is critical in online advertising to align spend with campaign goals under dynamic auctions. Existing pacing methods often rely on ad-hoc parameter tuning, which can be unstable and inefficient. We propose a principled controller that combines bucketized hysteresis with proportional feedback to provide stable and adaptive spend control. Our method provides a framework and analysis for parameter selection that enables accurate tracking of desired spend rates across campaigns. Experiments in real-world auctions demonstrate significant improvements in pacing accuracy and delivery consistency, reducing pacing error by 13% and $\lambda$-volatility by 54% compared to baseline method. By bridging control theory with advertising systems, our approach offers a scalable and reliable solution for budget pacing, with particular benefits for small-budget campaigns.
- Abstract(参考訳): 予算削減はオンライン広告において、ダイナミックオークションのキャンペーン目標に費用を合わせるために重要である。
既存のペーシング法は、しばしばアドホックなパラメータチューニングに依存しており、不安定で非効率である。
本研究では,バケット化ヒステリシスと比例フィードバックを組み合わせることで,安定かつ適応的な消費制御を実現する原理的制御法を提案する。
提案手法は,パラメータ選択のためのフレームワークと分析を提供し,キャンペーン間での所望の消費率の正確な追跡を可能にする。
実世界のオークションでの実験では、ペーシング精度とデリバリ一貫性が大幅に向上し、ペーシングエラーを13%削減し、ベースラインメソッドと比較して$\lambda$-volatilityを54%削減した。
広告システムに制御理論を組み込むことで、予算削減のためのスケーラブルで信頼性の高いソリューションを提供する。
関連論文リスト
- Cost-aware Stopping for Bayesian Optimization [53.34052774820105]
本稿では,様々な評価コストに適応し,チューニングが不要なベイズ最適化のためのコスト対応停止則を提案する。
我々は,最先端の取得関数と組み合わせた場合,停止規則によって得られる期待累積評価コストを拘束する理論的な保証を証明した。
論文 参考訳(メタデータ) (2025-07-16T17:54:14Z) - ConfPO: Exploiting Policy Model Confidence for Critical Token Selection in Preference Optimization [48.50761200321113]
大型言語モデル(LLM)における嗜好学習手法ConfPOを紹介する。
補助モデルや計算を必要とせずに、トレーニングポリシの信頼性のみに基づいて、優先クリティカルトークンを特定し、最適化する。
AlpacaEval 2 や Arena-Hard などのアライメントベンチマークの実験結果は、ConfPO が一様DAA を一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-06-10T11:54:22Z) - The Traveling Bandit: A Framework for Bayesian Optimization with Movement Costs [2.75472885719388]
提案手法はBOの移動コストを理論的に保証する。
本手法は,従来のBO法に匹敵する遅延性能を維持しつつ,時間とともに平均移動コストを効果的に削減する。
このフレームワークはまた、移動コストを伴う様々な帯域設定で幅広い応用を約束する。
論文 参考訳(メタデータ) (2024-10-18T15:14:25Z) - A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。
各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。
実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文 参考訳(メタデータ) (2024-07-08T09:55:31Z) - Rate-Optimal Policy Optimization for Linear Markov Decision Processes [65.5958446762678]
最安値の$widetilde O (sqrt K)$ regret, $K$はエピソード数を表す。
我々の研究は、バンディットフィードバックのある設定において最適な収束率(w.r.t.$K$)を確立する最初のものである。
現在、最適なレート保証を持つアルゴリズムは知られていない。
論文 参考訳(メタデータ) (2023-08-28T15:16:09Z) - Self-Evaluation Guided Beam Search for Reasoning [61.523627290397556]
我々は,Large Language Model (LLM) の推論プロセスのガイドと校正を行うための段階的自己評価機構を導入する。
本稿では,ビームサーチによる自己評価ガイダンスを統合した復号アルゴリズムを提案する。
我々のアプローチは、GSM8K、AQuA、StrategyQAにおいて、対応するCodexバックボンドベースラインをわずかに精度6.34%、9.56%、および5.46%で上回る。
論文 参考訳(メタデータ) (2023-05-01T02:37:59Z) - Dynamic Budget Throttling in Repeated Second-Price Auctions [11.823210231891517]
スロットリングは人気のある選択であり、広告主の総支出を管理するために、オークションのサブセットだけを選択することで、広告主の総支出を管理する。
本稿では,2次価格の繰り返しオークションにおいて,単一の広告主の動的予算絞りプロセスの理論的パノラマを提供する。
本研究は, 競売におけるスロットリングの理論的研究のギャップを埋めるものであり, この一般的な予算平滑化戦略の能力を明らかにするものである。
論文 参考訳(メタデータ) (2022-07-11T08:12:02Z) - Off-policy Reinforcement Learning with Optimistic Exploration and
Distribution Correction [73.77593805292194]
我々は、政治以外のアクター批判的枠組みにおいて、批評家のほぼ上位信頼度を最大化するために、別の調査政策を訓練する。
最近導入されたDICEフレームワークを応用して、非政治アクター犯罪訓練のための分布補正比を学習する。
論文 参考訳(メタデータ) (2021-10-22T22:07:51Z) - Mid-flight Forecasting for CPA Lines in Online Advertising [6.766999405722559]
本稿では,飛行中におけるCPAラインの予測問題について検討する。
提案手法は,様々な性能指標と最適化信号の関係性を生成する。
広告主の支出と効果的なコスト・パー・アクション(eCPA)との関係も特徴である。
論文 参考訳(メタデータ) (2021-07-15T17:48:15Z) - Optimal Bidding Strategy without Exploration in Real-time Bidding [14.035270361462576]
予算制約によるユーティリティの最大化は、リアルタイム入札(RTB)システムにおける広告主の主要な目標である。
それまでの作品は、検閲された国家の困難を和らげるために競売に敗れたことを無視していた。
本稿では,リアルタイムトラフィックで観測される真の分布の挙動を模倣するために,最大エントロピー原理を用いた新しい実用的枠組みを提案する。
論文 参考訳(メタデータ) (2020-03-31T20:43:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。