論文の概要: Knowledge-informed Bidding with Dual-process Control for Online Advertising
- arxiv url: http://arxiv.org/abs/2603.04920v1
- Date: Thu, 05 Mar 2026 08:05:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-06 22:06:11.135187
- Title: Knowledge-informed Bidding with Dual-process Control for Online Advertising
- Title(参考訳): オンライン広告のためのデュアルプロセス制御による知識インフォームド・バイディング
- Authors: Huixiang Luo, Longyu Gao, Yaqi Liu, Qianqian Chen, Pingchun Huang, Tianning Li,
- Abstract要約: オンライン広告におけるバイアス最適化は、歴史的データから入札決定を学ぶブラックボックス機械学習モデルに依存している。
これらのアプローチは、人間の専門家の適応性、経験駆動、そして世界的な一貫性のある決定を再現することができない。
本稿では,提案手法であるKBD (Knowledge-informed Bidding with Dual-process Control)を提案する。
- 参考スコア(独自算出の注目度): 4.749687824280501
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Bid optimization in online advertising relies on black-box machine-learning models that learn bidding decisions from historical data. However, these approaches fail to replicate human experts' adaptive, experience-driven, and globally coherent decisions. Specifically, they generalize poorly in data-sparse cases because of missing structured knowledge, make short-sighted sequential decisions that ignore long-term interdependencies, and struggle to adapt in out-of-distribution scenarios where human experts succeed. To address this, we propose KBD (Knowledge-informed Bidding with Dual-process control), a novel method for bid optimization. KBD embeds human expertise as inductive biases through the informed machine-learning paradigm, uses Decision Transformer (DT) to globally optimize multi-step bidding sequences, and implements dual-process control by combining a fast rule-based PID (System 1) with DT (System 2). Extensive experiments highlight KBD's advantage over existing methods and underscore the benefit of grounding bid optimization in human expertise and dual-process control.
- Abstract(参考訳): オンライン広告におけるバイアス最適化は、歴史的データから入札決定を学ぶブラックボックス機械学習モデルに依存している。
しかし、これらのアプローチは、人間の専門家の適応性、経験駆動、そして世界的な一貫性のある決定を再現することができない。
具体的には、構造化された知識が欠如していること、長期的な相互依存を無視した短目なシーケンシャルな決定、そして人間の専門家が成功するアウト・オブ・ディストリビューションのシナリオへの適応に苦慮しているため、データスパースなケースでは不十分な一般化を行う。
そこで我々はKBD(Knowledge-informed Bidding with Dual-process Control)を提案する。
KBDは、インフォメーション機械学習のパラダイムを通じて、人間の専門知識を誘導バイアスとして組み込み、決定変換器(DT)を使用して、多段階入札シーケンスをグローバルに最適化し、高速なルールベースのPID(System 1)とDT(System 2)を組み合わせることで、デュアルプロセス制御を実装する。
大規模な実験では、KBDの既存の手法に対する優位性を強調し、人間の専門知識と二重プロセス制御における入札最適化の利点を浮き彫りにしている。
関連論文リスト
- Bi-Level Decision-Focused Causal Learning for Large-Scale Marketing Optimization: Bridging Observational and Experimental Data [31.002605911430052]
本稿では,Bi-DFCL(Bi-level Decision-Focused Causal Learning)を提案する。
実験データを用いてOR判定品質の偏りのない推定器を開発する。
Bi-DFCLは世界最大のオンラインフードデリバリープラットフォームであるMeituanで展開されている。
論文 参考訳(メタデータ) (2025-10-22T12:16:53Z) - MARS: Optimizing Dual-System Deep Research via Multi-Agent Reinforcement Learning [82.14973479594367]
複雑な推論タスクのための大規模言語モデル(LLM)は、直感的で意図的な認知プロセスを橋渡しする革新的なアプローチを必要とする。
本稿では,Multi-Agent System for Deep ReSearch (MARS)を提案する。
論文 参考訳(メタデータ) (2025-10-06T15:42:55Z) - EBaReT: Expert-guided Bag Reward Transformer for Auto Bidding [9.534587899746976]
我々は,自動入札をシーケンス決定問題として定式化する。
本稿では,データ品質と不確実性報酬に関する懸念に対処するため,エキスパート誘導型バグリワード変換器(EBaReT)を提案する。
提案手法は,最先端入札方式に比べて優れた性能を示す。
論文 参考訳(メタデータ) (2025-07-22T02:56:36Z) - Coverage-Constrained Human-AI Cooperation with Multiple Experts [20.05241240080433]
本稿では,CL2DC法(Coverage-Constrained Learning to Defer and Complement with Specific Experts)を提案する。
CL2DCは、AI予測単独または特定の専門家に延期または補完することで、最終的な決定を行う。
最先端のHAI-CC法に比べて優れた性能を発揮する。
論文 参考訳(メタデータ) (2024-11-18T19:06:01Z) - Dynamic Information Sub-Selection for Decision Support [5.063114309794011]
我々は,ブラックボックス意思決定者のパフォーマンス向上を目的とした,AI支援の新しいフレームワークであるDynamic Information Sub-Selection(DISS)を紹介する。
偏りのある意思決定支援、専門家の割り当て最適化、大規模言語モデル決定支援、解釈可能性など、DisdisSのいくつかの応用について検討する。
論文 参考訳(メタデータ) (2024-10-30T20:00:54Z) - A-FedPD: Aligning Dual-Drift is All Federated Primal-Dual Learning Needs [57.35402286842029]
本稿では,グローバルクライアントとローカルクライアントの仮想二重配向を構成する新しいアラインドデュアルデュアル(A-FedPD)手法を提案する。
本稿では,A-FedPD方式の非集中型セキュリティコンセンサスに対する効率を包括的に分析する。
論文 参考訳(メタデータ) (2024-09-27T17:00:32Z) - Knowledge Editing in Language Models via Adapted Direct Preference Optimization [50.616875565173274]
大きな言語モデル(LLM)は、時間とともに時代遅れになる可能性がある。
知識編集は、高価なリトレーニングを必要としないウェイトアップデートを使用して、この課題を克服することを目的としている。
論文 参考訳(メタデータ) (2024-06-14T11:02:21Z) - D2PO: Discriminator-Guided DPO with Response Evaluation Models [63.71853401569461]
学習を通して嗜好が収集されるオンライン環境において,識別器誘導型DPOであるD2POを提案する。
金の選好を収集する際、これらは政策の訓練だけでなく、銀ラベルによる政策訓練のためのさらに総合的なデータに対する差別的な反応評価モデルを訓練するために利用します。
DPOで政策を訓練し、従来のPPOを上回り、政策モデルから分離した差別者を維持することの恩恵を受けるのが最も効果的である。
論文 参考訳(メタデータ) (2024-05-02T17:44:41Z) - Online Learning under Budget and ROI Constraints via Weak Adaptivity [57.097119428915796]
制約付きオンライン学習問題に対する既存の原始双対アルゴリズムは、2つの基本的な仮定に依存している。
このような仮定は、標準の原始双対テンプレートを弱適応的後悔最小化器で与えることによって、どのように回避できるのかを示す。
上記の2つの前提が満たされていない場合に保証される、世界の最高の保証を証明します。
論文 参考訳(メタデータ) (2023-02-02T16:30:33Z) - Decision Rule Elicitation for Domain Adaptation [93.02675868486932]
ヒトインザループ機械学習は、専門家からラベルを引き出すために人工知能(AI)で広く使用されています。
この作業では、専門家が意思決定を説明する決定ルールを作成できるようにします。
決定規則の適用はアルゴリズムのドメイン適応を改善し、専門家の知識をAIモデルに広めるのに役立つことを示す。
論文 参考訳(メタデータ) (2021-02-23T08:07:22Z) - Leveraging Expert Consistency to Improve Algorithmic Decision Support [62.61153549123407]
建設のギャップを狭めるために観測結果と組み合わせることができる情報源として,歴史専門家による意思決定の利用について検討する。
本研究では,データ内の各ケースが1人の専門家によって評価された場合に,専門家の一貫性を間接的に推定する影響関数に基づく手法を提案する。
本研究は, 児童福祉領域における臨床現場でのシミュレーションと実世界データを用いて, 提案手法が構成ギャップを狭めることに成功していることを示す。
論文 参考訳(メタデータ) (2021-01-24T05:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。