論文の概要: Bi-Level Decision-Focused Causal Learning for Large-Scale Marketing Optimization: Bridging Observational and Experimental Data
- arxiv url: http://arxiv.org/abs/2510.19517v1
- Date: Wed, 22 Oct 2025 12:16:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:15.758027
- Title: Bi-Level Decision-Focused Causal Learning for Large-Scale Marketing Optimization: Bridging Observational and Experimental Data
- Title(参考訳): 大規模マーケティング最適化のための二段階決定焦点因数学習:観測データと実験データの統合
- Authors: Shuli Zhang, Hao Zhou, Jiaqi Zheng, Guibin Jiang, Bing Cheng, Wei Lin, Guihai Chen,
- Abstract要約: 本稿では,Bi-DFCL(Bi-level Decision-Focused Causal Learning)を提案する。
実験データを用いてOR判定品質の偏りのない推定器を開発する。
Bi-DFCLは世界最大のオンラインフードデリバリープラットフォームであるMeituanで展開されている。
- 参考スコア(独自算出の注目度): 31.002605911430052
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online Internet platforms require sophisticated marketing strategies to optimize user retention and platform revenue -- a classical resource allocation problem. Traditional solutions adopt a two-stage pipeline: machine learning (ML) for predicting individual treatment effects to marketing actions, followed by operations research (OR) optimization for decision-making. This paradigm presents two fundamental technical challenges. First, the prediction-decision misalignment: Conventional ML methods focus solely on prediction accuracy without considering downstream optimization objectives, leading to improved predictive metrics that fail to translate to better decisions. Second, the bias-variance dilemma: Observational data suffers from multiple biases (e.g., selection bias, position bias), while experimental data (e.g., randomized controlled trials), though unbiased, is typically scarce and costly -- resulting in high-variance estimates. We propose Bi-level Decision-Focused Causal Learning (Bi-DFCL) that systematically addresses these challenges. First, we develop an unbiased estimator of OR decision quality using experimental data, which guides ML model training through surrogate loss functions that bridge discrete optimization gradients. Second, we establish a bi-level optimization framework that jointly leverages observational and experimental data, solved via implicit differentiation. This novel formulation enables our unbiased OR estimator to correct learning directions from biased observational data, achieving optimal bias-variance tradeoff. Extensive evaluations on public benchmarks, industrial marketing datasets, and large-scale online A/B tests demonstrate the effectiveness of Bi-DFCL, showing statistically significant improvements over state-of-the-art. Currently, Bi-DFCL has been deployed at Meituan, one of the largest online food delivery platforms in the world.
- Abstract(参考訳): オンラインインターネットプラットフォームは、ユーザー維持とプラットフォーム収益を最適化するために洗練されたマーケティング戦略を必要とする。
従来のソリューションでは、マーケティング行動に対する個々の治療効果を予測する機械学習(ML)と、意思決定のためのオペレーションリサーチ(OR)の2段階のパイプラインが採用されている。
このパラダイムは2つの基本的な技術的課題を提示します。
まず、予測-決定ミスアライメント: 従来のML手法は、下流の最適化目標を考慮せずに予測精度のみにフォーカスする。
第2に、バイアス分散ジレンマ: 観測データは複数のバイアス(例えば、選択バイアス、位置バイアス)に悩まされる一方、実験データ(例えば、ランダム化された制御された試験)はバイアスがないが、一般的には小さくコストがかかる。
本稿では,これらの課題に体系的に対処するbi-level Decision-Focused Causal Learning (Bi-DFCL)を提案する。
まず、実験データを用いてOR判定品質の偏りのない推定器を開発し、離散的な最適化勾配を橋渡しするサロゲート損失関数を通してMLモデルトレーニングを誘導する。
第二に、暗黙の微分によって解決された観測データと実験データを共同で活用する二段階最適化フレームワークを確立する。
この新たな定式化により、偏りのないOR推定器は、偏りのある観測データから学習方向を補正し、最適な偏り分散トレードオフを達成することができる。
公開ベンチマーク、産業マーケティングデータセット、大規模オンラインA/Bテストに対する広範囲な評価は、Bi-DFCLの有効性を示し、最先端技術よりも統計的に有意な改善を示している。
現在、Bi-DFCLは世界最大のオンラインフードデリバリープラットフォームの1つであるMeituanで展開されている。
関連論文リスト
- Aligning Learning and Endogenous Decision-Making [5.84228364962637]
内因性不確実性の下でエンド・ツー・エンドの手法を導入し、下流に気付くようにMLモデルを訓練する。
また、MLモデルの不確実性を考慮した頑健な最適化も導入する。
このロバストなアプローチが、データ関数として高い確率で、ほぼ最適決定をキャプチャできることを保証します。
論文 参考訳(メタデータ) (2025-07-01T15:22:56Z) - Online Decision-Focused Learning [74.3205104323777]
意思決定中心学習(DFL)は、意思決定タスクで予測出力が使用されるモデルのトレーニングパラダイムとして、ますます人気が高まっている。
本稿では,目的関数を規則化し,その相違を解消し,非最適関数を克服する方法を検討する。
また、クナップサック実験におけるアルゴリズムの有効性を示し、2つの標準ベンチマークを上回りました。
論文 参考訳(メタデータ) (2025-05-19T10:40:30Z) - Data Preparation for Fairness-Performance Trade-Offs: A Practitioner-Friendly Alternative? [11.172805305320592]
トレーニング前のバイアスを軽減する前処理技術は効果的だが、モデルの性能に影響を与え、統合が困難になる可能性がある。
本報告では,MLライフサイクルの初期段階において,最適に選択されたフェアネス・アウェアの実践が,フェアネスとパフォーマンスの両面でいかに向上するかを実証的に評価する。
FATEを用いてフェアネスとパフォーマンスのトレードオフを分析し、FATEが選択したパイプラインと、前処理のバイアス緩和技術による結果を比較する。
論文 参考訳(メタデータ) (2024-12-20T14:12:39Z) - Preference-Based Multi-Agent Reinforcement Learning: Data Coverage and Algorithmic Techniques [65.55451717632317]
PbMARL(Preference-based Multi-Agent Reinforcement Learning)について検討する。
一般ゲームにおける嗜好のみのオフラインデータセットからナッシュ平衡を同定する。
以上の結果から,PbMARLの多面的アプローチが示唆された。
論文 参考訳(メタデータ) (2024-09-01T13:14:41Z) - Identifying and Mitigating Social Bias Knowledge in Language Models [52.52955281662332]
個々人の社会的偏見をきめ細かなキャリブレーションを可能にする新しいデバイアス・アプローチであるFairness Stamp(FAST)を提案する。
FASTは最先端のベースラインを超え、デバイアス性能が優れている。
これは、大きな言語モデルにおける公平性を達成するためのきめ細かいデバイアス戦略の可能性を強調している。
論文 参考訳(メタデータ) (2024-08-07T17:14:58Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Delving into Identify-Emphasize Paradigm for Combating Unknown Bias [52.76758938921129]
同定精度を高めるため,有効バイアス強調スコアリング法(ECS)を提案する。
また, マイニングされたバイアスアライメントとバイアスコンプリケート試料のコントリビューションのバランスをとるために, 勾配アライメント(GA)を提案する。
様々な環境で複数のデータセットで実験を行い、提案されたソリューションが未知のバイアスの影響を軽減することを実証した。
論文 参考訳(メタデータ) (2023-02-22T14:50:24Z) - Direct Heterogeneous Causal Learning for Resource Allocation Problems in
Marketing [20.9377115817821]
マーケティングは、ユーザのエンゲージメントを高め、プラットフォーム収益を改善するための重要なメカニズムである。
マーケティングにおける意思決定問題は資源配分問題として定式化され、数十年にわたって研究されてきた。
既存の作業は通常、解法を2つの完全に分離された段階、すなわち機械学習(ML)と操作研究(OR)に分割する。
論文 参考訳(メタデータ) (2022-11-28T19:27:34Z) - Data-Driven Offline Decision-Making via Invariant Representation
Learning [97.49309949598505]
オフラインのデータ駆動意思決定は、アクティブなインタラクションなしで最適化された決定を合成する。
オフラインデータからトレーニングされたモデルへの入力に関して最適化する場合、誤って良いように見えるアウト・オブ・ディストリビューション(OOD)インプットを生成するのは簡単です。
本稿では、オフラインデータ駆動意思決定をドメイン適応として定式化し、最適化された決定値の正確な予測を行うことを目標とする。
論文 参考訳(メタデータ) (2022-11-21T11:01:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。