論文の概要: Dynamic Synthetic Controls vs. Panel-Aware Double Machine Learning for Geo-Level Marketing Impact Estimation
- arxiv url: http://arxiv.org/abs/2508.20335v1
- Date: Thu, 28 Aug 2025 00:33:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-29 18:12:01.881553
- Title: Dynamic Synthetic Controls vs. Panel-Aware Double Machine Learning for Geo-Level Marketing Impact Estimation
- Title(参考訳): ジオレベルマーケティング影響評価のための動的合成制御とパネル対応ダブル機械学習
- Authors: Sang Su Lee, Vineeth Loganathan, Vijay Raghavan,
- Abstract要約: 合成制御法(SCM)は、しばしば高出力であるが、体系的に過小評価効果の大きさを示す。
ダブル機械学習(Double Machine Learning, DML)は、SCMに対してベンチマークされることはめったにない。
我々は、典型的な大規模ジオロールアウトを模倣した、オープンで完全に文書化されたシミュレータを構築します。
- 参考スコア(独自算出の注目度): 12.815892583089443
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurately quantifying geo-level marketing lift in two-sided marketplaces is challenging: the Synthetic Control Method (SCM) often exhibits high power yet systematically under-estimates effect size, while panel-style Double Machine Learning (DML) is seldom benchmarked against SCM. We build an open, fully documented simulator that mimics a typical large-scale geo roll-out: N_unit regional markets are tracked for T_pre weeks before launch and for a further T_post-week campaign window, allowing all key parameters to be varied by the user and probe both families under five stylized stress tests: 1) curved baseline trends, 2) heterogeneous response lags, 3) treated-biased shocks, 4) a non-linear outcome link, and 5) a drifting control group trend. Seven estimators are evaluated: three standard Augmented SCM (ASC) variants and four panel-DML flavors (TWFE, CRE/Mundlak, first-difference, and within-group). Across 100 replications per scenario, ASC models consistently demonstrate severe bias and near-zero coverage in challenging scenarios involving nonlinearities or external shocks. By contrast, panel-DML variants dramatically reduce this bias and restore nominal 95%-CI coverage, proving far more robust. The results indicate that while ASC provides a simple baseline, it is unreliable in common, complex situations. We therefore propose a 'diagnose-first' framework where practitioners first identify the primary business challenge (e.g., nonlinear trends, response lags) and then select the specific DML model best suited for that scenario, providing a more robust and reliable blueprint for analyzing geo-experiments.
- Abstract(参考訳): SCM(Synthetic Control Method)は高出力だが、体系的に過小評価される効果の大きさを示すことが多いが、パネルスタイルのDouble Machine Learning(DML)はSCMに対してベンチマークされることは滅多にない。
N_unit地域市場は、ローンチの数週間前にT_preと、さらにT_post-weekキャンペーンウィンドウのために追跡され、ユーザによってすべての主要なパラメータが変更され、5つのスタイル化されたストレステストの下で両方の家族を調査することができます。
1)曲線ベースライントレンド
2)不均一応答遅延
3) バイアスショック, 治療
4) 非線形結果リンク、及び
5) ドリフト制御群傾向。
評価対象は標準SCM(ASC)3種類,パネルDML4種類(TWFE,CRE/Mundlak,ファーストディファレンス,グループ内)である。
シナリオ毎の100回のレプリケーションにおいて、ASCモデルは、非線形性や外部ショックを含む挑戦的なシナリオにおいて、厳密なバイアスとほぼゼロのカバレッジを一貫して示している。
対照的に、パネルDMLの変種は、このバイアスを劇的に減らし、名目上の95%-CIカバレッジを回復し、はるかに堅牢であることが証明された。
その結果、ASCは単純なベースラインを提供するが、一般的な複雑な状況では信頼できないことが示唆された。
そこで我々は,まず第一のビジネス課題(例えば非線形トレンド,応答遅延)を特定し,そのシナリオに適した特定のDMLモデルを選択する,より堅牢で信頼性の高い青写真を提供する「診断ファースト」フレームワークを提案する。
関連論文リスト
- When Punctuation Matters: A Large-Scale Comparison of Prompt Robustness Methods for LLMs [55.20230501807337]
本報告では, 統一実験フレームワーク内での迅速なロバスト性向上のための5つの手法の体系的評価を行う。
Llama、Qwen、Gemmaファミリーの8つのモデルに対して、Natural Instructionsデータセットから52のタスクをベンチマークする。
論文 参考訳(メタデータ) (2025-08-15T10:32:50Z) - GRPO-CARE: Consistency-Aware Reinforcement Learning for Multimodal Reasoning [53.894789613838654]
我々は、複雑な実世界のビデオにバランスの取れた知覚と推論を必要とするベンチマークであるSEED-Bench-R1を紹介する。
SEED-Bench-R1を用いて、標準GRPOは解の精度を向上する一方で、推論ステップと解の論理的コヒーレンスを57.9%の一貫性で減少させる。
応答の正しさと推論コヒーレンスの両方を明示的な監督なしに最適化する整合性を考慮したRLフレームワークGRPO-CAREを提案する。
論文 参考訳(メタデータ) (2025-06-19T08:49:13Z) - Prismatic Synthesis: Gradient-based Data Diversification Boosts Generalization in LLM Reasoning [77.120955854093]
我々は,データ多様性が言語モデルにおける一般化の強力な予測因子であることを示す。
モデル誘起勾配のエントロピーを通して多様性を定量化する計量であるG-Vendiを導入する。
多様な合成データを生成するためのフレームワークであるPrismatic Synthesisを提案する。
論文 参考訳(メタデータ) (2025-05-26T16:05:10Z) - Bridging the Gap for Test-Time Multimodal Sentiment Analysis [7.871669754963032]
マルチモーダル感情分析(マルチモーダル感情分析、Multimodal sentiment analysis、MSA)は、複数のモーダルを通して人間の感情や感情を理解し、認識することを目的とした、新たな研究トピックである。
本稿では,コントラスト適応(Contrastive Adaptation)と安定擬似ラベル生成(Stable Pseudo-label generation, CASP)の2つの手法を提案する。
論文 参考訳(メタデータ) (2024-12-10T02:26:33Z) - Sample then Identify: A General Framework for Risk Control and Assessment in Multimodal Large Language Models [46.56041622514975]
リスク管理とアセスメントのための2段階のフレームワークであるTRONを紹介する。
TRONは、2つのユーザ特定リスクレベルに制限された所望のエラー率を達成する。
重複予測セットは適応性を維持しつつ、異なるリスクレベルのリスク評価に対してより効率的で安定である。
論文 参考訳(メタデータ) (2024-10-10T17:50:42Z) - Automating Dataset Updates Towards Reliable and Timely Evaluation of Large Language Models [81.27391252152199]
大規模言語モデル(LLM)は、さまざまな自然言語ベンチマークで素晴らしいパフォーマンスを実現している。
本稿では、データセットの自動更新と、その有効性に関する体系的な分析を提案する。
1) 類似したサンプルを生成するための戦略を模倣すること,2) 既存のサンプルをさらに拡張する戦略を拡張すること,である。
論文 参考訳(メタデータ) (2024-02-19T07:15:59Z) - Delving into Identify-Emphasize Paradigm for Combating Unknown Bias [52.76758938921129]
同定精度を高めるため,有効バイアス強調スコアリング法(ECS)を提案する。
また, マイニングされたバイアスアライメントとバイアスコンプリケート試料のコントリビューションのバランスをとるために, 勾配アライメント(GA)を提案する。
様々な環境で複数のデータセットで実験を行い、提案されたソリューションが未知のバイアスの影響を軽減することを実証した。
論文 参考訳(メタデータ) (2023-02-22T14:50:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。