論文の概要: The Estimation of Continual Causal Effect for Dataset Shifting Streams
- arxiv url: http://arxiv.org/abs/2504.20471v1
- Date: Tue, 29 Apr 2025 07:13:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.781189
- Title: The Estimation of Continual Causal Effect for Dataset Shifting Streams
- Title(参考訳): データセットシフトストリームに対する連続因果効果の推定
- Authors: Baining Chen, Yiming Zhang, Yuqiao Han, Ruyue Zhang, Ruihuan Du, Zhishuo Zhou, Zhengdan Zhu, Xun Liu, Jiecheng Guo,
- Abstract要約: 本稿では、時間とともに変化するユーザの行動とドメイン分布からデータセットのシフトを捉えることに焦点を当てる。
本稿では,この課題に対処するために,プロキシ知識蒸留(ICE-PKD)を用いたインクリメンタル因果効果(Incrmental Causal Effect)を提案する。
ICE-PKDフレームワークは、中国の配車プラットフォームであるHuxiaozhuのマーケティングシステムにデプロイされている。
- 参考スコア(独自算出の注目度): 5.348397171353176
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Causal effect estimation has been widely used in marketing optimization. The framework of an uplift model followed by a constrained optimization algorithm is popular in practice. To enhance performance in the online environment, the framework needs to be improved to address the complexities caused by temporal dataset shift. This paper focuses on capturing the dataset shift from user behavior and domain distribution changing over time. We propose an Incremental Causal Effect with Proxy Knowledge Distillation (ICE-PKD) framework to tackle this challenge. The ICE-PKD framework includes two components: (i) a multi-treatment uplift network that eliminates confounding bias using counterfactual regression; (ii) an incremental training strategy that adapts to the temporal dataset shift by updating with the latest data and protects generalization via replay-based knowledge distillation. We also revisit the uplift modeling metrics and introduce a novel metric for more precise online evaluation in multiple treatment scenarios. Extensive experiments on both simulated and online datasets show that the proposed framework achieves better performance. The ICE-PKD framework has been deployed in the marketing system of Huaxiaozhu, a ride-hailing platform in China.
- Abstract(参考訳): 因果効果推定はマーケティング最適化に広く用いられている。
アップリフトモデルのフレームワークに制約付き最適化アルゴリズムが続き、実際に人気がある。
オンライン環境でのパフォーマンスを向上させるためには、時間的データセットシフトによる複雑さに対応するために、フレームワークを改善する必要がある。
本稿では、時間とともに変化するユーザの行動とドメイン分布からデータセットのシフトを捉えることに焦点を当てる。
本稿では,この課題に対処するために,プロキシ知識蒸留(ICE-PKD)を用いたインクリメンタル因果効果(Incrmental Causal Effect)を提案する。
ICE-PKDフレームワークには2つのコンポーネントが含まれている。
(i)反実回帰を用いた不整合バイアスを除去するマルチトリートアップリフトネットワーク
二 最新のデータを更新することにより時間的データセットシフトに適応し、リプレイベースの知識蒸留による一般化を保護する漸進的なトレーニング戦略。
また、アップリフトモデリングメトリクスを再考し、複数の治療シナリオにおいてより正確なオンライン評価のための新しい指標を紹介します。
シミュレーションとオンライン両方のデータセットに対する大規模な実験により、提案したフレームワークがより良いパフォーマンスを実現することが示された。
ICE-PKDフレームワークは、中国の配車プラットフォームであるHuxiaozhuのマーケティングシステムにデプロイされている。
関連論文リスト
- Review, Refine, Repeat: Understanding Iterative Decoding of AI Agents with Dynamic Evaluation and Selection [71.92083784393418]
Best-of-N (BON) サンプリングのような推論時間法は、パフォーマンスを改善するための単純で効果的な代替手段を提供する。
本稿では,反復的改良と動的候補評価,検証器による選択を併用した反復的エージェント復号(IAD)を提案する。
論文 参考訳(メタデータ) (2025-04-02T17:40:47Z) - Online-BLS: An Accurate and Efficient Online Broad Learning System for Data Stream Classification [52.251569042852815]
オンライン更新毎にクローズドフォームソリューションを備えたオンライン広範学習システムフレームワークを導入する。
我々は,効果的な重み推定アルゴリズムと効率的なオンライン更新戦略を設計する。
我々のフレームワークは、コンセプトドリフトを伴うデータストリームシナリオに自然に拡張され、最先端のベースラインを超えます。
論文 参考訳(メタデータ) (2025-01-28T13:21:59Z) - Online Relational Inference for Evolving Multi-agent Interacting Systems [14.275434303742328]
オンライン推論(ORI)は、マルチエージェントインタラクションシステムの進化において、隠れた相互作用グラフを効率的に識別するように設計されている。
固定トレーニングセットに依存する従来のオフラインメソッドとは異なり、ORIはオンラインバックプロパゲーションを採用し、新しいデータポイント毎にモデルを更新する。
重要な革新は、AdaRelationと呼ばれる新しい適応学習技術によって最適化されたトレーニング可能なパラメータとして、隣接行列を使用することである。
論文 参考訳(メタデータ) (2024-11-03T05:43:55Z) - Efficient Diffusion as Low Light Enhancer [63.789138528062225]
RATR(Reflectance-Aware Trajectory Refinement)は、イメージの反射成分を用いて教師の軌跡を洗練するための、シンプルで効果的なモジュールである。
textbfReDDiT (textbfDistilled textbfTrajectory) は低照度画像強調(LLIE)に適した効率的で柔軟な蒸留フレームワークである。
論文 参考訳(メタデータ) (2024-10-16T08:07:18Z) - Online Spatio-Temporal Correlation-Based Federated Learning for Traffic
Flow Forecasting [11.253575460227127]
本稿では,FLフレームワークにおけるオンライン学習(OL)方式を用いた交通流の予測に関する最初の研究を行う。
次に,オンライン時空間相関に基づくフェデレート学習(FedOSTC)という新しい予測手法を提案する。
論文 参考訳(メタデータ) (2023-02-17T02:37:36Z) - Concept Drift Adaptation for CTR Prediction in Online Advertising
Systems [6.900209851954917]
クリックスルー率(CTR)予測は、ウェブ検索、レコメンダシステム、オンライン広告表示において重要な課題である。
本稿では,CTR予測データストリームにおける適応フィルタリングによるコンセプトドリフト問題を軽減するために,専門家の適応混合(AdaMoE)を提案する。
論文 参考訳(メタデータ) (2022-04-01T07:43:43Z) - Reinforcement Learning in the Wild: Scalable RL Dispatching Algorithm
Deployed in Ridehailing Marketplace [12.298997392937876]
本研究では,強化学習に基づくリアルタイムディスパッチアルゴリズムを提案する。
ディディのA/Bテストの運営下にある複数の都市でオンラインに展開され、主要な国際市場の一つで展開されている。
デプロイされたアルゴリズムは、A/Bテストによるドライバーの総収入を1.3%以上改善している。
論文 参考訳(メタデータ) (2022-02-10T16:07:17Z) - Data Augmentation through Expert-guided Symmetry Detection to Improve
Performance in Offline Reinforcement Learning [0.0]
マルコフ決定過程(MDP)の動的モデルのオフライン推定は非自明な作業である。
近年の研究では、密度推定法に依存する専門家誘導パイプラインが、決定論的環境において、この構造を効果的に検出できることが示されている。
学習したMDPを解き、実際の環境に最適化されたポリシーを適用すると、前者の結果が性能改善につながることを示す。
論文 参考訳(メタデータ) (2021-12-18T14:32:32Z) - Lifelong Unsupervised Domain Adaptive Person Re-identification with
Coordinated Anti-forgetting and Adaptation [127.6168183074427]
本稿では,LUDA (Lifelong Unsupervised Domain Adaptive) という新たなタスクを提案する。
これは、モデルがターゲット環境のラベル付けされていないデータに継続的に適応する必要があるため、難しい。
我々は、CLUDA-ReIDと呼ばれるこのタスクのための効果的なスキームを設計し、そこでは、アンチフォージェッティングが適応と調和して調整される。
論文 参考訳(メタデータ) (2021-12-13T13:19:45Z) - A Deep Value-network Based Approach for Multi-Driver Order Dispatching [55.36656442934531]
そこで本研究では,注文発送のための深層強化学習に基づくソリューションを提案する。
DiDiの配車プラットフォーム上で大規模なオンラインA/Bテストを実施している。
その結果,CVNetは近年提案されているディスパッチ手法よりも一貫して優れていた。
論文 参考訳(メタデータ) (2021-06-08T16:27:04Z) - Extrapolation for Large-batch Training in Deep Learning [72.61259487233214]
我々は、バリエーションのホストが、我々が提案する統一されたフレームワークでカバー可能であることを示す。
本稿では,この手法の収束性を証明し,ResNet,LSTM,Transformer上での経験的性能を厳格に評価する。
論文 参考訳(メタデータ) (2020-06-10T08:22:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。