論文の概要: TSCAN: Context-Aware Uplift Modeling via Two-Stage Training for Online Merchant Business Diagnosis
- arxiv url: http://arxiv.org/abs/2504.18881v1
- Date: Sat, 26 Apr 2025 10:00:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.032332
- Title: TSCAN: Context-Aware Uplift Modeling via Two-Stage Training for Online Merchant Business Diagnosis
- Title(参考訳): TSCAN:オンラインマーチャントビジネス診断のための2段階トレーニングによるコンテキストアウェアアップリフトモデリング
- Authors: Hangtao Zhang, Zhe Li, Kairui Zhang,
- Abstract要約: 2段階トレーニングアプローチ(TSCAN)に基づく文脈認識アップリフトモデルを提案する。
第1段階では、IPMの処理規則化と確率スコア予測を含む、CAN-Uと呼ばれるアップリフトモデルを訓練する。
第2段階では、等張出力層を用いて昇降効果を直接モデル化するCAN-Dモデルを訓練する。
- 参考スコア(独自算出の注目度): 2.8438369256032416
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A primary challenge in ITE estimation is sample selection bias. Traditional approaches utilize treatment regularization techniques such as the Integral Probability Metrics (IPM), re-weighting, and propensity score modeling to mitigate this bias. However, these regularizations may introduce undesirable information loss and limit the performance of the model. Furthermore, treatment effects vary across different external contexts, and the existing methods are insufficient in fully interacting with and utilizing these contextual features. To address these issues, we propose a Context-Aware uplift model based on the Two-Stage training approach (TSCAN), comprising CAN-U and CAN-D sub-models. In the first stage, we train an uplift model, called CAN-U, which includes the treatment regularizations of IPM and propensity score prediction, to generate a complete dataset with counterfactual uplift labels. In the second stage, we train a model named CAN-D, which utilizes an isotonic output layer to directly model uplift effects, thereby eliminating the reliance on the regularization components. CAN-D adaptively corrects the errors estimated by CAN-U through reinforcing the factual samples, while avoiding the negative impacts associated with the aforementioned regularizations. Additionally, we introduce a Context-Aware Attention Layer throughout the two-stage process to manage the interactions between treatment, merchant, and contextual features, thereby modeling the varying treatment effect in different contexts. We conduct extensive experiments on two real-world datasets to validate the effectiveness of TSCAN. Ultimately, the deployment of our model for real-world merchant diagnosis on one of China's largest online food ordering platforms validates its practical utility and impact.
- Abstract(参考訳): ITE推定における主要な課題は、サンプル選択バイアスである。
従来のアプローチでは、IPM(Integral Probability Metrics)や再重み付け、確率スコアモデリングといった治療規則化技術を使用してバイアスを軽減する。
しかし、これらの正規化は望ましくない情報損失をもたらし、モデルの性能を制限する可能性がある。
さらに、治療効果は外部の状況によって異なり、既存の手法はこれらの文脈的特徴を十分に扱ったり利用したりするのに不十分である。
これらの問題に対処するために、CAN-UとCAN-DサブモデルからなるTSCAN(Two-Stage Training approach)に基づくコンテキスト・アウェア・アップリフトモデルを提案する。
第1段階では、IPMの処理規則化と確率スコア予測を含むCAN-Uと呼ばれるアップリフトモデルを訓練し、反ファクト的なアップリフトラベルを持つ完全なデータセットを生成する。
第2段階では、等速出力層を用いてアップリフト効果を直接モデル化し、正規化成分に依存しないCAN-Dモデルを訓練する。
CAN-Dは、上記の正則化に関連する負の影響を回避しつつ、実例を補強することでCAN-Uが推定した誤差を適応的に補正する。
さらに,2段階のプロセス全体を通じてコンテキスト認識注意層を導入し,処理,商店,コンテキストの特徴間の相互作用を管理し,異なるコンテキストで異なる処理効果をモデル化する。
TSCANの有効性を検証するために、2つの実世界のデータセットについて広範な実験を行った。
最終的に、中国最大のオンライン食品注文プラットフォームの1つに実際の商人診断のためのモデルが配備されたことにより、その実用性と影響が検証された。
関連論文リスト
- Disentangled World Models: Learning to Transfer Semantic Knowledge from Distracting Videos for Reinforcement Learning [93.58897637077001]
本稿では,オフラインからオンラインまでの潜水蒸留とフレキシブルなゆがみ制約を通したビデオから,セマンティックな違いを学習し,理解することを試みる。
動作自由なビデオ予測モデルを非干渉正規化によりオフラインでトレーニングし、注意をそらすビデオから意味的知識を抽出する。
オンライン環境での微調整には、事前学習されたモデルからの知識を活用し、世界モデルに絡み合った制約を導入する。
論文 参考訳(メタデータ) (2025-03-11T13:50:22Z) - MITA: Bridging the Gap between Model and Data for Test-time Adaptation [68.62509948690698]
テスト時間適応(TTA)は、モデルの一般化性を高めるための有望なパラダイムとして登場した。
本稿では,Met-In-The-MiddleをベースとしたMITAを提案する。
論文 参考訳(メタデータ) (2024-10-12T07:02:33Z) - Explanatory Model Monitoring to Understand the Effects of Feature Shifts on Performance [61.06245197347139]
そこで本研究では,機能シフトによるブラックボックスモデルの振る舞いを説明する新しい手法を提案する。
本稿では,最適輸送と共有値の概念を組み合わせた提案手法について,説明的性能推定として紹介する。
論文 参考訳(メタデータ) (2024-08-24T18:28:19Z) - Towards Clinician-Preferred Segmentation: Leveraging Human-in-the-Loop for Test Time Adaptation in Medical Image Segmentation [10.65123164779962]
深層学習に基づく医療画像セグメンテーションモデルは、様々な医療センターに展開すると、しばしば性能劣化に直面します。
本稿では,クリニカル修正予測のほとんど見落とされがちな可能性を生かした,新規なHuman-in-the-loop TTAフレームワークを提案する。
我々のフレームワークは、ドメインの格差によって生じる予測のばらつきを減らし、分散損失を想定する。
論文 参考訳(メタデータ) (2024-05-14T02:02:15Z) - Estimation of individual causal effects in network setup for multiple
treatments [4.53340898566495]
個別治療効果 (ITE) の推定問題について, 複数の治療と観察データを用いて検討した。
我々は、共同創設者の共有表現を学ぶために、Graph Convolutional Networks(GCN)を採用しています。
アプローチでは、個別のニューラルネットワークを使用して、各治療の潜在的な結果を推測する。
論文 参考訳(メタデータ) (2023-12-18T06:07:45Z) - Improving Speech Translation by Cross-Modal Multi-Grained Contrastive
Learning [8.501945512734268]
E2E-STに対するFCCL(Fine- and Coarse- Granularity Contrastive Learning)アプローチを提案する。
提案手法の重要な要素は,文レベルとフレームレベルの両方でコントラスト学習を適用し,リッチな意味情報を含む音声表現を抽出するための包括的なガイドを提供することである。
MuST-Cベンチマーク実験の結果,提案手法は8つの言語対に対して,最先端のE2E-STベースラインを大幅に上回ることがわかった。
論文 参考訳(メタデータ) (2023-04-20T13:41:56Z) - Large Language Models with Controllable Working Memory [64.71038763708161]
大規模言語モデル(LLM)は、自然言語処理(NLP)の一連のブレークスルーをもたらした。
これらのモデルをさらに切り離すのは、事前訓練中に内在する膨大な量の世界的知識だ。
モデルの世界知識が、文脈で提示された事実情報とどのように相互作用するかは、まだ解明されていない。
論文 参考訳(メタデータ) (2022-11-09T18:58:29Z) - Relational Action Bases: Formalization, Effective Safety Verification,
and Invariants (Extended Version) [67.99023219822564]
我々はリレーショナルアクションベース(RAB)の一般的な枠組みを紹介する。
RABは両方の制限を解除することで既存のモデルを一般化する。
データ対応ビジネスプロセスのベンチマークにおいて、このアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-08-12T17:03:50Z) - On Modality Bias Recognition and Reduction [70.69194431713825]
マルチモーダル分類の文脈におけるモダリティバイアス問題について検討する。
本稿では,各ラベルの特徴空間を適応的に学習するプラグアンドプレイ損失関数法を提案する。
本手法は, ベースラインに比べ, 顕著な性能向上を実現している。
論文 参考訳(メタデータ) (2022-02-25T13:47:09Z) - Enhancing Counterfactual Classification via Self-Training [9.484178349784264]
本研究では, 擬似ラベルによるランダム化試行をシミュレートするために, 観測データ中の有限未確認動作に対して, カテゴリ値で結果を示唆する自己学習アルゴリズムを提案する。
提案アルゴリズムは,合成データセットと実データセットの両方において有効であることを示す。
論文 参考訳(メタデータ) (2021-12-08T18:42:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。