論文の概要: Augmenting Limited and Biased RCTs through Pseudo-Sample Matching-Based Observational Data Fusion Method
- arxiv url: http://arxiv.org/abs/2509.18148v1
- Date: Tue, 16 Sep 2025 06:40:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.420222
- Title: Augmenting Limited and Biased RCTs through Pseudo-Sample Matching-Based Observational Data Fusion Method
- Title(参考訳): Pseudo-Sample Matching-based Observational Data Fusion Method によるRCTの高度化
- Authors: Kairong Han, Weidong Huang, Taiyang Zhou, Peng Zhen, Kun Kuang,
- Abstract要約: 擬似サンプルマッチングと呼ばれる経験的データ融合手法を提案する。
本手法をシミュレーション実験により検証し,実世界のデータを用いてオフラインおよびオンラインテストを行った。
- 参考スコア(独自算出の注目度): 36.607681197396474
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the online ride-hailing pricing context, companies often conduct randomized controlled trials (RCTs) and utilize uplift models to assess the effect of discounts on customer orders, which substantially influences competitive market outcomes. However, due to the high cost of RCTs, the proportion of trial data relative to observational data is small, which only accounts for 0.65\% of total traffic in our context, resulting in significant bias when generalizing to the broader user base. Additionally, the complexity of industrial processes reduces the quality of RCT data, which is often subject to heterogeneity from potential interference and selection bias, making it difficult to correct. Moreover, existing data fusion methods are challenging to implement effectively in complex industrial settings due to the high dimensionality of features and the strict assumptions that are hard to verify with real-world data. To address these issues, we propose an empirical data fusion method called pseudo-sample matching. By generating pseudo-samples from biased, low-quality RCT data and matching them with the most similar samples from large-scale observational data, the method expands the RCT dataset while mitigating its heterogeneity. We validated the method through simulation experiments, conducted offline and online tests using real-world data. In a week-long online experiment, we achieved a 0.41\% improvement in profit, which is a considerable gain when scaled to industrial scenarios with hundreds of millions in revenue. In addition, we discuss the harm to model training, offline evaluation, and online economic benefits when the RCT data quality is not high, and emphasize the importance of improving RCT data quality in industrial scenarios. Further details of the simulation experiments can be found in the GitHub repository https://github.com/Kairong-Han/Pseudo-Matching.
- Abstract(参考訳): オンライン配車料金の文脈では、企業はしばしばランダム化制御試行(RCT)を行い、顧客注文に対する割引の影響を評価するために昇降モデルを利用する。
しかし、RTTのコストが高いため、観測データに対する試用データの割合は小さく、私たちのコンテキストにおける総トラフィックの0.65 %しか占めていないため、より広いユーザベースに一般化する際の大きなバイアスが生じる。
さらに、工業プロセスの複雑さはRCTデータの品質を低下させ、しばしば潜在的な干渉や選択バイアスから異質性を受けるため、修正は困難である。
さらに,既存のデータ融合手法は,特徴の高次元性や実世界のデータでは検証が難しい厳密な仮定のために,複雑な産業環境において効果的に実装することが困難である。
これらの問題に対処するため,擬似サンプルマッチングと呼ばれる経験的データ融合手法を提案する。
バイアスのある低品質のRCTデータから擬似サンプルを生成し、それらを大規模観測データから最もよく似たサンプルとマッチングすることにより、その不均一性を緩和しながらRDTデータセットを拡張する。
本手法をシミュレーション実験により検証し,実世界のデータを用いてオフラインおよびオンラインテストを行った。
1週間にわたるオンライン実験で、利益の0.41\%を達成しました。
さらに,RCTデータ品質が高くない場合のモデルトレーニング,オフライン評価,オンライン経済効果の悪影響についても検討し,産業シナリオにおけるRCTデータ品質の向上の重要性を強調した。
シミュレーション実験の詳細はGitHubリポジトリhttps://github.com/Kairong-Han/Pseudo-Matchingにある。
関連論文リスト
- AdvKT: An Adversarial Multi-Step Training Framework for Knowledge Tracing [64.79967583649407]
知識追跡(KT)は、学生の知識状態を監視し、質問シーケンスに対する反応をシミュレートする。
既存のKTモデルは通常、単一ステップのトレーニングパラダイムに従っており、大きなエラーの蓄積につながる。
本稿では,多段階KTタスクに着目した新しい知識追跡のための多段階学習フレームワーク(AdvKT)を提案する。
論文 参考訳(メタデータ) (2025-04-07T03:31:57Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - RCT Rejection Sampling for Causal Estimation Evaluation [25.845034753006367]
コンバウンディングは、観測データから因果効果の偏りのない推定に対する重要な障害である。
評価設計を簡略化し,実データを使用する,有望な実証評価戦略を構築した。
提案アルゴリズムは, 既成試料からオラクル推定器を評価した場合に, バイアスが小さくなることを示す。
論文 参考訳(メタデータ) (2023-07-27T20:11:07Z) - Semi-supervised Relation Extraction via Data Augmentation and
Consistency-training [2.2209333405427585]
半教師付き学習手法は,ラベル付きデータポイントからの学習に加えて,非ラベル付きデータを活用することを目的としている。
近年,一貫性に基づく半教師付き学習手法と組み合わさった強力なデータ拡張が,SSLタスクにおける最先端技術である。
本研究では,制御されたテキスト生成の最近の進歩を活用し,関係抽出タスクの高品質なデータ拡張を行う。
論文 参考訳(メタデータ) (2023-06-16T19:45:42Z) - Data Sampling Affects the Complexity of Online SGD over Dependent Data [54.92366535993012]
本研究では,データサンプリング方式の違いが,高依存データに対するオンライン勾配勾配勾配の複雑さにどのように影響するかを示す。
データサンプルのサブサンプリングさえも、高度に依存したデータに対するオンラインSGDの収束を加速することができる。
論文 参考訳(メタデータ) (2022-03-31T07:48:30Z) - CrossAug: A Contrastive Data Augmentation Method for Debiasing Fact
Verification Models [14.75693099720436]
そこで本研究では,事実検証モデルのデバイアス化のためのデータ拡張手法であるCrossAugを提案する。
既存のサンプルから新たなクレームやエビデンスを生成するために、2段階拡張パイプラインを使用します。
生成されたサンプルは、元のペアとクロスワイズにペアリングされ、対照的なサンプルを形成します。
論文 参考訳(メタデータ) (2021-09-30T13:19:19Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Provably Efficient Causal Reinforcement Learning with Confounded
Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。
提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T14:49:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。