論文の概要: Feature Selection Methods for Uplift Modeling and Heterogeneous
Treatment Effect
- arxiv url: http://arxiv.org/abs/2005.03447v2
- Date: Fri, 8 Jul 2022 17:46:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-06 13:50:04.424513
- Title: Feature Selection Methods for Uplift Modeling and Heterogeneous
Treatment Effect
- Title(参考訳): 揚力モデリングのための特徴選択法と不均一処理効果
- Authors: Zhenyu Zhao, Yumin Zhang, Totte Harinen, Mike Yung
- Abstract要約: アップリフトモデリングは、サブグループレベルの治療効果を推定する因果学習手法である。
従来の機能選択の方法は、そのタスクには適していない。
本稿では,アップリフトモデリングのための特徴選択手法を提案する。
- 参考スコア(独自算出の注目度): 1.349645012479288
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Uplift modeling is a causal learning technique that estimates subgroup-level
treatment effects. It is commonly used in industry and elsewhere for tasks such
as targeting ads. In a typical setting, uplift models can take thousands of
features as inputs, which is costly and results in problems such as overfitting
and poor model interpretability. Consequently, there is a need to select a
subset of the most important features for modeling. However, traditional
methods for doing feature selection are not fit for the task because they are
designed for standard machine learning models whose target is importantly
different from uplift models. To address this, we introduce a set of feature
selection methods explicitly designed for uplift modeling, drawing inspiration
from statistics and information theory. We conduct empirical evaluations on the
proposed methods on publicly available datasets, demonstrating the advantages
of the proposed methods compared to traditional feature selection. We make the
proposed methods publicly available as a part of the CausalML open-source
package.
- Abstract(参考訳): uplift modelingは,サブグループレベルの治療効果を推定する因果学習手法である。
広告をターゲティングするなど、業界などで広く使われている。
典型的な設定では、アップリフトモデルは何千もの特徴を入力として取り込むことができ、コストがかかり、過度な適合やモデルの解釈容易性の低下といった問題が発生する。
そのため、モデリングにおいて最も重要な機能のサブセットを選択する必要がある。
しかし、従来の機能選択手法は、アップリフトモデルと大きく異なるターゲットを持つ標準的な機械学習モデル向けに設計されているため、タスクに適合しない。
そこで,本稿では,統計学や情報理論からインスピレーションを得た,高揚度モデリングのための特徴選択手法を提案する。
提案手法を公開データセット上で実証評価し,従来の特徴選択と比較して,提案手法の利点を実証する。
提案手法をCausalMLオープンソースパッケージの一部として公開する。
関連論文リスト
- Binary Feature Mask Optimization for Feature Selection [0.0]
本稿では,モデルの予測を考慮した特徴選択を行う新しいフレームワークを提案する。
我々のフレームワークは、選択過程における特徴を排除するために、新しい特徴マスキングアプローチを用いて革新する。
機械学習モデルとしてLightGBMとMulti-Layer Perceptronを用いた実生活データセットの性能改善を示す。
論文 参考訳(メタデータ) (2024-01-23T10:54:13Z) - Extending Variability-Aware Model Selection with Bias Detection in
Machine Learning Projects [0.7646713951724013]
本稿では,機械学習プロジェクトにおけるバイアス検出による適応変数認識モデル選択手法の拡張について述べる。
提案手法は, モデル選択, 特にバイアスに関連する要因, およびそれらの相互作用に影響を及ぼす因子を明示することによって, 技術の現状を推し進めることを目的としている。
論文 参考訳(メタデータ) (2023-11-23T22:08:29Z) - Towards Efficient Task-Driven Model Reprogramming with Foundation Models [52.411508216448716]
ビジョンファウンデーションモデルは、非常に大きなモデルキャパシティと幅広いトレーニングデータから恩恵を受け、印象的なパワーを示す。
しかし、実際には、下流のシナリオは限られた計算資源や効率上の考慮のため、小さなモデルしかサポートできない。
これは、ファンデーションモデルの現実的な応用に重要な課題をもたらします。
論文 参考訳(メタデータ) (2023-04-05T07:28:33Z) - PAMI: partition input and aggregate outputs for model interpretation [69.42924964776766]
本研究では、深層学習モデルが局所的な特徴を集約してモデル予測を行うという観察に基づいて、PAMIと呼ばれるシンプルで効果的な可視化フレームワークを提案する。
基本的な考え方は、入力の大多数を隠蔽し、元のモデル予測に対する保存された入力部の相対的な寄与として対応するモデル出力を使用することである。
複数のタスクに対する大規模な実験により,提案手法は,クラス固有の入力領域をより正確に見つけるために,既存の可視化手法よりも優れていることを確認した。
論文 参考訳(メタデータ) (2023-02-07T08:48:34Z) - Multidimensional Item Response Theory in the Style of Collaborative
Filtering [0.8057006406834467]
本稿では,多次元項目応答理論(MIRT)に対する機械学習手法を提案する。
協調フィルタリングに触発されて、多くのMIRTモデルを含むモデルの一般的なクラスを定義します。
本稿では, 個人モデルとクロスバリデーションを推定し, 最適動作モデルを選択するために, ペナル化結合最大度(JML)の使用について論じる。
論文 参考訳(メタデータ) (2023-01-03T00:56:27Z) - Dataless Knowledge Fusion by Merging Weights of Language Models [51.8162883997512]
微調整された事前学習言語モデルは、下流のNLPモデルを構築するための主要なパラダイムとなっている。
これは、より優れた単一モデルを生み出すために、個々のモデル間で知識を融合させる障壁を生み出します。
パラメータ空間のモデルをマージするデータレス知識融合法を提案する。
論文 参考訳(メタデータ) (2022-12-19T20:46:43Z) - Investigating Ensemble Methods for Model Robustness Improvement of Text
Classifiers [66.36045164286854]
既存のバイアス機能を分析し、すべてのケースに最適なモデルが存在しないことを実証します。
適切なバイアスモデルを選択することで、より洗練されたモデル設計でベースラインよりもロバスト性が得られる。
論文 参考訳(メタデータ) (2022-10-28T17:52:10Z) - Deep Learning for Choice Modeling [5.173001988341294]
我々は,機能フリーと機能ベースという2つの選択モデルに基づいて,ディープラーニングに基づく選択モデルを構築した。
本モデルでは,候補選択に対する本質的効用と,候補選択が選択確率に与える影響の両方を捉える。
論文 参考訳(メタデータ) (2022-08-19T13:10:17Z) - An Additive Instance-Wise Approach to Multi-class Model Interpretation [53.87578024052922]
解釈可能な機械学習は、ブラックボックスシステムの特定の予測を駆動する要因に関する洞察を提供する。
既存の手法は主に、局所的な加法的あるいはインスタンス的なアプローチに従う説明的入力特徴の選択に重点を置いている。
本研究は,両手法の長所を生かし,複数の対象クラスに対する局所的な説明を同時に学習するためのグローバルフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-07T06:50:27Z) - Data Summarization via Bilevel Optimization [48.89977988203108]
シンプルだが強力なアプローチは、小さなサブセットのデータを操作することだ。
本研究では,コアセット選択を基数制約付き双レベル最適化問題として定式化する汎用コアセットフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-26T09:08:38Z) - Model-specific Data Subsampling with Influence Functions [37.64859614131316]
トレーニングポイントが様々な影響を持つ場合、ランダムサンプリングよりも優れたモデル固有データサブサンプリング戦略を開発する。
具体的には、影響関数を活用して、選択戦略をガイドし、理論的に証明し、我々のアプローチが素早く高品質なモデルを選択することを実証する。
論文 参考訳(メタデータ) (2020-10-20T12:10:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。