論文の概要: M$^3$TN: Multi-gate Mixture-of-Experts based Multi-valued Treatment
Network for Uplift Modeling
- arxiv url: http://arxiv.org/abs/2401.14426v1
- Date: Wed, 24 Jan 2024 08:10:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-29 16:58:51.486465
- Title: M$^3$TN: Multi-gate Mixture-of-Experts based Multi-valued Treatment
Network for Uplift Modeling
- Title(参考訳): m$^3$tn: アップリフトモデリングのためのマルチゲート・ミックス・オブ・エキスパートベース多値処理ネットワーク
- Authors: Zexu Sun, Xu Chen
- Abstract要約: 昇降モデリング(uplift modeling)は、個人の反応に対する治療(例えば割引)の効果を予測する技術である。
我々は、新しいアンダーラインMulti-gate UnderlineMixture-of-ExpertsをベースとしたアンダーラインMulti-valued UnderlineTreatment UnderlineNetwork (M$3$TN)を提案する。
- 参考スコア(独自算出の注目度): 9.814992122492212
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Uplift modeling is a technique used to predict the effect of a treatment
(e.g., discounts) on an individual's response. Although several methods have
been proposed for multi-valued treatment, they are extended from binary
treatment methods. There are still some limitations. Firstly, existing methods
calculate uplift based on predicted responses, which may not guarantee a
consistent uplift distribution between treatment and control groups. Moreover,
this may cause cumulative errors for multi-valued treatment. Secondly, the
model parameters become numerous with many prediction heads, leading to reduced
efficiency. To address these issues, we propose a novel \underline{M}ulti-gate
\underline{M}ixture-of-Experts based \underline{M}ulti-valued
\underline{T}reatment \underline{N}etwork (M$^3$TN). M$^3$TN consists of two
components: 1) a feature representation module with Multi-gate
Mixture-of-Experts to improve the efficiency; 2) a reparameterization module by
modeling uplift explicitly to improve the effectiveness. We also conduct
extensive experiments to demonstrate the effectiveness and efficiency of our
M$^3$TN.
- Abstract(参考訳): 昇降モデリング(uplift modeling)は、個人の反応に対する治療(例えば割引)の効果を予測する技術である。
多値処理にはいくつかの方法が提案されているが、二元処理法から拡張されている。
制限はいくつかある。
まず、既存の手法では予測された応答に基づいて昇降量を計算し、処理群と制御群の間の昇降分布を保証できない。
さらに、これは多値治療の累積誤差を引き起こす可能性がある。
第2に、モデルパラメータには多くの予測ヘッドが伴うため、効率が低下する。
これらの問題に対処するため,本研究では,新規な \underline{M}ulti-gate \underline{M}ixture-of-Experts ベースの \underline{M}ulti-valued \underline{T}reatment \underline{N}etwork (M$^3$TN) を提案する。
M$^3$TNは2つの構成要素から構成される。
1) 効率を向上させるため,マルチゲート混合仕様を備えた特徴表現モジュール
2)アップリフトを明示的にモデル化して有効性を改善する再パラメータ化モジュール。
また,M$3$TNの有効性と有効性を示すため,広範な実験を行った。
関連論文リスト
- Multi-Treatment Multi-Task Uplift Modeling for Enhancing User Growth [12.243349396069934]
マルチタスクシナリオにおける処理効果を推定するために,マルチタスク・マルチタスク(MTMT)アップリフトネットワークを提案する。
MTMTは、タスク毎の自然な応答を測定するために、ユーザの特徴と治療を符号化する。
MTMTは、ユーザエクスペリエンスを改善するために、当社のゲームプラットフォームにデプロイされています。
論文 参考訳(メタデータ) (2024-08-23T02:44:08Z) - HiRE: High Recall Approximate Top-$k$ Estimation for Efficient LLM
Inference [68.59839755875252]
HiREは2つの新しいコンポーネントから構成される: (i) (i) (i) (i) (i) (i) (i) (i) (i) (i) (ii) DA-TOP-$k$: 効率的なマルチデバイス近似トップ-k$演算子) (i) (i) (i) (i) (i) (i) (i) DA-TOP-$k$演算子) 。
我々は、10億のパラメータモデルにおいて、HiREがソフトマックスとフィードフォワード層の両方に適用され、ほぼ一致した事前学習と下流の精度を実現し、1台のTPUv5eデバイスで1.47Times$の推論遅延を高速化することを示した。
論文 参考訳(メタデータ) (2024-02-14T18:04:36Z) - Optimizing Solution-Samplers for Combinatorial Problems: The Landscape
of Policy-Gradient Methods [52.0617030129699]
本稿では,DeepMatching NetworksとReinforcement Learningメソッドの有効性を解析するための新しい理論フレームワークを提案する。
我々の主な貢献は、Max- and Min-Cut、Max-$k$-Bipartite-Bi、Maximum-Weight-Bipartite-Bi、Traveing Salesman Problemを含む幅広い問題である。
本分析の副産物として,バニラ降下による新たな正則化プロセスを導入し,失効する段階的な問題に対処し,悪い静止点から逃れる上で有効であることを示す理論的および実験的証拠を提供する。
論文 参考訳(メタデータ) (2023-10-08T23:39:38Z) - Parameter Efficient Multi-task Model Fusion with Partial Linearization [97.23530944186078]
パラメータ効率のよい微調整技術において,マルチタスク融合を改善する新しい手法を提案する。
提案手法は, アダプタモジュールのみを部分的に線形化し, 線形化アダプタにタスク演算を適用する。
我々の部分線形化手法は、複数のタスクをより効果的に1つのモデルに融合させることを可能にしている。
論文 参考訳(メタデータ) (2023-10-07T08:55:54Z) - BYOM: Building Your Own Multi-Task Model For Free [69.63765907216442]
BYOM-FFTは完全微調整モデルのマージ用であり、BYOM-LoRAはLoRA微調整モデルのマージ用である。
コンピュータビジョンと自然言語処理タスクの実験により、提案手法は既存のマージ手法よりも大きなマージ率で優れていることが示された。
論文 参考訳(メタデータ) (2023-10-03T08:39:33Z) - Cooperative Thresholded Lasso for Sparse Linear Bandit [6.52540785559241]
本稿では,マルチエージェント・スパース文脈線形帯域問題に対処する新しい手法を提案する。
疎線形帯域における行単位の分散データに対処する最初のアルゴリズムである。
後悔を最小限に抑えるために効率的な特徴抽出が重要となる高次元マルチエージェント問題に適用可能である。
論文 参考訳(メタデータ) (2023-05-30T16:05:44Z) - M3E2: Multi-gate Mixture-of-experts for Multi-treatment Effect
Estimation [8.651843679841903]
M3E2はマルチタスク学習ニューラルネットワークモデルであり、複数の治療の効果を推定する。
分析の結果,本手法は優れた性能を示し,真の治療効果をより断定的に評価した。
論文 参考訳(メタデータ) (2021-12-14T17:32:13Z) - More Parameters? No Thanks! [43.68267274000395]
多言語ニューラルマシン翻訳MNMTにおけるモデル容量と負の干渉の長期的問題について検討する。
我々はネットワークプルーニング手法を用いて、トレーニングされたMNMTモデルからパラメータの50-70%をプルーニングすると、BLEUスコアの0.29-1.98ドロップしか得られないことを観察する。
我々は,MNMTの冗長なパラメータを反復的に訓練し,多言語性を維持しながらバイリンガル表現を改善する新しい適応戦略を提案する。
論文 参考訳(メタデータ) (2021-07-20T17:04:15Z) - A Twin Neural Model for Uplift [59.38563723706796]
Upliftは条件付き治療効果モデリングの特定のケースです。
相対リスクのベイズ解釈との関連性を利用して定義した新たな損失関数を提案する。
本提案手法は,シミュレーション設定の最先端と大規模ランダム化実験による実データとの競合性を示す。
論文 参考訳(メタデータ) (2021-05-11T16:02:39Z) - A conditional one-output likelihood formulation for multitask Gaussian
processes [0.0]
マルチタスクガウス過程(MTGP)は多出力回帰問題に対するガウスプロセスフレームワークの解である。
本稿では,マルチタスク学習を簡略化する新しい手法を提案する。
現状の美術品と計算的に競合していることが示される。
論文 参考訳(メタデータ) (2020-06-05T14:59:06Z) - Multi-Objective Matrix Normalization for Fine-grained Visual Recognition [153.49014114484424]
双線形プールは細粒度視覚認識(FGVC)において大きな成功を収める
近年,行列パワー正規化は双線形特徴量において2次情報を安定化させることができることが示されている。
両線形表現を同時に正規化できる効率的な多目的行列正規化法(MOMN)を提案する。
論文 参考訳(メタデータ) (2020-03-30T08:40:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。