論文の概要: VALOR: Value-Aware Revenue Uplift Modeling with Treatment-Gated Representation for B2B Sales
- arxiv url: http://arxiv.org/abs/2604.02472v1
- Date: Thu, 02 Apr 2026 19:08:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.179227
- Title: VALOR: Value-Aware Revenue Uplift Modeling with Treatment-Gated Representation for B2B Sales
- Title(参考訳): VALOR:B2B販売のための待遇表現を用いた価値認識収益向上モデル
- Authors: Vamshi Guduguntla, Kavin Soni, Debanshu Das,
- Abstract要約: B2Bの営業組織は、高額な人的資源配分を最適化するために、ゼロインフレーションされた収益分配内で「説得可能な」アカウントを特定しなければならない。
標準昇降フレームワークは高次元空間における処理信号の崩壊と回帰校正と高価値「捕鯨者」のランクの相違に苦慮している
本稿では,両線形相互作用を用いて因果信号の崩壊を防止する,処理ゲート付きスパース・レブンジュネットワークを備えた統合フレームワークであるVALORを紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: B2B sales organizations must identify "persuadable" accounts within zero-inflated revenue distributions to optimize expensive human resource allocation. Standard uplift frameworks struggle with treatment signal collapse in high-dimensional spaces and a misalignment between regression calibration and the ranking of high-value "whales." We introduce VALOR (Value Aware Learning of Optimized (B2B) Revenue), a unified framework featuring a Treatment-Gated Sparse-Revenue Network that uses bilinear interaction to prevent causal signal collapse. The framework is optimized via a novel Cost-Sensitive Focal-ZILN objective that combines a focal mechanism for distributional robustness with a value-weighted ranking loss that scales penalties based on financial magnitude. To provide interpretability for high-touch sales programs, we further derive Robust ZILN-GBDT, a tree based variant utilizing a custom splitting criterion for uplift heterogeneity. Extensive evaluations confirm VALOR's dominance, achieving a 20% improvement in rankability over state-of-the-art methods on public benchmarks and delivering a validated 2.7x increase in incremental revenue per account in a rigorous 4-month production A/B test.
- Abstract(参考訳): B2Bの営業組織は、高額な人的資源配分を最適化するために、ゼロインフレーションされた収益分配内で「説得可能な」アカウントを特定しなければならない。
標準昇降フレームワークは、高次元空間における治療信号の崩壊と、回帰校正と高価値な「クジラ」のランクの誤調整に苦慮している。
VALOR (Value Aware Learning of Optimized (B2B) revenue) は、双方向の相互作用を用いて因果信号の崩壊を防ぐ処理ゲート付きスパース・ルーネットワークを特徴とする統合フレームワークである。
このフレームワークは、分散ロバストネスの焦点機構と、財務規模に基づいてペナルティをスケールする価値重み付きランキング損失を組み合わせた、新しいコスト・センシティブ・フォカル・ZILN目標によって最適化されている。
高タッチ販売プログラムの解釈可能性を得るために、我々はさらに、昇降ヘテロジニティのためのカスタムスプリット基準を利用したツリーベースの変種であるRobust ZILN-GBDTを導出する。
大規模な評価は、VALORの優位性を確認し、公開ベンチマークにおける最先端の手法よりも20%向上し、厳格な4ヶ月生産のA/Bテストにおいて、アカウント当たりのインクリメンタルな収益が2.7倍に向上した。
関連論文リスト
- Fair regression under localized demographic parity constraints [9.082079838093371]
F f |S=s (z m ) = $ell$m という形の CDF 制約をグループ的に課する,新規な (ell$, Z)-fair predictor を導入する。
合成データセットと実データセットの実験では、解釈可能なフェアネス精度のトレードオフが示され、決定関連量子またはしきい値に対するターゲット修正が可能である。
論文 参考訳(メタデータ) (2026-03-26T09:21:05Z) - Byzantine-Robust and Differentially Private Federated Optimization under Weaker Assumptions [89.52532304099522]
フェデレートラーニング(FL)は、クライアントが生データを集中せずに共有モデルを共同でトレーニングすることを可能にし、固有のプライバシーレベルを提供する。
グラデーションとモデル更新は機密情報を漏洩する可能性があるが、悪意のあるサーバはビザンティン操作のような敵攻撃をマウントする可能性がある。
これらの脆弱性は、統合されたフレームワーク内の差分プライバシー(DP)とビザンチンの堅牢性に対処する必要性を強調している。
Byz-Clip21-SGD2Mを提案する。
論文 参考訳(メタデータ) (2026-03-24T17:39:09Z) - Spend Less, Reason Better: Budget-Aware Value Tree Search for LLM Agents [40.18150559561834]
Budget-Aware Value Tree (BAVT) は、動的検索ツリーとしてマルチホップ推論をモデル化するトレーニングフリーの推論時間フレームワークである。
BAVTは一貫して並列サンプリングベースラインを上回っている。
論文 参考訳(メタデータ) (2026-03-13T04:10:27Z) - Evidence-based Distributional Alignment for Large Language Models [58.65469623911573]
LLM分布推定の忠実度とロバスト性を改善する証拠に基づくアライメント手法であるEvi-DAを提案する。
対象国が与えられた場合、Evi-DAは関連するWorld Values Survey項目とその回答分布を検索し、オプション毎に粗いヴェルツェル値シグネチャを予測し、国条件の回答分布を構造化形式で推測する。
論文 参考訳(メタデータ) (2026-03-03T03:34:06Z) - Mitigating Reward Hacking in RLHF via Bayesian Non-negative Reward Modeling [49.41422138354821]
非負の因子分析をBradley-Terry選好モデルに統合する原理的報酬モデリングフレームワークを提案する。
BNRMは、スパースで非負の潜在因子生成過程を通じて報酬を表す。
BNRMは報酬の過度な最適化を著しく軽減し、分布シフトによるロバスト性を改善し、強いベースラインよりも解釈可能な報酬分解をもたらすことを示す。
論文 参考訳(メタデータ) (2026-02-11T08:14:11Z) - Outcome-Grounded Advantage Reshaping for Fine-Grained Credit Assignment in Mathematical Reasoning [60.00161035836637]
グループ相対政策最適化は、推論タスクのための有望な批判のない強化学習パラダイムとして登場した。
我々は,各トークンがモデルの最終回答にどの程度影響するかに基づいて,利益を再分配する,きめ細かい信用割当機構であるOutcome-grounded Advantage Reshaping (OAR)を紹介した。
OAR-Gは計算オーバーヘッドを無視して同等のゲインを達成し、どちらも強力なGRPOベースラインをはるかに上回っている。
論文 参考訳(メタデータ) (2026-01-12T10:48:02Z) - Information-Theoretic Reward Modeling for Stable RLHF: Detecting and Mitigating Reward Hacking [78.69179041551014]
本稿では,インフォメーション・ボトルネックの原理に基づく情報理論報酬モデリングフレームワークを提案する。
InfoRMは、報酬の一般化を緩和するために、嗜好に無関係な情報をフィルタリングする。
IBLは分散レベルの正規化であり、そのような偏差を罰し、最適化の展望を効果的に拡張する。
論文 参考訳(メタデータ) (2025-10-15T15:51:59Z) - Data-Driven Calibration of Prediction Sets in Large Vision-Language Models Based on Inductive Conformal Prediction [0.0]
動的しきい値キャリブレーションとクロスモーダル整合性検証を統合したモデル非依存不確実性定量化法を提案する。
このフレームワークは、様々なキャリブレーションとテストの分割比で安定したパフォーマンスを実現し、医療、自律システム、その他の安全に敏感な領域における現実的な展開の堅牢性を強調している。
この研究は、マルチモーダルAIシステムにおける理論的信頼性と実用性の間のギャップを埋め、幻覚検出と不確実性を考慮した意思決定のためのスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2025-04-24T15:39:46Z) - Distributional Robustness and Regularization in Reinforcement Learning [62.23012916708608]
経験値関数の新しい正規化器を導入し、ワッサーシュタイン分布のロバストな値関数を下限とすることを示す。
強化学習における$textitexternalな不確実性に対処するための実用的なツールとして正規化を使用することを提案する。
論文 参考訳(メタデータ) (2020-03-05T19:56:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。