論文の概要: Causal Representation Learning with Optimal Compression under Complex Treatments
- arxiv url: http://arxiv.org/abs/2603.11907v1
- Date: Thu, 12 Mar 2026 13:20:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:26.101439
- Title: Causal Representation Learning with Optimal Compression under Complex Treatments
- Title(参考訳): 複雑な治療における最適圧縮による因果表現学習
- Authors: Wanting Liang, Haoang Chi, Zhiheng Zhang,
- Abstract要約: 本稿では, 新たな多処理一般化境界を導出し, 最適バランスウェイトの理論推定器を提案する。
提案手法は,特に大規模介入シナリオにおいて,推定精度と効率において従来のモデルよりも著しく優れている。
- 参考スコア(独自算出の注目度): 10.945117945979566
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating Individual Treatment Effects (ITE) in multi-treatment scenarios faces two critical challenges: the Hyperparameter Selection Dilemma for balancing weights and the Curse of Dimensionality in computational scalability. This paper derives a novel multi-treatment generalization bound and proposes a theoretical estimator for the optimal balancing weight $α$, eliminating expensive heuristic tuning. We investigate three balancing strategies: Pairwise, One-vs-All (OVA), and Treatment Aggregation. While OVA achieves superior precision in low-dimensional settings, our proposed Treatment Aggregation ensures both accuracy and O(1) scalability as the treatment space expands. Furthermore, we extend our framework to a generative architecture, Multi-Treatment CausalEGM, which preserves the Wasserstein geodesic structure of the treatment manifold. Experiments on semi-synthetic and image datasets demonstrate that our approach significantly outperforms traditional models in estimation accuracy and efficiency, particularly in large-scale intervention scenarios.
- Abstract(参考訳): 多処理シナリオにおける個別処理効果(ITE)の推定には、重みのバランスをとるハイパーパラメータ選択ジレンマと、計算スケーラビリティにおける次元の曲線の2つの重要な課題がある。
本稿では,新しい多処理一般化境界を導出し,高コストなヒューリスティックチューニングを排除し,最適バランスウェイトを$α$とする理論推定器を提案する。
Pairwise, One-vs-All (OVA), Treatment Aggregationの3つのバランス戦略について検討した。
OVAは低次元設定において優れた精度を実現するが,提案する処理集約は処理空間が拡大するにつれて,精度とO(1)スケーラビリティの両方を保証する。
さらに、我々は、このフレームワークを、処理多様体のワッサーシュタイン測地構造を保存する生成的アーキテクチャであるMulti-Treatment CausalEGMに拡張する。
半合成および画像データセットの実験により、我々のアプローチは、特に大規模介入シナリオにおいて、推定精度と効率において従来のモデルよりも大幅に優れていることが示された。
関連論文リスト
- How to Set the Learning Rate for Large-Scale Pre-training? [73.03133634525635]
我々はこの調査を2つの異なる研究パラダイムであるフィッティングとトランスファーに定式化する。
フィッティングパラダイムでは,探索係数のスケーリング法則を導入し,O(n3) から O(n*C_D*C_) への探索複雑性を予測モデルにより効果的に低減する。
我々は、$Transferの原則をMixture of Experts (MoE)アーキテクチャに拡張し、モデル深さ、重量減衰、トークン水平線を含む適用範囲を広げる。
論文 参考訳(メタデータ) (2026-01-08T15:55:13Z) - Hadamard-Riemannian Optimization for Margin-Variance Ensemble [0.0]
本稿では,損失関数に差分分散を明示的に組み込んだ新しいアンサンブル学習フレームワークを提案する。
提案手法は負の予測マージンとその分散を共同で最適化し,ロバスト性の向上と一般化性能の向上に繋がった。
論文 参考訳(メタデータ) (2025-09-12T12:28:39Z) - Stochastic Optimization with Optimal Importance Sampling [49.484190237840714]
本稿では,両者の時間的分離を必要とせずに,意思決定とIS分布を共同で更新する反復型アルゴリズムを提案する。
本手法は,IS分布系に対する目的的,軽度な仮定の凸性の下で,最小の変数分散を達成し,大域収束を保証する。
論文 参考訳(メタデータ) (2025-04-04T16:10:18Z) - Sparse Mixture-of-Experts for Compositional Generalization: Empirical Evidence and Theoretical Foundations of Optimal Sparsity [89.81738321188391]
本研究では,SMoEモデルにおけるタスク複雑性と最適空間の関係について検討する。
最適な間隔は、最小限のアクティベーション(1-2専門家)とフルアクティベーションの間にあり、その正確な数はタスクの複雑さに比例する。
論文 参考訳(メタデータ) (2024-10-17T18:40:48Z) - A Hybrid Sampling and Multi-Objective Optimization Approach for Enhanced Software Defect Prediction [3.407555189785573]
本稿では,ハイブリッドサンプリング技術と多目的最適化アルゴリズムを組み合わせた新しいSDPフレームワークを提案する。
提案モデルは,多目的最適化による特徴融合を適用し,一般化能力と予測の安定性を両立させる。
NASAとPROMISEリポジトリのデータセットで実施された実験は、提案されたハイブリッドサンプリングと多目的最適化アプローチがデータのバランスを改善し、冗長な特徴を排除し、予測精度を高めることを示した。
論文 参考訳(メタデータ) (2024-10-13T23:39:04Z) - Ensemble Prediction via Covariate-dependent Stacking [0.0]
本研究では,CDST (covariate-dependent stacking) という,アンサンブル予測の新しい手法を提案する。
従来の積み重ね法やモデル平均化法とは異なり、CDSTはモデルの重みを共変量の関数として柔軟に変化させることができる。
以上の結果から,CDSTは複雑性・時間的予測問題に特に有用であるが有用ではないことが示唆された。
論文 参考訳(メタデータ) (2024-08-19T07:31:31Z) - Generalization Bounds of Surrogate Policies for Combinatorial Optimization Problems [53.03951222945921]
我々はスムーズな(摂動された)ポリシーを解析し、線形オラクルが使用する方向に対して制御されたランダムな摂動を付加する。
我々の主な貢献は、過剰リスクを摂動バイアス、統計的推定誤差、最適化誤差に分解する一般化境界である。
車両のスケジューリングやスムーズ化がトラクタブルトレーニングと制御された一般化の両方を可能にしていることを示す。
論文 参考訳(メタデータ) (2024-07-24T12:00:30Z) - Double Duality: Variational Primal-Dual Policy Optimization for
Constrained Reinforcement Learning [132.7040981721302]
本研究では,訪問尺度の凸関数を最小化することを目的として,制約付き凸決定プロセス(MDP)について検討する。
制約付き凸MDPの設計アルゴリズムは、大きな状態空間を扱うなど、いくつかの課題に直面している。
論文 参考訳(メタデータ) (2024-02-16T16:35:18Z) - A Deep Unrolling Model with Hybrid Optimization Structure for Hyperspectral Image Deconvolution [50.13564338607482]
本稿では,DeepMixと呼ばれるハイパースペクトルデコンボリューション問題に対する新しい最適化フレームワークを提案する。
これは3つの異なるモジュール、すなわちデータ一貫性モジュール、手作りの正規化器の効果を強制するモジュール、および装飾モジュールで構成されている。
本研究は,他のモジュールの協調作業によって達成される進歩を維持するために設計された,文脈を考慮した認知型モジュールを提案する。
論文 参考訳(メタデータ) (2023-06-10T08:25:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。