論文の概要: Statistical Matching via Schrödinger Bridge beyond Conditional Independence
- arxiv url: http://arxiv.org/abs/2606.22770v1
- Date: Mon, 22 Jun 2026 02:19:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 04:48:43.870682
- Title: Statistical Matching via Schrödinger Bridge beyond Conditional Independence
- Title(参考訳): シュレーディンガー橋を経由した統計的マッチング
- Authors: Eunho Koo, Tongseok Lim, Jinwon Sohn,
- Abstract要約: 予測統計的マッチングのための新しい依存性を考慮したSchrdingerブリッジを提案する。
私たちのアプローチは、保守的なCIAのベースラインを傾けることによって、2つの分離されたデータベースを結合します。
依存関係を意識した補完がダウンストリーム予測ユーティリティを継続的に改善していることを示します。
- 参考スコア(独自算出の注目度): 2.7719338074999538
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Statistical matching combines partially overlapping datasets that share covariates $X$ but observe the target $Y$ and auxiliary variables $Z$ separately. Classical approaches typically invoke the conditional independence assumption (CIA), which makes the problem identifiable but fundamentally implies that the imported auxiliary variable provides no additional predictive power for $Y$ once $X$ is known. To capture this latent $Y$--$Z$ dependence, we propose a novel dependency-aware Schrödinger bridge for predictive statistical matching. Our approach couples the two separated databases by tilting the conservative CIA baseline with a transportation-based compatibility cost, recovering an informative joint distribution. The resulting statistical learning framework yields full probabilistic posterior rules for bidirectional imputation. Theoretically, we establish a sufficient condition under which the learned bridge strictly improves over the CIA baseline, alongside an exact joint recovery guarantee in the Gaussian setting under an appropriate cost. Across synthetic benchmarks and real-world datasets (CelebA and Adult), we demonstrate that our dependency-aware completion consistently improves downstream predictive utility, proving especially beneficial in settings like data recoding where the underlying population exhibits strong $Y$--$Z$ dependence.
- Abstract(参考訳): 統計的マッチングは、共変量$X$を共有するが、ターゲット$Y$と補助変数$Z$を別々に観察する部分重複データセットを組み合わせる。
古典的なアプローチは典型的には条件付き独立仮定(CIA)を呼び起こすが、これは問題の特定を可能にするが、基本的には、輸入された補助変数が$X$が知られているならば$Y$に対して追加の予測力を与えないことを意味する。
この潜伏した$Y$--$Z$の依存を捉えるために、予測統計マッチングのための新しい依存性を意識したシュレーディンガー橋を提案する。
我々のアプローチは、保守的なCIAベースラインを輸送ベースの互換性コストで傾けて、情報的な共同配布を回復することで、2つの分離されたデータベースを結合する。
得られた統計的学習フレームワークは、双方向計算のための完全な確率論的後続規則を生成する。
理論的には、学習された橋梁がCIAベースラインに対して厳格に改善され、適切なコストでガウシアンセッティングにおける正確な共同回復保証が確立される十分な条件を確立する。
人工的なベンチマークと実世界のデータセット(CelebAとアダルト)を通じて、我々の依存性を意識したコンプリートは、下流予測ユーティリティを一貫して改善し、基礎となる人口が強い$Y$--$Z$に依存するデータ再コーディングのような設定で特に有益であることを示す。
関連論文リスト
- Tight Convergence Rates for Online Distributed Linear Estimation with Adversarial Measurements [66.94250413799232]
分散パラメータ-サーバ-ワーカー設定における乱数ベクトル$X$の推定について検討する。
主な課題は、敵の計測と非同期である。
その結果, 分散線形推定におけるロバスト性, 識別性, 統計的効率の統一的有限時間評価が得られた。
論文 参考訳(メタデータ) (2026-04-07T11:45:55Z) - PRISM: Differentially Private Synthetic Data with Structure-Aware Budget Allocation for Prediction [9.016539021471845]
差分プライバシー(DP)は、相手が解放されたデータからどんな個人について学べるかを制限する数学的保証を提供する。
既存のDP合成データ手法は、データが特定の予測タスクに役立つ場合でも、全ての特徴を対称に扱い、ノイズを均一に拡散する。
我々は、利用可能な構造知識に依存して、3つの体制で機能する予測中心のアプローチを開発する。
論文 参考訳(メタデータ) (2026-02-10T19:17:55Z) - Dependence-Aware Label Aggregation for LLM-as-a-Judge via Ising Models [55.94503936470247]
大規模なAI評価は、審査員を含む、$K$アノテータからのバイナリ判断を集約することにますます依存している。
ほとんどの古典的なメソッドは、アノテータが条件的に独立であると仮定するが、真のラベルは$Yin0,1$であり、この仮定は LLM の審査員によってしばしば違反される。
我々はIsingグラフィカルモデルと潜在因子に基づく依存認識モデルの階層構造を通してラベルアグリゲーションを研究する。
論文 参考訳(メタデータ) (2026-01-29T21:26:50Z) - SGD with Dependent Data: Optimal Estimation, Regret, and Inference [3.038061705362137]
勾配降下 (SGD) は, 広範囲の段階的スケジュールと探索率スキームの下で, 独立情報と依存情報の両方に対応できることが示されている。
SGDは統計的に最適な推定誤差と後悔を同時に達成し,既存の結果を拡張し,改善することを示す。
オンラインのスパースレグレッションのために、我々はSGDベースの新しいアルゴリズムを開発し、ストレージの$d$のみを使用し、1イテレーションあたり$O(d)$フロップを必要とする。
論文 参考訳(メタデータ) (2026-01-04T04:52:11Z) - Regression-Based Estimation of Causal Effects in the Presence of Selection Bias and Confounding [52.1068936424622]
治療が介入によって設定された場合、対象変数$Y$に対して、予測因果効果$E[Y|do(X)]$を推定する問題を考える。
選択バイアスや欠点のない設定では、$E[Y|do(X)] = E[Y|X]$ となる。
選択バイアスとコンバウンディングの両方を組み込んだフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-26T13:43:37Z) - Beyond Covariance Matrix: The Statistical Complexity of Private Linear Regression [66.93988594607842]
プライバシー制約の下では、プライベート線形回帰の複雑さは通常の共分散行列によって捉えられる。
最適率を達成するための情報重み付け回帰手法を提案する。
特に、我々の結果は、共同プライバシーは追加費用がほとんどないことを示している。
論文 参考訳(メタデータ) (2025-02-18T18:35:24Z) - An Interpretable Measure for Quantifying Predictive Dependence between Continuous Random Variables -- Extended Version [0.0]
連続変数 $X$ と $Y$ の関連度を評価する新しい尺度を導入する。
この尺度の重要な利点は、その解釈可能性である。
我々は,90,000以上の実・合成データセットを用いて測定結果の評価を行った。
論文 参考訳(メタデータ) (2025-01-18T16:25:20Z) - Sparse PCA with Oracle Property [115.72363972222622]
新規な正規化を伴うスパースPCAの半定緩和に基づく推定器群を提案する。
我々は、家族内の別の推定器が、スパースPCAの標準半定緩和よりも、より急激な収束率を達成することを証明した。
論文 参考訳(メタデータ) (2023-12-28T02:52:54Z) - A Robustness Analysis of Blind Source Separation [91.3755431537592]
ブラインドソース分離(BSS)は、変換$f$が可逆であるが未知であるという条件の下で、その混合である$X=f(S)$から観測されていない信号を復元することを目的としている。
このような違反を分析し、その影響を$X$から$S$のブラインドリカバリに与える影響を定量化するための一般的なフレームワークを提案する。
定義された構造的仮定からの偏差に対する一般的なBSS溶出は、明示的な連続性保証という形で、利益的に分析可能であることを示す。
論文 参考訳(メタデータ) (2023-03-17T16:30:51Z) - Outlier-Robust Optimal Transport: Duality, Structure, and Statistical
Applications [25.410110072480187]
ワッサーシュタイン距離は、考慮された分布における外れ値に敏感である。
本稿では, 汚染された各分布から, $varepsilon$outlier mass を除去できる新しいoutlier-robust Wasserstein distance $mathsfW_pvarepsilon$を提案する。
論文 参考訳(メタデータ) (2021-11-02T04:05:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。