論文の概要: Worst-case low-rank approximations
- arxiv url: http://arxiv.org/abs/2603.11304v1
- Date: Wed, 11 Mar 2026 21:03:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:25.644007
- Title: Worst-case low-rank approximations
- Title(参考訳): 最悪の低ランク近似
- Authors: Anya Fries, Markus Reichstein, David Blei, Jonas Peters,
- Abstract要約: この研究はwcPCAと呼ばれる統一されたフレームワークを開発し、複数のドメインにわたる最悪の(平均よりもむしろ)パフォーマンスを検討する。
経験的推定器の一貫性と最悪のケースを保証する。
生態系-大気フラックスに関するシミュレーションと2つの実世界の応用は、最悪のケースのパフォーマンスを著しく改善した。
- 参考スコア(独自算出の注目度): 6.39426320882085
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-world data in health, economics, and environmental sciences are often collected across heterogeneous domains (such as hospitals, regions, or time periods). In such settings, distributional shifts can make standard PCA unreliable, in that, for example, the leading principal components may explain substantially less variance in unseen domains than in the training domains. Existing approaches (such as FairPCA) have proposed to consider worst-case (rather than average) performance across multiple domains. This work develops a unified framework, called wcPCA, applies it to other objectives (resulting in the novel estimators such as norm-minPCA and norm-maxregret, which are better suited for applications with heterogeneous total variance) and analyzes their relationship. We prove that for all objectives, the estimators are worst-case optimal not only over the observed source domains but also over all target domains whose covariance lies in the convex hull of the (possibly normalized) source covariances. We establish consistency and asymptotic worst-case guarantees of empirical estimators. We extend our methodology to matrix completion, another problem that makes use of low-rank approximations, and prove approximate worst-case optimality for inductive matrix completion. Simulations and two real-world applications on ecosystem-atmosphere fluxes demonstrate marked improvements in worst-case performance, with only minor losses in average performance.
- Abstract(参考訳): 健康、経済学、環境科学における実世界のデータは、しばしば異質な領域(病院、地域、期間など)にまたがって収集される。
このような設定では、分散シフトは標準的なPCAを信頼できないものにすることができる。
既存のアプローチ(例えばFairPCA)では、複数のドメインにまたがる最悪の(平均よりもむしろ)パフォーマンスを検討することが提案されている。
この研究は、wcPCAと呼ばれる統一されたフレームワークを開発し、これを他の目的に応用する(ノルム-minPCAやノルム-maxregretのような、異質な全分散を持つアプリケーションに適した新しい推定器で再帰する)。
すべての目的に対して、推定子は観測されたソース領域だけでなく、(おそらく正規化された)ソース共分散の凸殻に共分散が存在する全てのターゲットドメインに対して最適であることを示す。
経験的推定器の整合性と漸近的最悪のケースを保証する。
提案手法は,低ランク近似を用いた別の問題である行列完備化まで拡張し,帰納的行列完備化の最悪の最適性を証明する。
生態系と大気のフラックスに関するシミュレーションと2つの現実世界の応用は、最悪のケースのパフォーマンスが著しく改善され、平均的なパフォーマンスはわずかに損なわれた。
関連論文リスト
- Variance Matters: Improving Domain Adaptation via Stratified Sampling [1.7188280334580195]
本稿では,ドメイン階層化サンプリング(VaRDASS)による可変化適応を提案する。
VaRDASSは、UDAの最初の特殊分散低減技術である。
3つの領域シフトデータセットの実験により、差分推定精度が向上し、対象領域のパフォーマンスが向上した。
論文 参考訳(メタデータ) (2025-12-04T20:01:04Z) - Statistical Analysis of Conditional Group Distributionally Robust Optimization with Cross-Entropy Loss [16.1456465253627]
本研究では、複数のソースドメインからラベル付きデータを入手でき、対象ドメインからラベルなしデータのみを観測できるマルチソース非教師付きドメイン適応について検討する。
本稿では,情報源領域からの条件付き結果分布の凸結合を最小化することにより,分類器を学習するグループ分散条件最適化フレームワークを提案する。
実験的なCG-DRO推定器の高速な統計的収束速度を,理論ブリッジとして機能する2つの代理極小最適化問題を構築することにより確立する。
論文 参考訳(メタデータ) (2025-07-14T04:21:23Z) - NDCG-Consistent Softmax Approximation with Accelerated Convergence [67.10365329542365]
本稿では,ランキングの指標と直接一致した新たな損失定式化を提案する。
提案したRG損失を高効率な Alternating Least Squares (ALS) 最適化手法と統合する。
実世界のデータセットに対する実証的な評価は、我々のアプローチが同等または上位のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2025-06-11T06:59:17Z) - Constrained Maximum Cross-Domain Likelihood for Domain Generalization [14.91361835243516]
ドメインの一般化は、複数のソースドメイン上で一般化可能なモデルを学ぶことを目的としている。
本稿では,異なる領域の後方分布間のKL偏差を最小限に抑える新しい領域一般化法を提案する。
Digits-DG、PACS、Office-Home、MiniDomainNetの4つの標準ベンチマークデータセットの実験は、我々のメソッドの優れたパフォーマンスを強調している。
論文 参考訳(メタデータ) (2022-10-09T03:41:02Z) - Domain-Specific Risk Minimization for Out-of-Distribution Generalization [104.17683265084757]
まず、適応性ギャップを明示的に考慮した一般化境界を確立する。
本稿では,目標に対するより良い仮説の選択を導くための効果的なギャップ推定法を提案する。
もう1つの方法は、オンラインターゲットサンプルを用いてモデルパラメータを適応させることにより、ギャップを最小化することである。
論文 参考訳(メタデータ) (2022-08-18T06:42:49Z) - Probable Domain Generalization via Quantile Risk Minimization [90.15831047587302]
ドメインの一般化は、目に見えないテスト分布でうまく機能する予測子を求める。
我々はDGのための新しい確率的フレームワークを提案し、高い確率でよく動作する予測器を学習することを目指している。
論文 参考訳(メタデータ) (2022-07-20T14:41:09Z) - On Certifying and Improving Generalization to Unseen Domains [87.00662852876177]
ドメインの一般化は、テスト時に遭遇した見知らぬドメインのパフォーマンスが高いモデルを学ぶことを目的としています。
いくつかのベンチマークデータセットを使用して、DGアルゴリズムを包括的に評価することは困難である。
我々は,任意のDG手法の最悪の性能を効率的に証明できる普遍的な認証フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-24T16:29:43Z) - Domain Generalization via Domain-based Covariance Minimization [4.414778226415752]
本稿では,領域間の条件分布の差を最小限に抑えるために,複数の領域に対する新しい分散測定法を提案する。
小規模なデータセットでは、未確認のテストデータセットよりも優れた一般化性能を示す、より良い定量的結果が得られることを示す。
論文 参考訳(メタデータ) (2021-10-12T19:30:15Z) - KL Guided Domain Adaptation [88.19298405363452]
ドメイン適応は重要な問題であり、現実世界のアプリケーションにしばしば必要である。
ドメイン適応文学における一般的なアプローチは、ソースとターゲットドメインに同じ分布を持つ入力の表現を学ぶことである。
確率的表現ネットワークにより、KL項はミニバッチサンプルにより効率的に推定できることを示す。
論文 参考訳(メタデータ) (2021-06-14T22:24:23Z) - Learning Invariant Representations and Risks for Semi-supervised Domain
Adaptation [109.73983088432364]
半教師付きドメイン適応(Semi-DA)の設定の下で不変表現とリスクを同時に学習することを目的とした最初の手法を提案する。
共同で textbfLearning textbfInvariant textbfRepresentations と textbfRisks の LIRR アルゴリズムを導入する。
論文 参考訳(メタデータ) (2020-10-09T15:42:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。