論文の概要: Minimax Regret Learning for Data with Heterogeneous Subgroups
- arxiv url: http://arxiv.org/abs/2405.01709v2
- Date: Sat, 27 Sep 2025 02:57:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:18.655839
- Title: Minimax Regret Learning for Data with Heterogeneous Subgroups
- Title(参考訳): 不均質な部分群を持つデータに対するMinimaxレグレト学習
- Authors: Weibin Mo, Weijing Tang, Songkai Xue, Yufeng Liu, Ji Zhu,
- Abstract要約: サブポピュレーションの不均一性の存在下では、堅牢で一般化可能な学習方法を開発することが不可欠である。
本研究では,複数のトレーニング集団から目に見えないテスト集団への一般化を目的とした,分布のない頑健な階層モデルについて考察する。
頑健な階層モデルの下では、経験的MMRは、トレーニング人口と目に見えないテスト人口のそれぞれについて、後悔の保証を享受することができる。
- 参考スコア(独自算出の注目度): 9.824542607612962
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern complex datasets often consist of various sub-populations with known group information. In the presence of sub-population heterogeneity, it is crucial to develop robust and generalizable learning methods that (1) can enjoy robust performance on each of the training populations, and (2) is generalizable to an unseen testing population. While various min-max formulations have been proposed to achieve (1) in the robust learning literature, their generalization to an unseen testing is less explored. Moreover, a general min-max formulation can be sensitive to the noise heterogeneity, and, in the extreme case, be degenerate such that a single high-noise population dominates. The min-max-regret (MMR) can mitigate these challenges. In this work, we consider a distribution-free robust hierarchical model for the generalization from multiple training populations to an unseen testing population. Under the robust hierarchical model, the empirical MMR can enjoy the regret guarantees on each of the training populations as well as the unseen testing population. We further specialize the general MMR framework to linear regression and generalized linear model, where we characterize the geometry of MMR and its distinction from other robust methods. We demonstrate the effectiveness of MMR through extensive simulation studies and an application to image recognition.
- Abstract(参考訳): 現代の複雑なデータセットは、しばしば既知のグループ情報を持つ様々なサブ集団から構成される。
サブ集団の不均一性の存在下では,(1)訓練個体群ごとの堅牢なパフォーマンスを享受し,(2)検査個体群に対して一般化可能な,堅牢で一般化可能な学習手法を開発することが重要である。
頑健な学習文献において、(1)を達成するために様々な min-max の定式化が提案されているが、その未確認テストへの一般化は研究されていない。
さらに、一般的な min-max の定式化はノイズの不均一性に敏感であり、極端な場合、1つの高雑音の集団が支配するように退化することができる。
min-max-regret (MMR) はこれらの課題を軽減することができる。
本研究では,複数のトレーニング集団から目に見えないテスト集団への一般化を目的とした,分布のない頑健な階層モデルについて考察する。
頑健な階層モデルの下では、経験的MMRは、トレーニング人口と目に見えないテスト人口のそれぞれについて、後悔の保証を享受することができる。
さらに、一般的なMMRフレームワークを線形回帰および一般化線形モデルに特化し、MMRの幾何学と他のロバストな手法との区別を特徴付ける。
我々は、広範囲なシミュレーション研究を通してMMRの有効性を実証し、画像認識への応用について述べる。
関連論文リスト
- Diverse Prototypical Ensembles Improve Robustness to Subpopulation Shift [10.04893653044606]
サブポピュレーションシフトは、機械学習モデルの性能を著しく低下させる可能性がある。
本稿では,多様な分類器のアンサンブルを用いて,サブポピュレーションに関連するリスクを適応的に捉えることを提案する。
DPE(Diverse Prototypeal Ensembles)の手法は、しばしば、最悪のグループ精度で先行技術よりも優れている。
論文 参考訳(メタデータ) (2025-05-29T03:12:56Z) - U-aggregation: Unsupervised Aggregation of Multiple Learning Algorithms [4.871473117968554]
新人口の強化とロバスト化のための教師なしモデルアグリゲーション手法U-アグリゲーションを提案する。
既存の教師付きモデルアグリゲーションや超学習者アプローチとは異なり、U-アグリゲーションは対象人口の観測されたラベルや成果を仮定しない。
複雑な形質の遺伝的リスク予測を高めるために,U凝集を用いた実世界の応用の可能性を示す。
論文 参考訳(メタデータ) (2025-01-30T01:42:51Z) - Boosting Test Performance with Importance Sampling--a Subpopulation Perspective [16.678910111353307]
本稿では,重要なサンプリングを,サブポピュレーション問題を解決するためのシンプルかつ強力なツールとして同定する。
サブポピュレーション問題の新しい体系的定式化を行い、既存の研究で明確に述べられていない仮定を明確に特定する。
アプリケーション側では、サブポピュレーション問題を解決するのに十分な1つの推定器を実証する。
論文 参考訳(メタデータ) (2024-12-17T15:25:24Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Multi-dimensional domain generalization with low-rank structures [18.565189720128856]
統計的および機械学習の手法では、テストデータがトレーニングデータと同一に分散されていると仮定されるのが一般的である。
この仮定は必ずしも成り立たないが、特にトレーニングデータに対象の個体群がよく表現されていないアプリケーションでは顕著である。
線形回帰モデルにおいて,この問題に対処するための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-09-18T08:07:58Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Modeling the Q-Diversity in a Min-max Play Game for Robust Optimization [61.39201891894024]
群分布的ロバスト最適化(群 DRO)は、事前定義された群に対する最悪の損失を最小限にすることができる。
グループDROフレームワークをQ-Diversityを提案して再構築する。
インタラクティブなトレーニングモードによって特徴付けられるQ-Diversityは、アノテーションからグループ識別を緩和し、直接パラメータ化を行う。
論文 参考訳(メタデータ) (2023-05-20T07:02:27Z) - Ranking & Reweighting Improves Group Distributional Robustness [14.021069321266516]
本研究では,DRU(Discounted Rank Upweighting)と呼ばれるランキングベースのトレーニング手法を提案し,テストデータ上で強力なOOD性能を示すモデルを学習する。
いくつかの合成および実世界のデータセットの結果は、群分布シフトに頑健なモデルの選択と学習において、グループレベルの(ソフトミニマックスと異なり)アプローチの優れた能力を浮き彫りにしている。
論文 参考訳(メタデータ) (2023-05-09T20:37:16Z) - Reweighted Mixup for Subpopulation Shift [63.1315456651771]
サブポピュレーションシフトは、多くの実世界のアプリケーションに存在し、同じサブポピュレーショングループを含むが異なるサブポピュレーション比率を持つトレーニングとテストの分布を指す。
重要度再重み付けは、サブポピュレーションシフトを処理する古典的で効果的な方法である。
我々は、オーバーフィッティング問題を緩和するために、reweighted mixupと呼ばれるシンプルで実用的なフレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-09T03:44:50Z) - UMIX: Improving Importance Weighting for Subpopulation Shift via
Uncertainty-Aware Mixup [44.0372420908258]
サブポピュレーションシフトは、多くの現実世界の機械学習アプリケーションに大きく存在する。
重要度再重み付けは、サブポピュレーションシフト問題に対処するための通常の方法である。
オーバーフィッティング問題を緩和するために,不確実性を考慮した混合(Umix)を提案する。
論文 参考訳(メタデータ) (2022-09-19T11:22:28Z) - Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。
パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T12:43:12Z) - A Deep Variational Approach to Clustering Survival Data [5.871238645229228]
変分深層クラスタリングにおけるクラスタサバイバルデータに対する新しい確率的アプローチを提案する。
提案手法は,説明変数と潜在的に検閲された生存時間の両方の分布を明らかにするために,深い生成モデルを用いている。
論文 参考訳(メタデータ) (2021-06-10T14:10:25Z) - Distributionally Robust Losses for Latent Covariate Mixtures [28.407773942857148]
与えられたサイズの全てのサブポピュレーションに対して最悪のケース性能を制御する凸手順を提案する。
我々は, 語彙的類似性, ワイン品質, リシディミズム予測タスクを観察し, 最悪のケースでは, 未知のサブ集団に対して良好に作用するモデルを学習する。
論文 参考訳(メタデータ) (2020-07-28T04:16:27Z) - Learning Diverse Representations for Fast Adaptation to Distribution
Shift [78.83747601814669]
本稿では,複数のモデルを学習する手法を提案する。
分散シフトへの迅速な適応を促進するフレームワークの能力を実証する。
論文 参考訳(メタデータ) (2020-06-12T12:23:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。