論文の概要: Minimax Regret Learning for Data with Heterogeneous Subgroups
- arxiv url: http://arxiv.org/abs/2405.01709v1
- Date: Thu, 2 May 2024 20:06:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-06 14:34:45.222934
- Title: Minimax Regret Learning for Data with Heterogeneous Subgroups
- Title(参考訳): 不均質な部分群を持つデータに対するMinimaxレグレト学習
- Authors: Weibin Mo, Weijing Tang, Songkai Xue, Yufeng Liu, Ji Zhu,
- Abstract要約: 我々は、最悪のグループ後悔を最小限に抑えるため、一般的な教師付き学習のためのmin-max-regret学習フレームワークを開発する。
広範囲なシミュレーション研究を通じて本手法の有効性を実証し, 数百の移植センターからの腎臓移植データに適用した。
- 参考スコア(独自算出の注目度): 12.253779655660571
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern complex datasets often consist of various sub-populations. To develop robust and generalizable methods in the presence of sub-population heterogeneity, it is important to guarantee a uniform learning performance instead of an average one. In many applications, prior information is often available on which sub-population or group the data points belong to. Given the observed groups of data, we develop a min-max-regret (MMR) learning framework for general supervised learning, which targets to minimize the worst-group regret. Motivated from the regret-based decision theoretic framework, the proposed MMR is distinguished from the value-based or risk-based robust learning methods in the existing literature. The regret criterion features several robustness and invariance properties simultaneously. In terms of generalizability, we develop the theoretical guarantee for the worst-case regret over a super-population of the meta data, which incorporates the observed sub-populations, their mixtures, as well as other unseen sub-populations that could be approximated by the observed ones. We demonstrate the effectiveness of our method through extensive simulation studies and an application to kidney transplantation data from hundreds of transplant centers.
- Abstract(参考訳): 現代の複雑なデータセットは、しばしば様々なサブ集団から構成される。
サブポピュレーションの不均一性の存在下でのロバストで一般化可能な手法を開発するためには,平均的な手法ではなく,一様学習性能を保証することが重要である。
多くのアプリケーションでは、データポイントがどのサブポピュレーションやグループに属しているかという事前情報が得られる。
観察されたデータ群を考慮し,最悪のグループ後悔を最小限に抑えるため,一般教師あり学習のためのMMR学習フレームワークを開発した。
後悔に基づく決定論の枠組みから動機づけられたMMRは,既存の文献における価値に基づく,あるいはリスクに基づく頑健な学習方法と区別される。
後悔の基準は、いくつかの頑丈さと不変性を同時に特徴付ける。
一般化可能性の観点からは,観察されたサブポピュレーション,それらの混合物,および観察されたサブポピュレーションによって近似できる他の未確認サブポピュレーションを組み込んだメタデータのスーパーポピュレーションに対する最悪の後悔の理論的保証を開発する。
広範囲なシミュレーション研究を通じて本手法の有効性を実証し, 数百の移植センターからの腎臓移植データに適用した。
関連論文リスト
- Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Multi-dimensional domain generalization with low-rank structures [18.565189720128856]
統計的および機械学習の手法では、テストデータがトレーニングデータと同一に分散されていると仮定されるのが一般的である。
この仮定は必ずしも成り立たないが、特にトレーニングデータに対象の個体群がよく表現されていないアプリケーションでは顕著である。
線形回帰モデルにおいて,この問題に対処するための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-09-18T08:07:58Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Modeling the Q-Diversity in a Min-max Play Game for Robust Optimization [61.39201891894024]
群分布的ロバスト最適化(群 DRO)は、事前定義された群に対する最悪の損失を最小限にすることができる。
グループDROフレームワークをQ-Diversityを提案して再構築する。
インタラクティブなトレーニングモードによって特徴付けられるQ-Diversityは、アノテーションからグループ識別を緩和し、直接パラメータ化を行う。
論文 参考訳(メタデータ) (2023-05-20T07:02:27Z) - Ranking & Reweighting Improves Group Distributional Robustness [14.021069321266516]
本研究では,DRU(Discounted Rank Upweighting)と呼ばれるランキングベースのトレーニング手法を提案し,テストデータ上で強力なOOD性能を示すモデルを学習する。
いくつかの合成および実世界のデータセットの結果は、群分布シフトに頑健なモデルの選択と学習において、グループレベルの(ソフトミニマックスと異なり)アプローチの優れた能力を浮き彫りにしている。
論文 参考訳(メタデータ) (2023-05-09T20:37:16Z) - Reweighted Mixup for Subpopulation Shift [63.1315456651771]
サブポピュレーションシフトは、多くの実世界のアプリケーションに存在し、同じサブポピュレーショングループを含むが異なるサブポピュレーション比率を持つトレーニングとテストの分布を指す。
重要度再重み付けは、サブポピュレーションシフトを処理する古典的で効果的な方法である。
我々は、オーバーフィッティング問題を緩和するために、reweighted mixupと呼ばれるシンプルで実用的なフレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-09T03:44:50Z) - UMIX: Improving Importance Weighting for Subpopulation Shift via
Uncertainty-Aware Mixup [44.0372420908258]
サブポピュレーションシフトは、多くの現実世界の機械学習アプリケーションに大きく存在する。
重要度再重み付けは、サブポピュレーションシフト問題に対処するための通常の方法である。
オーバーフィッティング問題を緩和するために,不確実性を考慮した混合(Umix)を提案する。
論文 参考訳(メタデータ) (2022-09-19T11:22:28Z) - Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。
パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T12:43:12Z) - A Deep Variational Approach to Clustering Survival Data [5.871238645229228]
変分深層クラスタリングにおけるクラスタサバイバルデータに対する新しい確率的アプローチを提案する。
提案手法は,説明変数と潜在的に検閲された生存時間の両方の分布を明らかにするために,深い生成モデルを用いている。
論文 参考訳(メタデータ) (2021-06-10T14:10:25Z) - Distributionally Robust Losses for Latent Covariate Mixtures [28.407773942857148]
与えられたサイズの全てのサブポピュレーションに対して最悪のケース性能を制御する凸手順を提案する。
我々は, 語彙的類似性, ワイン品質, リシディミズム予測タスクを観察し, 最悪のケースでは, 未知のサブ集団に対して良好に作用するモデルを学習する。
論文 参考訳(メタデータ) (2020-07-28T04:16:27Z) - Learning Diverse Representations for Fast Adaptation to Distribution
Shift [78.83747601814669]
本稿では,複数のモデルを学習する手法を提案する。
分散シフトへの迅速な適応を促進するフレームワークの能力を実証する。
論文 参考訳(メタデータ) (2020-06-12T12:23:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。