論文の概要: Distributionally Robust Losses for Latent Covariate Mixtures
- arxiv url: http://arxiv.org/abs/2007.13982v2
- Date: Wed, 10 Aug 2022 18:58:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 01:34:58.686666
- Title: Distributionally Robust Losses for Latent Covariate Mixtures
- Title(参考訳): 潜在共変量混合物の分布的ロバスト損失
- Authors: John Duchi, Tatsunori Hashimoto, Hongseok Namkoong
- Abstract要約: 与えられたサイズの全てのサブポピュレーションに対して最悪のケース性能を制御する凸手順を提案する。
我々は, 語彙的類似性, ワイン品質, リシディミズム予測タスクを観察し, 最悪のケースでは, 未知のサブ集団に対して良好に作用するモデルを学習する。
- 参考スコア(独自算出の注目度): 28.407773942857148
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While modern large-scale datasets often consist of heterogeneous
subpopulations -- for example, multiple demographic groups or multiple text
corpora -- the standard practice of minimizing average loss fails to guarantee
uniformly low losses across all subpopulations. We propose a convex procedure
that controls the worst-case performance over all subpopulations of a given
size. Our procedure comes with finite-sample (nonparametric) convergence
guarantees on the worst-off subpopulation. Empirically, we observe on lexical
similarity, wine quality, and recidivism prediction tasks that our worst-case
procedure learns models that do well against unseen subpopulations.
- Abstract(参考訳): 現代の大規模なデータセットは、しばしば異質なサブ集団(例えば、複数の人口集団や複数のテキストコーパス)から構成されるが、平均損失を最小限にする標準的な慣習は、すべてのサブ集団全体での損失が均一に低いことを保証しない。
与えられたサイズの全てのサブポピュレーションに対して最悪のケース性能を制御する凸手順を提案する。
我々の手順は、最悪のサブ集団の有限サンプル(非パラメトリック)収束を保証する。
経験的に、我々の最悪の手順は、目に見えないサブポピュレーションに対してうまく動作するモデルを学習する、語彙的類似性、ワインの品質、および再分配予測タスクについて観察する。
関連論文リスト
- Theoretical Guarantees of Data Augmented Last Layer Retraining Methods [5.352699766206809]
最短グループ精度で最先端の性能を達成するために, 線形最終層再訓練戦略が示されている。
本稿では、潜在表現の分布をモデル化する際の最適最悪のグループ精度を示す。
我々は、合成データセットと大規模公開データセットの両方について、その結果を評価し、検証する。
論文 参考訳(メタデータ) (2024-05-09T17:16:54Z) - Minimax Regret Learning for Data with Heterogeneous Subgroups [12.253779655660571]
我々は、最悪のグループ後悔を最小限に抑えるため、一般的な教師付き学習のためのmin-max-regret学習フレームワークを開発する。
広範囲なシミュレーション研究を通じて本手法の有効性を実証し, 数百の移植センターからの腎臓移植データに適用した。
論文 参考訳(メタデータ) (2024-05-02T20:06:41Z) - Estimating Unknown Population Sizes Using the Hypergeometric Distribution [1.03590082373586]
総人口と構成カテゴリーの規模が不明な場合, 個別分布の推定に挑戦する。
本研究では,連続潜伏変数上での分布条件の混合となるデータ生成過程について考察する。
実験データシミュレーションにより,本手法は数値データをモデル化する他の可能性関数よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-02-22T01:53:56Z) - Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。
本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-08T16:06:29Z) - Reweighted Mixup for Subpopulation Shift [63.1315456651771]
サブポピュレーションシフトは、多くの実世界のアプリケーションに存在し、同じサブポピュレーショングループを含むが異なるサブポピュレーション比率を持つトレーニングとテストの分布を指す。
重要度再重み付けは、サブポピュレーションシフトを処理する古典的で効果的な方法である。
我々は、オーバーフィッティング問題を緩和するために、reweighted mixupと呼ばれるシンプルで実用的なフレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-09T03:44:50Z) - UMIX: Improving Importance Weighting for Subpopulation Shift via
Uncertainty-Aware Mixup [44.0372420908258]
サブポピュレーションシフトは、多くの現実世界の機械学習アプリケーションに大きく存在する。
重要度再重み付けは、サブポピュレーションシフト問題に対処するための通常の方法である。
オーバーフィッティング問題を緩和するために,不確実性を考慮した混合(Umix)を提案する。
論文 参考訳(メタデータ) (2022-09-19T11:22:28Z) - Rethinking Collaborative Metric Learning: Toward an Efficient
Alternative without Negative Sampling [156.7248383178991]
コラボレーティブ・メトリック・ラーニング(CML)パラダイムはレコメンデーション・システム(RS)分野に広く関心を集めている。
負のサンプリングが一般化誤差のバイアス付き推定に繋がることがわかった。
そこで我々は,SFCML (textitSampling-Free Collaborative Metric Learning) という名前のCMLに対して,負のサンプリングを伴わない効率的な手法を提案する。
論文 参考訳(メタデータ) (2022-06-23T08:50:22Z) - Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。
パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T12:43:12Z) - GANs with Variational Entropy Regularizers: Applications in Mitigating
the Mode-Collapse Issue [95.23775347605923]
深層学習の成功に基づいて、GAN(Generative Adversarial Networks)は、観測されたサンプルから確率分布を学習するための現代的なアプローチを提供する。
GANはしばしば、ジェネレータが入力分布の既存のすべてのモードをキャプチャできないモード崩壊問題に悩まされる。
情報理論のアプローチを採り、生成したサンプルのエントロピーの変動的下限を最大化し、それらの多様性を増大させる。
論文 参考訳(メタデータ) (2020-09-24T19:34:37Z) - Cumulative deviation of a subpopulation from the full population [0.0]
サブ人口の扱いにおける株式の評価には、全人口のすべての個人に数値的な「スコア」を割り当てることがしばしば必要である。
このようなスコアが与えられた場合、同様のスコアを持つ個人は、サブポピュレーションにおける個人のメンバーシップとは独立して、同様の結果が得られるかもしれないし、得られないかもしれない。
累積プロットは、グラフのセカント線の傾斜線として、サブポピュレーション偏差を直接エンコードする。
論文 参考訳(メタデータ) (2020-08-04T19:30:02Z) - Survival Cluster Analysis [93.50540270973927]
異なるリスクプロファイルを持つサブポピュレーションを特定するために、生存分析には未解決の必要性がある。
このニーズに対処するアプローチは、個々の成果のキャラクタリゼーションを改善する可能性が高い。
論文 参考訳(メタデータ) (2020-02-29T22:41:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。