論文の概要: Active Sampling for Min-Max Fairness
- arxiv url: http://arxiv.org/abs/2006.06879v3
- Date: Fri, 17 Jun 2022 13:19:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 12:47:00.031101
- Title: Active Sampling for Min-Max Fairness
- Title(参考訳): Min-Max Fairnessのためのアクティブサンプリング
- Authors: Jacob Abernethy, Pranjal Awasthi, Matth\"aus Kleindessner, Jamie
Morgenstern, Chris Russell, Jie Zhang
- Abstract要約: min-maxフェアネスを最適化するための簡易なアクティブサンプリングと再重み付け手法を提案する。
実装の容易さとロバストな定式化の汎用性により、不備な群におけるモデル性能を改善するための魅力的な選択肢となる。
線形回帰法やロジスティック回帰法のような凸学習問題に対しては、分極値解への収束率を証明し、きめ細かな解析を行う。
- 参考スコア(独自算出の注目度): 28.420886416425077
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose simple active sampling and reweighting strategies for optimizing
min-max fairness that can be applied to any classification or regression model
learned via loss minimization. The key intuition behind our approach is to use
at each timestep a datapoint from the group that is worst off under the current
model for updating the model. The ease of implementation and the generality of
our robust formulation make it an attractive option for improving model
performance on disadvantaged groups. For convex learning problems, such as
linear or logistic regression, we provide a fine-grained analysis, proving the
rate of convergence to a min-max fair solution.
- Abstract(参考訳): 損失最小化によって学習される任意の分類や回帰モデルに適用可能なmin-maxフェアネスを最適化するための単純なアクティブサンプリングおよび再重み付け戦略を提案する。
私たちのアプローチの背後にある重要な直観は、モデルの更新に現在のモデルの下で最悪のデータポイントを各タイムステップで使用することです。
実装の容易さとロバストな定式化の汎用性により、不備な群におけるモデル性能を改善するための魅力的な選択肢となる。
線形回帰やロジスティック回帰といった凸学習問題に対して,細粒度解析を行い,min-maxフェア解への収束率を証明した。
関連論文リスト
- Feasible Learning [78.6167929413604]
本稿では,サンプル中心の学習パラダイムであるFeasible Learning(FL)を紹介する。
大規模言語モデルにおける画像分類, 年齢回帰, 好みの最適化といった経験的分析により, FLを用いて訓練したモデルでは, 平均的性能に限界があるものの, ERMと比較して改善された尾の挙動を示しながらデータから学習できることが実証された。
論文 参考訳(メタデータ) (2025-01-24T20:39:38Z) - Adaptive Sampled Softmax with Inverted Multi-Index: Methods, Theory and Applications [79.53938312089308]
MIDX-Samplerは、逆多重インデックスアプローチに基づく新しい適応型サンプリング戦略である。
本手法は, サンプリングバイアス, 勾配バイアス, 収束速度, 一般化誤差境界などの重要な問題に対処するため, 厳密な理論的解析によって裏付けられている。
論文 参考訳(メタデータ) (2025-01-15T04:09:21Z) - Fair and Accurate Regression: Strong Formulations and Algorithms [5.93858665501805]
本稿では,メトリクスを組み込んだ回帰問題を解くための混合整数最適化手法を提案する。
公正回帰モデルのトレーニングのための正確な定式化を提案する。
最小二乗および対数回帰問題に対する数値実験は、競合統計性能を示す。
論文 参考訳(メタデータ) (2024-12-22T18:04:54Z) - Model-Free Active Exploration in Reinforcement Learning [53.786439742572995]
強化学習における探索問題について検討し,新しいモデルフリーソリューションを提案する。
我々の戦略は、最先端の探査アプローチよりも高速に効率的な政策を特定できる。
論文 参考訳(メタデータ) (2024-06-30T19:00:49Z) - Soft Preference Optimization: Aligning Language Models to Expert Distributions [40.84391304598521]
SPOは、Large Language Models (LLMs)のような生成モデルと人間の好みを整合させる手法である。
SPOは、選好損失をモデル全体の出力分布全体にわたる正規化項と統合する。
本稿では,SPOの方法論,理論的基礎,および単純さ,計算効率,アライメント精度における比較優位性について紹介する。
論文 参考訳(メタデータ) (2024-04-30T19:48:55Z) - Regression-aware Inference with LLMs [52.764328080398805]
提案手法は,一般的な回帰と評価指標に準最適であることを示す。
本稿では,ベイズ最適解を推定し,サンプル応答からクローズド形式の評価指標を推定する代替推論手法を提案する。
論文 参考訳(メタデータ) (2024-03-07T03:24:34Z) - Self-Supervised Dataset Distillation for Transfer Learning [77.4714995131992]
ラベルなしデータセットを、効率的な自己教師付き学習(SSL)のための小さな合成サンプル群に蒸留する新しい問題を提案する。
両レベル最適化におけるSSL目標に対する合成サンプルの勾配は、データ拡張やマスキングから生じるランダム性から、テキストバイアスを受けていることを最初に証明する。
転送学習を含む様々な応用における本手法の有効性を実証的に検証する。
論文 参考訳(メタデータ) (2023-10-10T10:48:52Z) - Modeling the Second Player in Distributionally Robust Optimization [90.25995710696425]
我々は、最悪のケース分布を特徴付けるために神経生成モデルを使うことを議論する。
このアプローチは多くの実装と最適化の課題をもたらします。
提案されたアプローチは、同等のベースラインよりも堅牢なモデルを生み出す。
論文 参考訳(メタデータ) (2021-03-18T14:26:26Z) - Model-based Policy Optimization with Unsupervised Model Adaptation [37.09948645461043]
本研究では,不正確なモデル推定による実データとシミュレーションデータのギャップを埋めて,より良いポリシ最適化を実現する方法について検討する。
本稿では,教師なしモデル適応を導入したモデルベース強化学習フレームワークAMPOを提案する。
提案手法は,一連の連続制御ベンチマークタスクにおけるサンプル効率の観点から,最先端の性能を実現する。
論文 参考訳(メタデータ) (2020-10-19T14:19:42Z) - Maximum Entropy Model Rollouts: Fast Model Based Policy Optimization
without Compounding Errors [10.906666680425754]
我々は、最大エントロピーモデルロールアウト(MEMR)と呼ばれるダイナスタイルモデルに基づく強化学習アルゴリズムを提案する。
複雑なエラーをなくすために、我々はモデルを使って単一ステップのロールアウトを生成する。
論文 参考訳(メタデータ) (2020-06-08T21:38:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。