論文の概要: Supervised Learning with General Risk Functionals
- arxiv url: http://arxiv.org/abs/2206.13648v1
- Date: Mon, 27 Jun 2022 22:11:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-29 12:31:05.500599
- Title: Supervised Learning with General Risk Functionals
- Title(参考訳): リスク関数を用いた教師付き学習
- Authors: Liu Leqi, Audrey Huang, Zachary C. Lipton, Kamyar Azizzadenesheli
- Abstract要約: 標準一様収束結果は、予想損失の予想損失の一般化ギャップを仮説クラスに束縛する。
我々は、損失分布のCDFを推定するための最初の一様収束結果を確立し、すべてのH"古いリスク関数と全ての仮説の両方に同時に保持する保証を与える。
- 参考スコア(独自算出の注目度): 28.918233583859134
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Standard uniform convergence results bound the generalization gap of the
expected loss over a hypothesis class. The emergence of risk-sensitive learning
requires generalization guarantees for functionals of the loss distribution
beyond the expectation. While prior works specialize in uniform convergence of
particular functionals, our work provides uniform convergence for a general
class of H\"older risk functionals for which the closeness in the Cumulative
Distribution Function (CDF) entails closeness in risk. We establish the first
uniform convergence results for estimating the CDF of the loss distribution,
yielding guarantees that hold simultaneously both over all H\"older risk
functionals and over all hypotheses. Thus licensed to perform empirical risk
minimization, we develop practical gradient-based methods for minimizing
distortion risks (widely studied subset of H\"older risks that subsumes the
spectral risks, including the mean, conditional value at risk, cumulative
prospect theory risks, and others) and provide convergence guarantees. In
experiments, we demonstrate the efficacy of our learning procedure, both in
settings where uniform convergence results hold and in high-dimensional
settings with deep networks.
- Abstract(参考訳): 標準一様収束結果は、予想される損失の仮説クラスに対する一般化ギャップを束縛する。
リスクに敏感な学習の出現は、期待を超えて損失分布の機能の一般化を要求する。
先行研究は特定の汎関数の一様収束を専門とするが、本研究は、累積分布関数(cdf)の近接性がリスクの近さを伴うh\"older risk functionalsの一般クラスに対して一様収束を与える。
我々は、損失分布のCDFを推定するための最初の一様収束結果を確立し、すべてのH\"古いリスク関数と全ての仮説の両方に同時に保持する保証を与える。
そこで, 経験的リスク最小化を許可し, ひずみリスク(平均, 条件値, 累積予測理論リスクなど, スペクトルリスクを仮定したh\"より古いリスクのサブセットを広く研究した)を最小化するための, 実用的な勾配に基づく手法を開発し, 収束保証を提供する。
実験では、一様収束結果が保持される設定と、深層ネットワークを用いた高次元設定の両方において、学習手順の有効性を示す。
関連論文リスト
- Provable Risk-Sensitive Distributional Reinforcement Learning with
General Function Approximation [54.61816424792866]
本稿では,リスク感性分布強化学習(RS-DisRL)と静的リプシッツリスク対策(LRM),一般関数近似について紹介する。
モデルに基づく関数近似のためのモデルベース戦略であるtextttRS-DisRL-M と、一般値関数近似のためのモデルフリーアプローチである textttRS-DisRL-V の2つの革新的なメタアルゴリズムを設計する。
論文 参考訳(メタデータ) (2024-02-28T08:43:18Z) - Strong Duality Relations in Nonconvex Risk-Constrained Learning [0.0]
一般無限次元バナッハ空間に対する J. J. Uhl の凸性は A. A. Lynovs の拡張である。
我々は,制約付き分類と回帰を統一レンズで処理できることを示し,現在の文献で実施されている一定の制約的仮定は,新たな最先端技術であることを示した。
論文 参考訳(メタデータ) (2023-12-02T11:21:00Z) - Pitfall of Optimism: Distributional Reinforcement Learning by
Randomizing Risk Criterion [9.35556128467037]
本稿では,リスクの一方的な傾向を避けるために,リスク基準のランダム化によって行動を選択する新しい分散強化学習アルゴリズムを提案する。
理論的結果は,提案手法がバイアス探索に該当せず,最適回帰に収束することが保証されていることを裏付けるものである。
論文 参考訳(メタデータ) (2023-10-25T10:53:04Z) - Non-Asymptotic Bounds for Adversarial Excess Risk under Misspecified
Models [9.65010022854885]
本研究では,ある平滑な条件下での分布的敵攻撃によって引き起こされるリスクに,敵対的リスクが等価であることを示す。
対向推定器の一般化性能を評価するため, 対向過大リスクについて検討した。
論文 参考訳(メタデータ) (2023-09-02T00:51:19Z) - Domain Generalization without Excess Empirical Risk [83.26052467843725]
一般的なアプローチは、一般化を捉え、ペナルティと共同で経験的リスクを最小化するために、データ駆動の代理ペナルティを設計することである。
我々は、このレシピの重大な失敗モードは、共同最適化における誤ったペナルティや難しさによる過度なリスクであると主張している。
我々は,この問題を解消するアプローチを提案し,経験的リスクと刑罰を同時に最小化する代わりに,経験的リスクの最適性の制約の下でのペナルティを最小化する。
論文 参考訳(メタデータ) (2023-08-30T08:46:46Z) - Extreme Risk Mitigation in Reinforcement Learning using Extreme Value
Theory [10.288413564829579]
リスク認識の重要な側面は、破滅的な結果をもたらす可能性のある非常に稀なリスクイベント(リワード)をモデル化することである。
リスクを意識したRL手法は存在するが、リスク回避のレベルは状態-作用値関数の推定の精度に大きく依存している。
本研究では、状態-作用値関数分布によって予測される極端な値の予測を精査することに着目し、非常に稀で危険な事象に直面した場合のRLエージェントのレジリエンスを高めることを提案する。
論文 参考訳(メタデータ) (2023-08-24T18:23:59Z) - A Generalized Unbiased Risk Estimator for Learning with Augmented
Classes [70.20752731393938]
ラベルなしのデータが与えられた場合、非バイアスリスク推定器(URE)が導出され、理論的保証のあるLACでは最小限にすることができる。
理論的な保証を維持しつつ任意の損失関数を装備できる一般化されたUREを提案する。
論文 参考訳(メタデータ) (2023-06-12T06:52:04Z) - Safe Deployment for Counterfactual Learning to Rank with Exposure-Based
Risk Minimization [63.93275508300137]
本稿では,安全な配置を理論的に保証する新たなリスク認識型対実学習ランク法を提案する。
提案手法の有効性を実験的に検証し,データが少ない場合の動作不良の早期回避に有効であることを示す。
論文 参考訳(メタデータ) (2023-04-26T15:54:23Z) - Risk-Sensitive Deep RL: Variance-Constrained Actor-Critic Provably Finds
Globally Optimal Policy [95.98698822755227]
本研究は,リスクに敏感な深層強化学習を,分散リスク基準による平均報酬条件下で研究する試みである。
本稿では,ポリシー,ラグランジュ乗算器,フェンシェル双対変数を反復的かつ効率的に更新するアクタ批判アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-28T05:02:26Z) - Learning Bounds for Risk-sensitive Learning [86.50262971918276]
リスクに敏感な学習では、損失のリスク・アバース(またはリスク・シーキング)を最小化する仮説を見つけることを目的としている。
最適化された確実性等価性によって最適性を記述するリスク感応学習スキームの一般化特性について検討する。
論文 参考訳(メタデータ) (2020-06-15T05:25:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。