論文の概要: Fundamental Tradeoffs in Learning with Prior Information
- arxiv url: http://arxiv.org/abs/2304.13479v1
- Date: Wed, 26 Apr 2023 12:05:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-27 14:19:41.122680
- Title: Fundamental Tradeoffs in Learning with Prior Information
- Title(参考訳): 事前情報を用いた学習における基本的なトレードオフ
- Authors: Anirudha Majumdar
- Abstract要約: 我々は、ミニマックスとベイズリスクという伝統的な概念とは異なる優先順位付けされたリスクの概念を導入する。
古典的ミニマックスローバウンド手法の拡張に対する一般還元に基づくアプローチを提案する。
先行情報と学習性能のトレードオフに関する洞察を提供するためのフレームワークの能力について説明する。
- 参考スコア(独自算出の注目度): 4.302265156822829
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We seek to understand fundamental tradeoffs between the accuracy of prior
information that a learner has on a given problem and its learning performance.
We introduce the notion of prioritized risk, which differs from traditional
notions of minimax and Bayes risk by allowing us to study such fundamental
tradeoffs in settings where reality does not necessarily conform to the
learner's prior. We present a general reduction-based approach for extending
classical minimax lower-bound techniques in order to lower bound the
prioritized risk for statistical estimation problems. We also introduce a novel
generalization of Fano's inequality (which may be of independent interest) for
lower bounding the prioritized risk in more general settings involving
unbounded losses. We illustrate the ability of our framework to provide
insights into tradeoffs between prior information and learning performance for
problems in estimation, regression, and reinforcement learning.
- Abstract(参考訳): 我々は,学習者が与えられた問題に対して持っている事前情報の正確性とその学習性能との根本的なトレードオフを理解することを目的とする。
従来のミニマックスやベイズリスクとは異なる優先順位付きリスクの概念を導入することにより、現実が学習者の前もって従わないような環境での基本的なトレードオフを研究できる。
本稿では,統計的推定問題に対する優先順位付けリスクを低くするために,古典的ミニマックスローバウンド手法の拡張を一般化したアプローチを提案する。
また,不等式(独立利害かもしれない)の新たな一般化を導入し,非利害を含むより一般的な状況において優先度付きリスクを低く抑えることを提案する。
我々は,推定,回帰,強化学習における問題に対する事前情報と学習性能のトレードオフに関する洞察を提供するためのフレームワークの能力を示す。
関連論文リスト
- Understanding Transfer Learning via Mean-field Analysis [5.7150083558242075]
我々は、KL規則化された経験的リスク最小化を用いて、$alpha$-ERMとファインチューニングの2つの主要なトランスファー学習シナリオを検討する。
平均場状態における一層ニューラルネットワークを用いたトランスファーラーニングの利点を示す。
論文 参考訳(メタデータ) (2024-10-22T16:00:44Z) - A Generalized Unbiased Risk Estimator for Learning with Augmented
Classes [70.20752731393938]
ラベルなしのデータが与えられた場合、非バイアスリスク推定器(URE)が導出され、理論的保証のあるLACでは最小限にすることができる。
理論的な保証を維持しつつ任意の損失関数を装備できる一般化されたUREを提案する。
論文 参考訳(メタデータ) (2023-06-12T06:52:04Z) - Hypothesis Transfer Learning with Surrogate Classification Losses:
Generalization Bounds through Algorithmic Stability [3.908842679355255]
仮説伝達学習(HTL)は、以前のタスクレバレッジを新たなターゲットにすることで、ドメイン適応と対比する。
本稿では,機械学習アルゴリズム解析のための魅力的な理論フレームワークであるアルゴリズム安定性によるHTLの学習理論について検討する。
論文 参考訳(メタデータ) (2023-05-31T09:38:21Z) - From Contextual Data to Newsvendor Decisions: On the Actual Performance
of Data-Driven Algorithms [2.9603743540540357]
本研究では,過去のデータとの関連性と量が,データ駆動型ポリシーの性能に与える影響について検討する。
我々は,「密接な状況下で観察された過去の要求は,分布の密接な関係から生じると考える。
論文 参考訳(メタデータ) (2023-02-16T17:03:39Z) - Risk-Averse Multi-Armed Bandits with Unobserved Confounders: A Case
Study in Emotion Regulation in Mobile Health [13.432293223420032]
リスク・アヴァース・マルチアーム・バンディット(MAB)問題として,低いリターンのリスクを最小限に抑える政策の学習を目標とする。
本研究では,この問題を専門家と学習者エージェント間の伝達学習問題として定式化し,専門家が観察できるだけでなく,学習者によっても観察できる文脈の存在を考察する。
論文 参考訳(メタデータ) (2022-09-09T15:42:19Z) - Deep Learning for Systemic Risk Measures [3.274367403737527]
本研究の目的は,システム的リスク対策のための新しい方法論の枠組みを検討することである。
この新たな枠組みの下で、システム的リスク対策は、集約されたシステムを保護する最小限の現金として解釈できる。
ディープラーニングは、金融モデリングやリスク管理においてますます注目を集めている。
論文 参考訳(メタデータ) (2022-07-02T05:01:19Z) - On Leave-One-Out Conditional Mutual Information For Generalization [122.2734338600665]
残余条件付き相互情報(loo-CMI)の新しい尺度に基づく教師付き学習アルゴリズムのための情報理論の一般化境界を導出する。
他のCMI境界とは対照的に、我々のloo-CMI境界は容易に計算でき、古典的なout-out-out-cross-validationのような他の概念と関連して解釈できる。
ディープラーニングのシナリオにおいて予測された一般化ギャップを評価することにより,境界の質を実証的に検証する。
論文 参考訳(メタデータ) (2022-07-01T17:58:29Z) - Risk Minimization from Adaptively Collected Data: Guarantees for
Supervised and Policy Learning [57.88785630755165]
経験的リスク最小化(Empirical Risk Minimization, ERM)は、機械学習のワークホースであるが、適応的に収集されたデータを使用すると、そのモデルに依存しない保証が失敗する可能性がある。
本研究では,仮説クラス上での損失関数の平均値を最小限に抑えるため,適応的に収集したデータを用いた一般的な重み付きERMアルゴリズムについて検討する。
政策学習では、探索がゼロになるたびに既存の文献のオープンギャップを埋める率-最適後悔保証を提供する。
論文 参考訳(メタデータ) (2021-06-03T09:50:13Z) - Constrained Learning with Non-Convex Losses [119.8736858597118]
学習は現代の情報処理の中核技術になっているが、バイアス、安全でない、偏見のあるソリューションにつながるという証拠はたくさんある。
論文 参考訳(メタデータ) (2021-03-08T23:10:33Z) - Learning Bounds for Risk-sensitive Learning [86.50262971918276]
リスクに敏感な学習では、損失のリスク・アバース(またはリスク・シーキング)を最小化する仮説を見つけることを目的としている。
最適化された確実性等価性によって最適性を記述するリスク感応学習スキームの一般化特性について検討する。
論文 参考訳(メタデータ) (2020-06-15T05:25:02Z) - Probably Approximately Correct Constrained Learning [135.48447120228658]
我々は、ほぼ正しい学習フレームワーク(PAC)に基づく一般化理論を開発する。
PAC学習可能なクラスも制約のある学習者であるという意味では,学習者の導入は学習問題を難しくするものではないことを示す。
このソリューションの特性を分析し,制約付き学習が公平でロバストな分類における問題にどのように対処できるかを説明する。
論文 参考訳(メタデータ) (2020-06-09T19:59:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。