Fugu-MT 論文翻訳(概要): Outside the Echo Chamber: Optimizing the Performative Risk

論文の概要: Outside the Echo Chamber: Optimizing the Performative Risk

arxiv url: http://arxiv.org/abs/2102.08570v1
Date: Wed, 17 Feb 2021 04:36:39 GMT
ステータス: 翻訳完了
システム内更新日: 2021-02-18 14:48:33.626688
Title: Outside the Echo Chamber: Optimizing the Performative Risk
Title（参考訳）: エコーチャンバーの外:パフォーマンスリスクを最適化する
Authors: John Miller, Juan C. Perdomo, Tijana Zrnic
Abstract要約: 本研究では,損失関数の性質の自然集合と,その実行リスクが凸となるモデル誘起分布シフトを同定する。導関数のない凸最適化の一般的な方法よりも優れたサンプル効率で性能リスクを最適化するために,構造的仮定を活用するアルゴリズムを開発した。
参考スコア（独自算出の注目度）: 21.62040119228266
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In performative prediction, predictions guide decision-making and hence can influence the distribution of future data. To date, work on performative prediction has focused on finding performatively stable models, which are the fixed points of repeated retraining. However, stable solutions can be far from optimal when evaluated in terms of the performative risk, the loss experienced by the decision maker when deploying a model. In this paper, we shift attention beyond performative stability and focus on optimizing the performative risk directly. We identify a natural set of properties of the loss function and model-induced distribution shift under which the performative risk is convex, a property which does not follow from convexity of the loss alone. Furthermore, we develop algorithms that leverage our structural assumptions to optimize the performative risk with better sample efficiency than generic methods for derivative-free convex optimization.
Abstract（参考訳）: 実行予測では、予測は意思決定を導くので、将来のデータの分布に影響を与えることができる。これまでは、反復的再訓練の固定点である、性能的に安定なモデルを見つけることに焦点を当ててきた。しかし、安定したソリューションは、モデルのデプロイ時に意思決定者が経験する損失、実行リスクの観点から評価した場合の最適とは程遠い。本稿では,パフォーマンスの安定性よりも注意を移し,パフォーマンスのリスクを直接最適化することに注力する。本研究では,損失関数の性質の自然集合と,損失のみの凸性から従わない特性である実効的リスクが凸となるモデル誘起分布シフトを同定する。さらに,我々の構造的仮定を利用して,導関数のない凸最適化法よりも優れたサンプル効率で性能的リスクを最適化するアルゴリズムを開発した。

関連論文リスト

Distributionally Robust Optimization with Adversarial Data Contamination [49.89480853499918]
凸リプシッツ損失関数を持つ一般化線形モデルに対するワッサーシュタイン-1 DRO 目標の最適化に焦点をあてる。私たちの主な貢献は、データ汚染のトレーニングに対するロバストネスと分散シフトに対するロバストネスを統合した、新しいモデリングフレームワークです。この研究は、データ汚染と分散シフトという2つの課題の下で学習するために、効率的な計算によって支援される最初の厳密な保証を確立する。
論文参考訳（メタデータ） (2025-07-14T18:34:10Z)
Performative Risk Control: Calibrating Models for Reliable Deployment under Performativity [18.09405926516524]
リスク管理を達成するために機械学習モデルを校正することは、信頼性の高い意思決定を保証するために不可欠である。本稿では, リスク管理を行うためのモデルキャリブレーションフレームワークであるPerformative Risk Controlを紹介する。
論文参考訳（メタデータ） (2025-05-30T00:59:25Z)
Representation-based Reward Modeling for Efficient Safety Alignment of Large Language Model [84.00480999255628]
大規模言語モデル(LLM)の安全性アライメントのための強化学習アルゴリズムは,分散シフトの課題に直面している。現在のアプローチでは、ターゲットポリシーからのオンラインサンプリングを通じてこの問題に対処するのが一般的である。モデル固有の安全判断能力を活用して報酬信号を抽出する新しいフレームワークを提案する。
論文参考訳（メタデータ） (2025-03-13T06:40:34Z)
ProFL: Performative Robust Optimal Federated Learning [20.54517189040872]
変形予測(Performative prediction)は、機械学習モデルのトレーニング中に発生する凸分布シフトである。本稿では,フェデレート学習における性能最適点を抽出するPerformative Learningアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-10-23T17:57:14Z)
Rejection via Learning Density Ratios [50.91522897152437]
拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文参考訳（メタデータ） (2024-05-29T01:32:17Z)
Uncertainty for Active Learning on Graphs [70.44714133412592]
不確実性サンプリングは、機械学習モデルのデータ効率を改善することを目的とした、アクティブな学習戦略である。予測の不確実性を超えた不確実性サンプリングをベンチマークし、他のアクティブラーニング戦略に対する大きなパフォーマンスギャップを強調します。提案手法は,データ生成プロセスの観点から基幹的ベイズ不確実性推定法を開発し,不確実性サンプリングを最適クエリへ導く上での有効性を実証する。
論文参考訳（メタデータ） (2024-05-02T16:50:47Z)
Data-Adaptive Tradeoffs among Multiple Risks in Distribution-Free Prediction [55.77015419028725]
しきい値とトレードオフパラメータが適応的に選択された場合、リスクの有効な制御を可能にする手法を開発する。提案手法は単調なリスクとほぼ単調なリスクをサポートするが,それ以外は分布的な仮定はしない。
論文参考訳（メタデータ） (2024-03-28T17:28:06Z)
Bayesian Nonparametrics Meets Data-Driven Distributionally Robust Optimization [29.24821214671497]
機械学習と統計モデルのトレーニングは、しばしばデータ駆動型リスク基準の最適化を伴う。ベイズ的非パラメトリック(ディリクレ過程)理論と、スムーズなあいまいさ-逆選好の最近の決定論的モデルを組み合わせた、新しいロバストな基準を提案する。実用的な実装として、よく知られたディリクレプロセスの表現に基づいて、評価基準の抽出可能な近似を提案し、研究する。
論文参考訳（メタデータ） (2024-01-28T21:19:15Z)
Model-Based Epistemic Variance of Values for Risk-Aware Policy Optimization [59.758009422067]
モデルベース強化学習における累積報酬に対する不確実性を定量化する問題を考察する。我々は、解が値の真後分散に収束する新しい不確実性ベルマン方程式(UBE)を提案する。本稿では,リスク・サーキングとリスク・アバース・ポリシー最適化のいずれにも適用可能な汎用ポリシー最適化アルゴリズムQ-Uncertainty Soft Actor-Critic (QU-SAC)を導入する。
論文参考訳（メタデータ） (2023-12-07T15:55:58Z)
Pitfall of Optimism: Distributional Reinforcement Learning by Randomizing Risk Criterion [9.35556128467037]
本稿では,リスクの一方的な傾向を避けるために,リスク基準のランダム化によって行動を選択する新しい分散強化学習アルゴリズムを提案する。理論的結果は,提案手法がバイアス探索に該当せず,最適回帰に収束することが保証されていることを裏付けるものである。
論文参考訳（メタデータ） (2023-10-25T10:53:04Z)
Calibrating Neural Simulation-Based Inference with Differentiable Coverage Probability [50.44439018155837]
ニューラルモデルのトレーニング目的に直接キャリブレーション項を含めることを提案する。古典的なキャリブレーション誤差の定式化を緩和することにより、エンドツーエンドのバックプロパゲーションを可能にする。既存の計算パイプラインに直接適用でき、信頼性の高いブラックボックス後部推論が可能である。
論文参考訳（メタデータ） (2023-10-20T10:20:45Z)
Performative Prediction with Bandit Feedback: Learning through Reparameterization [23.039885534575966]
行動予測は、データの分布自体がモデルの展開に応じて変化する社会予測を研究するためのフレームワークである。本研究では,実行予測目標をデータ分散関数として再パラメータ化する再パラメータ化を開発する。
論文参考訳（メタデータ） (2023-05-01T21:31:29Z)
Optimizing the Performative Risk under Weak Convexity Assumptions [0.0]
性能予測において、予測モデルは将来のデータを生成する分布に影響を与える。これまでの研究では、損失に関する一般的な条件とモデルパラメータから分布へのマッピングが特定されており、凸性はパフォーマンスリスクを意味する。本稿では,反復最適化法における性能最小化リスク問題の回避性を犠牲にすることなく,これらの仮定を緩和する。
論文参考訳（メタデータ） (2022-09-02T01:07:09Z)
Modeling the Second Player in Distributionally Robust Optimization [90.25995710696425]
我々は、最悪のケース分布を特徴付けるために神経生成モデルを使うことを議論する。このアプローチは多くの実装と最適化の課題をもたらします。提案されたアプローチは、同等のベースラインよりも堅牢なモデルを生み出す。
論文参考訳（メタデータ） (2021-03-18T14:26:26Z)
A Stochastic Subgradient Method for Distributionally Robust Non-Convex Learning [2.007262412327553]
堅牢性は、基礎となるデータ分布の不確実性に関するものです。本手法は摂動条件を満たすことに収束することを示す。また、実際のデータセット上でのアルゴリズムの性能についても解説する。
論文参考訳（メタデータ） (2020-06-08T18:52:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。