Fugu-MT 論文翻訳(概要): Objective Robustness in Deep Reinforcement Learning

論文の概要: Objective Robustness in Deep Reinforcement Learning

arxiv url: http://arxiv.org/abs/2105.14111v1
Date: Fri, 28 May 2021 21:13:34 GMT
ステータス: 翻訳完了
システム内更新日: 2021-06-06 00:10:36.261747
Title: Objective Robustness in Deep Reinforcement Learning
Title（参考訳）: 深層強化学習における客観的ロバスト性
Authors: Jack Koch, Lauro Langosco, Jacob Pfau, James Le, Lee Sharkey
Abstract要約: 強化学習(RL)における客観的頑健性障害(配当外頑健性障害の一種)について検討する。私たちは、客観的ロバスト性障害に関する最初の明示的な実証デモを提供し、この種の障害に対処することが不可欠である、と論じます。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We study objective robustness failures, a type of out-of-distribution robustness failure in reinforcement learning (RL). Objective robustness failures occur when an RL agent retains its capabilities off-distribution yet pursues the wrong objective. We provide the first explicit empirical demonstrations of objective robustness failures and argue that this type of failure is critical to address.
Abstract（参考訳）: 強化学習(RL)における客観的頑健性障害(out-of-distribution robustness failures)について検討した。目標のロバスト性障害は、rlエージェントがその能力のオフ分散を維持しながら間違った目標を追求するときに発生する。我々は、客観的な堅牢性障害の最初の明示的な実証を行い、この種の障害は対処に不可欠であると主張する。

関連論文リスト

Hierarchical Reinforcement Learning with Targeted Causal Interventions [24.93050534953955]
階層的強化学習(HRL)は、タスクをサブゴールの階層に分解することで、細かな報酬で長期強化学習タスクの効率を向上する。サブゴナル構造を因果グラフとしてモデル化し,因果探索アルゴリズムを提案する。発見された因果モデルを用いて,最終目標達成の重要性に基づいて,下位介入を優先する。
論文参考訳（メタデータ） (2025-07-06T12:38:42Z)
Adversarial Alignment for LLMs Requires Simpler, Reproducible, and More Measurable Objectives [52.863024096759816]
相反する研究目的は、過去10年間に敵対的堅牢性研究の進展を妨げてきた。我々は、対立するアライメントの有意義な進展には、リアライメントの目的が必要であると論じる。
論文参考訳（メタデータ） (2025-02-17T15:28:40Z)
Reward-Robust RLHF in LLMs [25.31456438114974]
大規模言語モデル(LLM)は、より高度なインテリジェンスへと進化を続けている。報酬モデルに基づく(RMに基づく)アライメント手法への依存は、大きな課題をもたらす。本稿では,これらの課題に対処することを目的とした報酬損耗型RLHFフレームワークを提案する。
論文参考訳（メタデータ） (2024-09-18T02:35:41Z)
Jailbreaking as a Reward Misspecification Problem [80.52431374743998]
本稿では,この脆弱性をアライメントプロセス中に不特定性に対処する新たな視点を提案する。本稿では,報酬の相違の程度を定量化し,その有効性を実証する指標ReGapを紹介する。 ReMissは、報酬ミスの空間で敵のプロンプトを生成する自動レッドチームリングシステムである。
論文参考訳（メタデータ） (2024-06-20T15:12:27Z)
Towards Effective Evaluations and Comparisons for LLM Unlearning Methods [97.2995389188179]
本稿では,大規模言語モデルにおける機械学習評価の精度向上を図る。評価指標の堅牢性と、競合する目標間のトレードオフという、2つの重要な課題に対処します。
論文参考訳（メタデータ） (2024-06-13T14:41:00Z)
Open-Vocabulary Object Detectors: Robustness Challenges under Distribution Shifts [6.486569431242123]
VLM(Vision-Language Models)は近年,画期的な成果を上げている。 VLMオブジェクト検出におけるOODロバスト性の調査は、これらのモデルの信頼性を高めるために不可欠である。本研究では,最近のOV基盤オブジェクト検出モデルのゼロショット機能について,包括的ロバスト性評価を行った。
論文参考訳（メタデータ） (2024-04-01T14:18:15Z)
Seeing is not Believing: Robust Reinforcement Learning against Spurious Correlation [57.351098530477124]
国家の異なる部分には、保存されていない共同設立者が引き起こす相関関係が存在しない。このような役に立たないあるいは有害な相関を学習するモデルは、テストケースの共同創設者がトレーニングケースから逸脱したときに破滅的に失敗する可能性がある。したがって、単純かつ非構造的な不確実性集合を仮定する既存の頑健なアルゴリズムは、この問題に対処するには不十分である。
論文参考訳（メタデータ） (2023-07-15T23:53:37Z)
Discrete Factorial Representations as an Abstraction for Goal Conditioned Reinforcement Learning [99.38163119531745]
離散化ボトルネックを適用することにより,目標条件付きRLセットアップの性能が向上することを示す。分布外目標に対する期待した回帰を実験的に証明し、同時に表現的な構造で目標を指定できるようにします。
論文参考訳（メタデータ） (2022-11-01T03:31:43Z)
Regret Bounds for Risk-Sensitive Reinforcement Learning [0.0]
本研究は,CVaR目標を含むリスク感応目標の一般クラスにおいて,強化学習に対する最初の後悔の限界を証明した。我々の理論はCVaR目標の新たな特徴と,新しい楽観的なMDP構築に基づいている。
論文参考訳（メタデータ） (2022-10-11T17:49:01Z)
Benchmarking Safe Deep Reinforcement Learning in Aquatic Navigation [78.17108227614928]
本研究では,水文ナビゲーションに着目した安全強化学習のためのベンチマーク環境を提案する。価値に基づく政策段階の深層強化学習(DRL)について考察する。また,学習したモデルの振る舞いを所望の特性の集合上で検証する検証戦略を提案する。
論文参考訳（メタデータ） (2021-12-16T16:53:56Z)
Goal-Aware Cross-Entropy for Multi-Target Reinforcement Learning [15.33496710690063]
本稿では,目標認識型クロスエントロピー(GACE)ロスを提案する。次に、目標関連情報を利用して与えられた指示に集中する目標識別型注意ネットワーク(GDAN)を考案する。
論文参考訳（メタデータ） (2021-10-25T14:24:39Z)
Adversarial Intrinsic Motivation for Reinforcement Learning [60.322878138199364]
政策状態の訪問分布と目標分布とのワッサースタイン-1距離が強化学習タスクに有効に活用できるかどうかを検討する。我々のアプローチは、AIM (Adversarial Intrinsic Motivation) と呼ばれ、このワッサーシュタイン-1距離をその双対目的を通して推定し、補足報酬関数を計算する。
論文参考訳（メタデータ） (2021-05-27T17:51:34Z)
Adversarial Robustness under Long-Tailed Distribution [93.50792075460336]
敵対的ロバスト性はディープネットワークの脆弱性と本質的特徴を明らかにすることで近年広く研究されている。本研究では,長尾分布下における敵対的脆弱性と防御について検討する。我々は、スケール不変とデータ再分散という2つの専用モジュールからなるクリーンで効果的なフレームワークであるRoBalを提案する。
論文参考訳（メタデータ） (2021-04-06T17:53:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。