論文の概要: The MAGICAL Benchmark for Robust Imitation
- arxiv url: http://arxiv.org/abs/2011.00401v1
- Date: Sun, 1 Nov 2020 02:04:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 22:52:32.073043
- Title: The MAGICAL Benchmark for Robust Imitation
- Title(参考訳): ロバスト・イミテーションのための磁気ベンチマーク
- Authors: Sam Toyer, Rohin Shah, Andrew Critch, Stuart Russell
- Abstract要約: シミュレーション学習(IL)アルゴリズムは通常、デモを作成するのに使われたのと同じ環境で評価される。
本稿では,一般化の体系的評価を可能にするMAGICALベンチマークスイートを提案する。
- 参考スコア(独自算出の注目度): 16.699877076711548
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Imitation Learning (IL) algorithms are typically evaluated in the same
environment that was used to create demonstrations. This rewards precise
reproduction of demonstrations in one particular environment, but provides
little information about how robustly an algorithm can generalise the
demonstrator's intent to substantially different deployment settings. This
paper presents the MAGICAL benchmark suite, which permits systematic evaluation
of generalisation by quantifying robustness to different kinds of distribution
shift that an IL algorithm is likely to encounter in practice. Using the
MAGICAL suite, we confirm that existing IL algorithms overfit significantly to
the context in which demonstrations are provided. We also show that standard
methods for reducing overfitting are effective at creating narrow perceptual
invariances, but are not sufficient to enable transfer to contexts that require
substantially different behaviour, which suggests that new approaches will be
needed in order to robustly generalise demonstrator intent. Code and data for
the MAGICAL suite is available at https://github.com/qxcv/magical/.
- Abstract(参考訳): シミュレーション学習(IL)アルゴリズムは通常、デモを作成するのに使われたのと同じ環境で評価される。
これは、ある特定の環境でのデモの正確な再現を報いるが、アルゴリズムがデモンストレーターの意図をかなり異なる配置設定に一般化する方法については、ほとんど情報を提供していない。
本稿では,ilアルゴリズムが実際に遭遇する可能性のある異なる種類の分布シフトに対するロバスト性を定量化することにより,一般化の体系的評価を可能にする魔法的ベンチマークスイートを提案する。
MAGICAL スイートを用いて、既存の IL アルゴリズムがデモを提供するコンテキストにかなり適合していることを確認する。
また, オーバーフィッティング低減のための標準的な手法は, 狭義の知覚的不変性の生成には有効であるが, 実質的に異なる行動を必要とする文脈への移動を可能にするには不十分であり, 実証的意図を堅牢に一般化するために新たなアプローチが必要であることを示唆する。
magic suiteのコードとデータはhttps://github.com/qxcv/magical/で入手できる。
関連論文リスト
- A General Online Algorithm for Optimizing Complex Performance Metrics [5.726378955570775]
我々は,バイナリ,マルチクラス,マルチラベルの分類問題において,様々な複雑なパフォーマンス指標を用いて,直接的に使用可能な汎用オンラインアルゴリズムを導入,分析する。
アルゴリズムの更新と予測のルールは、過去のデータを保存することなく、非常にシンプルで計算的に効率的である。
論文 参考訳(メタデータ) (2024-06-20T21:24:47Z) - Adaptive Experimentation at Scale: A Computational Framework for
Flexible Batches [7.390918770007728]
結果がバッチで測定される少数の実測を含む実例によって動機付けられ,適応駆動型実験フレームワークを開発した。
我々の主な観察は、統計的推論において普遍的な正規近似は適応アルゴリズムの設計を導くことができることである。
論文 参考訳(メタデータ) (2023-03-21T04:17:03Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Making Linear MDPs Practical via Contrastive Representation Learning [101.75885788118131]
マルコフ決定過程(MDP)における次元性の呪いに、低ランク表現を利用することで対処することが一般的である。
本稿では,効率的な表現学習を可能にしつつ,正規化を自動的に保証する線形MDPの代替的定義について考察する。
いくつかのベンチマークにおいて、既存の最先端モデルベースおよびモデルフリーアルゴリズムよりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-07-14T18:18:02Z) - Adaptive Hierarchical Similarity Metric Learning with Noisy Labels [138.41576366096137]
適応的階層的類似度メトリック学習法を提案する。
ノイズに敏感な2つの情報、すなわち、クラスワイドのばらつきとサンプルワイドの一貫性を考える。
提案手法は,現在の深層学習手法と比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-10-29T02:12:18Z) - The Benchmark Lottery [114.43978017484893]
ベンチマーク宝くじ」は、機械学習ベンチマークプロセスの全体的な脆弱さを記述している。
アルゴリズムの相対的性能は、異なるベンチマークタスクを選択するだけで大幅に変化する可能性がある。
論文 参考訳(メタデータ) (2021-07-14T21:08:30Z) - How Fine-Tuning Allows for Effective Meta-Learning [50.17896588738377]
MAMLライクなアルゴリズムから派生した表現を解析するための理論的フレームワークを提案する。
我々は,勾配降下による微調整により得られる最良予測器のリスク境界を提示し,アルゴリズムが共有構造を有効活用できることを実証する。
この分離の結果、マイニングベースのメソッド、例えばmamlは、少数ショット学習における"frozen representation"目標を持つメソッドよりも優れている。
論文 参考訳(メタデータ) (2021-05-05T17:56:00Z) - CIMON: Towards High-quality Hash Codes [63.37321228830102]
我々はtextbfComprehensive stextbfImilarity textbfMining と ctextbfOnsistency leartextbfNing (CIMON) という新しい手法を提案する。
まず、グローバルな洗練と類似度統計分布を用いて、信頼性とスムーズなガイダンスを得る。第二に、意味的整合性学習とコントラスト的整合性学習の両方を導入して、乱不変と差別的ハッシュコードの両方を導出する。
論文 参考訳(メタデータ) (2020-10-15T14:47:14Z) - Study of Diffusion Normalized Least Mean M-estimate Algorithms [0.8749675983608171]
本研究では,修正ハマー関数に基づく拡散正規化最小平均M推定アルゴリズムを提案する。
我々は,アルゴリズムの過渡的,定常的,安定的な挙動を統一的なフレームワークで解析する。
様々なインパルスノイズシナリオのシミュレーションでは、提案アルゴリズムは既存の拡散アルゴリズムよりも優れていることが示されている。
論文 参考訳(メタデータ) (2020-04-20T00:28:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。