論文の概要: Maximum Entropy Multi-Task Inverse RL
- arxiv url: http://arxiv.org/abs/2004.12873v1
- Date: Mon, 27 Apr 2020 15:30:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 04:20:04.097391
- Title: Maximum Entropy Multi-Task Inverse RL
- Title(参考訳): 最大エントロピーマルチタスク逆RL
- Authors: Saurabh Arora, Bikramjit Banerjee, Prashant Doshi
- Abstract要約: 本稿では、IRLに対するよく知られた最大エントロピーアプローチを一般化するマルチタスクIRLの新しい手法を提案する。
我々は,オニオンを処理ラインにソートするロボット作業のシミュレーションにおいて,MaxEnt Multi-task IRLを評価した。
- 参考スコア(独自算出の注目度): 14.352214079374463
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-task IRL allows for the possibility that the expert could be switching
between multiple ways of solving the same problem, or interleaving
demonstrations of multiple tasks. The learner aims to learn the multiple reward
functions that guide these ways of solving the problem. We present a new method
for multi-task IRL that generalizes the well-known maximum entropy approach to
IRL by combining it with the Dirichlet process based clustering of the observed
input. This yields a single nonlinear optimization problem, called MaxEnt
Multi-task IRL, which can be solved using the Lagrangian relaxation and
gradient descent methods. We evaluate MaxEnt Multi-task IRL in simulation on
the robotic task of sorting onions on a processing line where the expert
utilizes multiple ways of detecting and removing blemished onions. The method
is able to learn the underlying reward functions to a high level of accuracy
and it improves on the previous approaches to multi-task IRL.
- Abstract(参考訳): マルチタスクIRLは、専門家が同じ問題を解決する複数の方法を切り替えたり、複数のタスクのデモをインターリーブしたりすることができる。
学習者は、これらの問題を解決する方法を導く複数の報酬関数を学ぶことを目指している。
観測された入力のディリクレプロセスに基づくクラスタリングと組み合わせることで、よく知られた最大エントロピーアプローチをIRLに一般化するマルチタスクIRLの新しい手法を提案する。
これはMaxEnt Multi-task IRLと呼ばれる単一の非線形最適化問題をもたらし、これはラグランジュ緩和法と勾配降下法を用いて解ける。
我々は,オニオンの選別作業におけるシミュレーションにおいて,オニオンの検出と除去の複数の方法を利用したMaxEnt Multi-task IRLを評価した。
この手法は、基礎となる報酬関数を高い精度で学習することができ、マルチタスクirlに対する以前のアプローチを改善している。
関連論文リスト
- UCB-driven Utility Function Search for Multi-objective Reinforcement Learning [75.11267478778295]
マルチオブジェクト強化学習(MORL)エージェントでは、意思決定行動の最適化を行う。
重みベクトル w でパラメータ化される線型効用関数の場合に焦点を当てる。
学習過程の異なる段階で最も有望な重みベクトルを効率的に探索する上信頼境界に基づく手法を提案する。
論文 参考訳(メタデータ) (2024-05-01T09:34:42Z) - Multi-Task Learning with Multi-Task Optimization [31.518330903602095]
最適化されているが、よく分散されたモデルの集合が、1つのアルゴリズムパスで異なるトレードオフを具現化していることを示す。
様々な問題設定を解決するために,マルチタスク最適化を用いたマルチタスク学習を提案する。
論文 参考訳(メタデータ) (2024-03-24T14:04:40Z) - Sample Efficient Myopic Exploration Through Multitask Reinforcement
Learning with Diverse Tasks [53.44714413181162]
本稿では, エージェントが十分に多様なタスクセットで訓練された場合, 筋電図探索設計による一般的なポリシー共有アルゴリズムは, サンプル効率がよいことを示す。
我々の知る限りでは、これはMTRLの「探索的利益」の初めての理論的実証である。
論文 参考訳(メタデータ) (2024-03-03T22:57:44Z) - Equitable Multi-task Learning [18.65048321820911]
マルチタスク学習(MTL)は、CV、NLP、IRといった様々な研究領域で大きな成功を収めている。
本稿では,EMTLという新しいマルチタスク最適化手法を提案する。
本手法は,2つの研究領域の公開ベンチマークデータセットにおいて,最先端の手法よりも安定して性能を向上する。
論文 参考訳(メタデータ) (2023-06-15T03:37:23Z) - Multi-task Hierarchical Adversarial Inverse Reinforcement Learning [40.60364143826424]
マルチタスク・イミテーション・ラーニング (MIL) は、マルチタスクの専門家による実演に基づくタスクの配布が可能な政策を訓練することを目的としている。
既存のMILアルゴリズムは、複雑な長距離タスクにおいて、データ効率の低下とパフォーマンスの低下に悩まされている。
階層的に構造化されたマルチタスクポリシーを学習するために,MH-AIRL(Multi-task Hierarchical Adversarial Inverse Reinforcement Learning)を開発した。
論文 参考訳(メタデータ) (2023-05-22T01:58:40Z) - New Tight Relaxations of Rank Minimization for Multi-Task Learning [161.23314844751556]
2つの正規化項に基づく2つの新しいマルチタスク学習定式化を提案する。
本手法は,タスク間で共有される低ランク構造を正確に復元し,関連するマルチタスク学習方法より優れていることを示す。
論文 参考訳(メタデータ) (2021-12-09T07:29:57Z) - Variational Multi-Task Learning with Gumbel-Softmax Priors [105.22406384964144]
マルチタスク学習は、タスク関連性を探究し、個々のタスクを改善することを目的としている。
本稿では,複数のタスクを学習するための一般的な確率的推論フレームワークである変分マルチタスク学習(VMTL)を提案する。
論文 参考訳(メタデータ) (2021-11-09T18:49:45Z) - Small Towers Make Big Differences [59.243296878666285]
マルチタスク学習は、複数の機械学習タスクを同時に解決することを目的としている。
マルチタスク学習問題に対する優れた解法は、Paretoの最適性に加えて一般化可能であるべきである。
本稿では,マルチタスクモデルのためのパラメータ下自己助詞の手法を提案し,両世界のベストを達成した。
論文 参考訳(メタデータ) (2020-08-13T10:45:31Z) - Gradient Surgery for Multi-Task Learning [119.675492088251]
マルチタスク学習は、複数のタスク間で構造を共有するための有望なアプローチとして登場した。
マルチタスク学習がシングルタスク学習と比較して難しい理由は、完全には理解されていない。
本稿では,他の作業の勾配の正規平面上にタスクの勾配を投影する勾配手術の一形態を提案する。
論文 参考訳(メタデータ) (2020-01-19T06:33:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。