論文の概要: Progressively Efficient Learning
- arxiv url: http://arxiv.org/abs/2310.13004v1
- Date: Fri, 13 Oct 2023 07:52:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-29 16:09:32.410707
- Title: Progressively Efficient Learning
- Title(参考訳): 学習の効率化
- Authors: Ruijie Zheng, Khanh Nguyen, Hal Daum\'e III, Furong Huang, Karthik
Narasimhan
- Abstract要約: 我々はCEIL(Communication-Efficient Interactive Learning)という新しい学習フレームワークを開発した。
CEILは、学習者と教師がより抽象的な意図を交換することで効率的にコミュニケーションする人間のようなパターンの出現につながる。
CEILで訓練されたエージェントは、新しいタスクを素早く習得し、非階層的で階層的な模倣学習を、絶対的な成功率で最大50%、20%上回った。
- 参考スコア(独自算出の注目度): 58.6490456517954
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Assistant AI agents should be capable of rapidly acquiring novel skills and
adapting to new user preferences. Traditional frameworks like imitation
learning and reinforcement learning do not facilitate this capability because
they support only low-level, inefficient forms of communication. In contrast,
humans communicate with progressive efficiency by defining and sharing abstract
intentions. Reproducing similar capability in AI agents, we develop a novel
learning framework named Communication-Efficient Interactive Learning (CEIL).
By equipping a learning agent with an abstract, dynamic language and an
intrinsic motivation to learn with minimal communication effort, CEIL leads to
emergence of a human-like pattern where the learner and the teacher communicate
progressively efficiently by exchanging increasingly more abstract intentions.
CEIL demonstrates impressive performance and communication efficiency on a 2D
MineCraft domain featuring long-horizon decision-making tasks. Agents trained
with CEIL quickly master new tasks, outperforming non-hierarchical and
hierarchical imitation learning by up to 50% and 20% in absolute success rate,
respectively, given the same number of interactions with the teacher.
Especially, the framework performs robustly with teachers modeled after human
pragmatic communication behavior.
- Abstract(参考訳): アシスタントAIエージェントは、新しいスキルを迅速に獲得し、新しいユーザー好みに適応できるべきである。
模倣学習や強化学習のような伝統的なフレームワークは、低レベルで非効率なコミュニケーション形式のみをサポートするため、この機能を促進できない。
対照的に、人間は抽象的な意図を定義し共有することで進歩的効率とコミュニケーションする。
AIエージェントで同様の能力を再現し、通信効率対話学習(CEIL)という新しい学習フレームワークを開発する。
学習エージェントに抽象的でダイナミックな言語と、最小限のコミュニケーション努力で学習する本質的なモチベーションを装備することにより、CEILは学習者と教師がより抽象的な意図を交換することで、より効率的にコミュニケーションする人間のようなパターンの出現につながる。
CEILは、長期の意思決定タスクを備えた2D MineCraftドメイン上で、素晴らしいパフォーマンスと通信効率を示す。
CEILで訓練されたエージェントは、新しいタスクを素早く習得し、教師との対話数が同じであれば、非階層的および階層的模倣学習を最大50%、絶対成功率20%で上回った。
特に,本フレームワークは,人的実践的なコミュニケーション行動の後にモデル化された教師と活発に機能する。
関連論文リスト
- Decentralized and Lifelong-Adaptive Multi-Agent Collaborative Learning [57.652899266553035]
分散型および生涯適応型多エージェント協調学習は、中央サーバを使わずに複数のエージェント間のコラボレーションを強化することを目的としている。
動的協調グラフを用いた分散マルチエージェント生涯協調学習アルゴリズムであるDeLAMAを提案する。
論文 参考訳(メタデータ) (2024-03-11T09:21:11Z) - Empowering Large Language Model Agents through Action Learning [89.07382951897941]
大規模言語モデル(LLM)エージェントは最近ますます関心を集めているが、試行錯誤から学ぶ能力は限られている。
我々は、経験から新しい行動を学ぶ能力は、LLMエージェントの学習の進歩に欠かせないものであると論じる。
我々はPython関数の形式でアクションを作成し改善するための反復学習戦略を備えたフレームワークLearningActを紹介した。
論文 参考訳(メタデータ) (2024-02-24T13:13:04Z) - The Role of Higher-Order Cognitive Models in Active Learning [8.847360368647752]
我々は、人間のフィードバックのためのアクティブな学習のための新しいパラダイムを提唱する。
エージェントのレベルが上がると、アクティブな学習システムと教師との合理的コミュニケーションの質的に異なる形態がもたらされるかについて議論する。
論文 参考訳(メタデータ) (2024-01-09T07:39:36Z) - Human Decision Makings on Curriculum Reinforcement Learning with
Difficulty Adjustment [52.07473934146584]
我々は,カリキュラム強化学習結果を,人的意思決定プロセスから学ぶことで,難しすぎず,難しすぎるような望ましいパフォーマンスレベルに導く。
本システムは非常に並列化可能であり,大規模強化学習アプリケーションの訓練が可能となる。
強化学習性能は、人間の所望の難易度と同期してうまく調整できることが示される。
論文 参考訳(メタデータ) (2022-08-04T23:53:51Z) - Natural Language Communication with a Teachable Agent [0.0]
本研究は,Curiosity Notebookを介して仮想エージェントと対話する際のモダリティ教育の効果について検討する。
原材料から文を選択してエージェントを教える方法と、原材料を言い換えてテキスト入力を入力して教える方法とを比較する。
その結果, パラフレーズやテキスト入力による授業は, 教材の学習結果や, 情緒的エンゲージメントの側面に肯定的な影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2022-03-17T01:31:23Z) - Active Hierarchical Imitation and Reinforcement Learning [0.0]
本研究では,我々が開発した階層的模倣強化学習フレームワークを用いて,様々な模倣学習アルゴリズムを探索し,アクティブ学習アルゴリズムを設計した。
実験の結果,daggerと報酬ベースのアクティブラーニング手法は,トレーニング過程において身体的および精神的により多くの努力を省きながら,よりよいパフォーマンスを達成できることがわかった。
論文 参考訳(メタデータ) (2020-12-14T08:27:27Z) - Learning Adaptive Language Interfaces through Decomposition [89.21937539950966]
本稿では,分解による新しいハイレベルな抽象化を学習するニューラルセマンティック解析システムを提案する。
ユーザは、新しい振る舞いを記述する高レベルな発話を低レベルなステップに分解することで、対話的にシステムを教える。
論文 参考訳(メタデータ) (2020-10-11T08:27:07Z) - Rethinking Supervised Learning and Reinforcement Learning in
Task-Oriented Dialogue Systems [58.724629408229205]
本稿では、従来の教師あり学習とシミュレータなしの逆学習法を用いて、最先端のRL法に匹敵する性能を実現する方法を示す。
我々の主な目的は、教師あり学習で強化学習に勝ることではなく、タスク指向対話システムの最適化における強化学習と教師あり学習の役割を再考する価値を示すことである。
論文 参考訳(メタデータ) (2020-09-21T12:04:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。