論文の概要: Towards Learning Abstractions via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2212.13980v1
- Date: Wed, 28 Dec 2022 17:54:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 14:32:47.326667
- Title: Towards Learning Abstractions via Reinforcement Learning
- Title(参考訳): 強化学習による抽象学習に向けて
- Authors: Erik Jerg\'eus, Leo Karlsson Oinonen, Emil Carlsson, Moa Johansson
- Abstract要約: 強化学習を通して学習したマルチエージェントシステムにおける効率的な通信方式の合成に関する新しいアプローチについて検討する。
我々は,ニューロシンボリックシステム(Neuro-symbolic system)と呼ばれる,シンボリック手法と機械学習を組み合わせる。
- 参考スコア(独自算出の注目度): 1.7205106391379026
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper we take the first steps in studying a new approach to synthesis
of efficient communication schemes in multi-agent systems, trained via
reinforcement learning. We combine symbolic methods with machine learning, in
what is referred to as a neuro-symbolic system. The agents are not restricted
to only use initial primitives: reinforcement learning is interleaved with
steps to extend the current language with novel higher-level concepts, allowing
generalisation and more informative communication via shorter messages. We
demonstrate that this approach allow agents to converge more quickly on a small
collaborative construction task.
- Abstract(参考訳): 本稿では,強化学習を通じて学習したマルチエージェントシステムにおいて,効率的な通信方式を合成するための新しいアプローチについて検討する。
我々は,ニューロシンボリックシステム(Neuro-symbolic system)と呼ばれる,シンボリック手法と機械学習を組み合わせる。
強化学習は、現在の言語を新しい高レベルな概念で拡張するためのステップでインターリーブされ、より短いメッセージによる一般化とより情報的なコミュニケーションを可能にする。
このアプローチにより、エージェントがより迅速に小さな協調的な建設作業に収束できることを実証する。
関連論文リスト
- ACE: Abstractions for Communicating Efficiently [3.7865171120254364]
AIにおける問題解決の中心的な側面は抽象化の導入と利用である。
この現象を再現しようとするいくつかの計算手法が試みられているが、抽象概念の導入と学習について非現実的な仮定を下している。
我々はこれをコミュニケーションと強化学習のためのニューラルな手法と組み合わせ、新しい抽象化を導入する際の探索と搾取のトレードオフを制御するために、バンディットアルゴリズムを新たに活用する。
論文 参考訳(メタデータ) (2024-09-30T09:20:18Z) - Verco: Learning Coordinated Verbal Communication for Multi-agent Reinforcement Learning [42.27106057372819]
本稿では,大規模言語モデルをエージェントに組み込むマルチエージェント強化学習アルゴリズムを提案する。
フレームワークにはメッセージモジュールとアクションモジュールがある。
オーバークッキングゲームで行った実験は,既存の手法の学習効率と性能を大幅に向上させることを示した。
論文 参考訳(メタデータ) (2024-04-27T05:10:33Z) - AnySkill: Learning Open-Vocabulary Physical Skill for Interactive Agents [58.807802111818994]
オープンな語彙の指示に従って物理的に妥当な相互作用を学習する新しい階層的手法であるAnySkillを提案する。
我々のアプローチは、模倣学習によって訓練された低レベルコントローラを介して、一連のアトミックアクションを開発することから始まります。
提案手法の重要な特徴は,手動の報酬工学を使わずにオブジェクトとのインタラクションを学習する,高レベルなポリシーに対する画像ベースの報酬の利用である。
論文 参考訳(メタデータ) (2024-03-19T15:41:39Z) - Progressively Efficient Learning [58.6490456517954]
我々はCEIL(Communication-Efficient Interactive Learning)という新しい学習フレームワークを開発した。
CEILは、学習者と教師がより抽象的な意図を交換することで効率的にコミュニケーションする人間のようなパターンの出現につながる。
CEILで訓練されたエージェントは、新しいタスクを素早く習得し、非階層的で階層的な模倣学習を、絶対的な成功率で最大50%、20%上回った。
論文 参考訳(メタデータ) (2023-10-13T07:52:04Z) - Learning Symbolic Rules over Abstract Meaning Representations for
Textual Reinforcement Learning [63.148199057487226]
本稿では,汎用的な意味一般化とルール誘導システムを組み合わせて,解釈可能なルールをポリシーとして学習するモジュール型 NEuroSymbolic Textual Agent (NESTA) を提案する。
実験の結果,NESTA法は,未確認テストゲームや少ないトレーニングインタラクションから学習することで,深層強化学習技術よりも優れることがわかった。
論文 参考訳(メタデータ) (2023-07-05T23:21:05Z) - Learning to Ground Decentralized Multi-Agent Communication with
Contrastive Learning [1.116812194101501]
我々は,環境状態の異なる不完全な視点として,エージェント間で送信されるコミュニケーションメッセージに代替的な視点を導入する。
本稿では,与えられた軌跡のメッセージ間の相互情報を自己管理的に最大化することにより,共通言語の出現を誘導する簡単な手法を提案する。
論文 参考訳(メタデータ) (2022-03-07T12:41:32Z) - Learning Adaptive Language Interfaces through Decomposition [89.21937539950966]
本稿では,分解による新しいハイレベルな抽象化を学習するニューラルセマンティック解析システムを提案する。
ユーザは、新しい振る舞いを記述する高レベルな発話を低レベルなステップに分解することで、対話的にシステムを教える。
論文 参考訳(メタデータ) (2020-10-11T08:27:07Z) - Rethinking Supervised Learning and Reinforcement Learning in
Task-Oriented Dialogue Systems [58.724629408229205]
本稿では、従来の教師あり学習とシミュレータなしの逆学習法を用いて、最先端のRL法に匹敵する性能を実現する方法を示す。
我々の主な目的は、教師あり学習で強化学習に勝ることではなく、タスク指向対話システムの最適化における強化学習と教師あり学習の役割を再考する価値を示すことである。
論文 参考訳(メタデータ) (2020-09-21T12:04:18Z) - Learning Structured Communication for Multi-agent Reinforcement Learning [104.64584573546524]
本研究では,マルチエージェント強化学習(MARL)環境下での大規模マルチエージェント通信機構について検討する。
本稿では、より柔軟で効率的な通信トポロジを用いて、LSC(Learning Structured Communication)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-11T07:19:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。