論文の概要: Cogment: Open Source Framework For Distributed Multi-actor Training,
Deployment & Operations
- arxiv url: http://arxiv.org/abs/2106.11345v1
- Date: Mon, 21 Jun 2021 18:21:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-23 15:07:13.471738
- Title: Cogment: Open Source Framework For Distributed Multi-actor Training,
Deployment & Operations
- Title(参考訳): Cogment: 分散マルチアクタトレーニング、デプロイ、運用のためのオープンソースフレームワーク
- Authors: AI Redefined, Sai Krishna Gottipati, Sagar Kurandwad, Clod\'eric Mars,
Gregory Szriftgiser and Fran\c{c}ois Chabot
- Abstract要約: AIエージェントのトレーニングの利益のために、直接人間を巻き込むことは、勢いを増している。
コグメント(Cogment)は,多種多様な人間・エージェントの協調型を支援するために,アクターフォーマリズムを導入する,統一的なオープンソースフレームワークである。
- 参考スコア(独自算出の注目度): 0.3552336242617915
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Involving humans directly for the benefit of AI agents' training is getting
traction thanks to several advances in reinforcement learning and
human-in-the-loop learning. Humans can provide rewards to the agent,
demonstrate tasks, design a curriculum, or act in the environment, but these
benefits also come with architectural, functional design and engineering
complexities. We present Cogment, a unifying open-source framework that
introduces an actor formalism to support a variety of humans-agents
collaboration typologies and training approaches. It is also scalable out of
the box thanks to a distributed micro service architecture, and offers
solutions to the aforementioned complexities.
- Abstract(参考訳): AIエージェントのトレーニングのために直接人間を巻き込むことは、強化学習と人間のループ学習のいくつかの進歩のおかげで、勢いを増している。
人間はエージェントに報酬を与えることができ、タスクを実証したり、カリキュラムを設計したり、環境の中で振る舞うことができるが、これらの利点は建築、機能設計、エンジニアリングの複雑さも伴う。
本稿では,人間同士のコラボレーションタイポロジーとトレーニングアプローチをサポートするためにアクタ形式を導入する,オープンソースのフレームワークであるcogmentを提案する。
また、分散マイクロサービスアーキテクチャのおかげで、最初からスケーラブルであり、前述の複雑さに対するソリューションを提供する。
関連論文リスト
- Decentralized and Lifelong-Adaptive Multi-Agent Collaborative Learning [57.652899266553035]
分散型および生涯適応型多エージェント協調学習は、中央サーバを使わずに複数のエージェント間のコラボレーションを強化することを目的としている。
動的協調グラフを用いた分散マルチエージェント生涯協調学習アルゴリズムであるDeLAMAを提案する。
論文 参考訳(メタデータ) (2024-03-11T09:21:11Z) - AgentScope: A Flexible yet Robust Multi-Agent Platform [66.61478569048477]
AgentScopeは、メッセージ交換をコアコミュニケーションメカニズムとする、開発者中心のマルチエージェントプラットフォームである。
堅牢で柔軟なマルチエージェントアプリケーションを目指して、AgentScopeはビルトインとカスタマイズ可能なフォールトトレランスメカニズムを提供する。
論文 参考訳(メタデータ) (2024-02-21T04:11:28Z) - An Interactive Agent Foundation Model [50.50659114031731]
本稿では,AIエージェントを訓練するための新しいマルチタスクエージェントトレーニングパラダイムを用いた対話型エージェント基礎モデルを提案する。
トレーニングパラダイムは、視覚マスク付きオートエンコーダ、言語モデリング、次世代の予測など、多様な事前学習戦略を統一する。
私たちは、ロボティクス、ゲームAI、ヘルスケアという3つの異なる領域でフレームワークのパフォーマンスを実演します。
論文 参考訳(メタデータ) (2024-02-08T18:58:02Z) - Agent Lumos: Unified and Modular Training for Open-Source Language
Agents [93.16203525451985]
LUMOSは、オープンソースのLLMベースのエージェントをトレーニングするための最初のフレームワークの1つです。
LUMOSは、高レベルなサブゴール生成を学習する計画モジュールを備えた、学習可能で統一されたモジュラーアーキテクチャを備えている。
我々は、多様な地道理理性から導かれた大規模で統一的で高品質なトレーニングアノテーションを収集する。
論文 参考訳(メタデータ) (2023-11-09T00:30:13Z) - Multi-Agent Collaboration: Harnessing the Power of Intelligent LLM
Agents [0.0]
本稿では,マルチエージェントシステムのパワーを活用した大規模言語モデル(LLM)の能力向上のための新しいフレームワークを提案する。
本フレームワークでは,複数の知的エージェントコンポーネントがそれぞれ特有な属性と役割を持つ協調環境を導入し,複雑なタスクをより効率的に効率的に処理する。
論文 参考訳(メタデータ) (2023-06-05T23:55:37Z) - CAMEL: Communicative Agents for "Mind" Exploration of Large Language
Model Society [58.04479313658851]
本稿では,コミュニケーションエージェント間の自律的協調を支援するスケーラブルな手法の構築の可能性について検討する。
本稿では,ロールプレイングという新しいコミュニケーションエージェントフレームワークを提案する。
コントリビューションには、新しいコミュニケーティブエージェントフレームワークの導入、マルチエージェントシステムの協調行動や能力を研究するためのスケーラブルなアプローチの提供などが含まれます。
論文 参考訳(メタデータ) (2023-03-31T01:09:00Z) - Learning Reward Machines in Cooperative Multi-Agent Tasks [75.79805204646428]
本稿では,MARL(Multi-Agent Reinforcement Learning)に対する新しいアプローチを提案する。
これは、協調的なタスク分解と、サブタスクの構造をコードする報酬機(RM)の学習を組み合わせる。
提案手法は、部分的に観測可能な環境下での報酬の非マルコフ的性質に対処するのに役立つ。
論文 参考訳(メタデータ) (2023-03-24T15:12:28Z) - A Unified Architecture for Dynamic Role Allocation and Collaborative
Task Planning in Mixed Human-Robot Teams [0.0]
任意のサイズの混合ロボットチームにおいて,動的役割割り当てと協調作業計画のための新しいアーキテクチャを提案する。
このアーキテクチャは、動作木(BT)に基づく集中型リアクティブかつモジュール型タスク非依存の計画手法を基盤としている。
MILPコストとして使用されるさまざまなメトリクスにより、アーキテクチャはコラボレーションの様々な側面を好むことができる。
論文 参考訳(メタデータ) (2023-01-19T12:30:56Z) - VECA : A Toolkit for Building Virtual Environments to Train and Test
Human-like Agents [5.366273200529158]
そこで我々は,人間のようなエージェントをトレーニングし,テストするための実りの多い仮想環境を構築するための新しいVRベースのツールキットVECAを提案する。
VECAはヒューマノイドエージェントと環境マネージャを提供しており、エージェントはリッチな人間のような知覚を受け取り、包括的な相互作用を行うことができる。
VECAを動機付けるために、私たちはまた、初期の人間の発達に不可欠な4つの側面を表す(ただしこれらに限定されない)24のインタラクティブタスクを提供します。
論文 参考訳(メタデータ) (2021-05-03T11:42:27Z) - The AI Arena: A Framework for Distributed Multi-Agent Reinforcement
Learning [0.3437656066916039]
分散マルチエージェント強化学習のための柔軟な抽象化を備えたスケーラブルなフレームワークであるAI Arenaを紹介します。
複数の異なる学習環境において、一般的なRL技術よりも分散マルチエージェント学習アプローチによる性能向上を示す。
論文 参考訳(メタデータ) (2021-03-09T22:16:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。