論文の概要: Cogment: Open Source Framework For Distributed Multi-actor Training,
Deployment & Operations
- arxiv url: http://arxiv.org/abs/2106.11345v1
- Date: Mon, 21 Jun 2021 18:21:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-23 15:07:13.471738
- Title: Cogment: Open Source Framework For Distributed Multi-actor Training,
Deployment & Operations
- Title(参考訳): Cogment: 分散マルチアクタトレーニング、デプロイ、運用のためのオープンソースフレームワーク
- Authors: AI Redefined, Sai Krishna Gottipati, Sagar Kurandwad, Clod\'eric Mars,
Gregory Szriftgiser and Fran\c{c}ois Chabot
- Abstract要約: AIエージェントのトレーニングの利益のために、直接人間を巻き込むことは、勢いを増している。
コグメント(Cogment)は,多種多様な人間・エージェントの協調型を支援するために,アクターフォーマリズムを導入する,統一的なオープンソースフレームワークである。
- 参考スコア(独自算出の注目度): 0.3552336242617915
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Involving humans directly for the benefit of AI agents' training is getting
traction thanks to several advances in reinforcement learning and
human-in-the-loop learning. Humans can provide rewards to the agent,
demonstrate tasks, design a curriculum, or act in the environment, but these
benefits also come with architectural, functional design and engineering
complexities. We present Cogment, a unifying open-source framework that
introduces an actor formalism to support a variety of humans-agents
collaboration typologies and training approaches. It is also scalable out of
the box thanks to a distributed micro service architecture, and offers
solutions to the aforementioned complexities.
- Abstract(参考訳): AIエージェントのトレーニングのために直接人間を巻き込むことは、強化学習と人間のループ学習のいくつかの進歩のおかげで、勢いを増している。
人間はエージェントに報酬を与えることができ、タスクを実証したり、カリキュラムを設計したり、環境の中で振る舞うことができるが、これらの利点は建築、機能設計、エンジニアリングの複雑さも伴う。
本稿では,人間同士のコラボレーションタイポロジーとトレーニングアプローチをサポートするためにアクタ形式を導入する,オープンソースのフレームワークであるcogmentを提案する。
また、分散マイクロサービスアーキテクチャのおかげで、最初からスケーラブルであり、前述の複雑さに対するソリューションを提供する。
関連論文リスト
- AssistantX: An LLM-Powered Proactive Assistant in Collaborative Human-Populated Environment [15.475084260674384]
AssistantXは、物理的なオフィス環境で自律的に動作するように設計されたプロアクティブアシスタントである。
従来のサービスロボットとは異なり、AssistantXは、高度な推論機能を提供する新しいマルチエージェントアーキテクチャPPDR4Xを利用している。
評価では、アーキテクチャの有効性を強調し、AssistantXが明確な指示に応答し、メモリから積極的に補足情報を検索し、積極的にチームメンバの協力を求め、タスクの完了を確実にすることを示す。
論文 参考訳(メタデータ) (2024-09-26T09:06:56Z) - BMW Agents -- A Framework For Task Automation Through Multi-Agent Collaboration [0.0]
我々は、様々なドメインにわたる複雑なユースケースアプリケーションを扱う柔軟なエージェントエンジニアリングフレームワークの設計に重点を置いている。
提案するフレームワークは,産業用アプリケーションの信頼性を提供し,複数の自律エージェントに対して,スケーラブルでフレキシブルで協調的なワークフローを保証するためのテクニックを提供する。
論文 参考訳(メタデータ) (2024-06-28T16:39:20Z) - Decentralized and Lifelong-Adaptive Multi-Agent Collaborative Learning [57.652899266553035]
分散型および生涯適応型多エージェント協調学習は、中央サーバを使わずに複数のエージェント間のコラボレーションを強化することを目的としている。
動的協調グラフを用いた分散マルチエージェント生涯協調学習アルゴリズムであるDeLAMAを提案する。
論文 参考訳(メタデータ) (2024-03-11T09:21:11Z) - An Interactive Agent Foundation Model [49.77861810045509]
本稿では,AIエージェントを訓練するための新しいマルチタスクエージェントトレーニングパラダイムを用いた対話型エージェント基礎モデルを提案する。
トレーニングパラダイムは、視覚マスク付きオートエンコーダ、言語モデリング、次世代の予測など、多様な事前学習戦略を統一する。
私たちは、ロボティクス、ゲームAI、ヘルスケアという3つの異なる領域でフレームワークのパフォーマンスを実演します。
論文 参考訳(メタデータ) (2024-02-08T18:58:02Z) - Agent Lumos: Unified and Modular Training for Open-Source Language Agents [89.78556964988852]
LUMOSは、オープンソースのLLMベースのエージェントをトレーニングするための最初のフレームワークの1つです。
LUMOSは、高レベルなサブゴール生成を学習する計画モジュールを備えた、学習可能で統一されたモジュラーアーキテクチャを備えている。
我々は、多様な地道理理性から導かれた大規模で統一的で高品質なトレーニングアノテーションを収集する。
論文 参考訳(メタデータ) (2023-11-09T00:30:13Z) - AgentVerse: Facilitating Multi-Agent Collaboration and Exploring
Emergent Behaviors [93.38830440346783]
本稿では,その構成をより高機能なシステムとして協調的に調整できるマルチエージェントフレームワークを提案する。
実験により,フレームワークが単一エージェントより優れたマルチエージェントグループを効果的に展開できることが実証された。
これらの振舞いの観点から、我々は、ポジティブなものを活用し、ネガティブなものを緩和し、マルチエージェントグループの協調可能性を改善するためのいくつかの戦略について議論する。
論文 参考訳(メタデータ) (2023-08-21T16:47:11Z) - CAMEL: Communicative Agents for "Mind" Exploration of Large Language
Model Society [58.04479313658851]
本稿では,コミュニケーションエージェント間の自律的協調を支援するスケーラブルな手法の構築の可能性について検討する。
本稿では,ロールプレイングという新しいコミュニケーションエージェントフレームワークを提案する。
コントリビューションには、新しいコミュニケーティブエージェントフレームワークの導入、マルチエージェントシステムの協調行動や能力を研究するためのスケーラブルなアプローチの提供などが含まれます。
論文 参考訳(メタデータ) (2023-03-31T01:09:00Z) - Learning Reward Machines in Cooperative Multi-Agent Tasks [75.79805204646428]
本稿では,MARL(Multi-Agent Reinforcement Learning)に対する新しいアプローチを提案する。
これは、協調的なタスク分解と、サブタスクの構造をコードする報酬機(RM)の学習を組み合わせる。
提案手法は、部分的に観測可能な環境下での報酬の非マルコフ的性質に対処するのに役立つ。
論文 参考訳(メタデータ) (2023-03-24T15:12:28Z) - A Unified Architecture for Dynamic Role Allocation and Collaborative
Task Planning in Mixed Human-Robot Teams [0.0]
任意のサイズの混合ロボットチームにおいて,動的役割割り当てと協調作業計画のための新しいアーキテクチャを提案する。
このアーキテクチャは、動作木(BT)に基づく集中型リアクティブかつモジュール型タスク非依存の計画手法を基盤としている。
MILPコストとして使用されるさまざまなメトリクスにより、アーキテクチャはコラボレーションの様々な側面を好むことができる。
論文 参考訳(メタデータ) (2023-01-19T12:30:56Z) - The AI Arena: A Framework for Distributed Multi-Agent Reinforcement
Learning [0.3437656066916039]
分散マルチエージェント強化学習のための柔軟な抽象化を備えたスケーラブルなフレームワークであるAI Arenaを紹介します。
複数の異なる学習環境において、一般的なRL技術よりも分散マルチエージェント学習アプローチによる性能向上を示す。
論文 参考訳(メタデータ) (2021-03-09T22:16:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。