論文の概要: Unified Distributed Environment
- arxiv url: http://arxiv.org/abs/2205.06946v1
- Date: Sat, 14 May 2022 02:27:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-17 14:29:44.731395
- Title: Unified Distributed Environment
- Title(参考訳): 統一分散環境
- Authors: Woong Gyu La, Sunil Muralidhara, Lingjie Kong, Pratik Nichat
- Abstract要約: UDEは、Gazebo、Unity、Unreal、OpenAI Gymなどのシミュレーションプラットフォーム上に構築された環境を統合するように設計されている。
UDEは、統一インターフェースを維持しながら、リモートマシン上で実行するための環境をオフロードすることを可能にする。
- 参考スコア(独自算出の注目度): 0.3176327333793051
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose Unified Distributed Environment (UDE), an environment
virtualization toolkit for reinforcement learning research. UDE is designed to
integrate environments built on any simulation platform such as Gazebo, Unity,
Unreal, and OpenAI Gym. Through environment virtualization, UDE enables
offloading the environment for execution on a remote machine while still
maintaining a unified interface. The UDE interface is designed to support
multi-agent by default. With environment virtualization and its interface
design, the agent policies can be trained in multiple machines for a
multi-agent environment. Furthermore, UDE supports integration with existing
major RL toolkits for researchers to leverage the benefits. This paper
discusses the components of UDE and its design decisions.
- Abstract(参考訳): 強化学習研究のための環境仮想化ツールキットであるUnified Distributed Environment (UDE)を提案する。
UDEは、Gazebo、Unity、Unreal、OpenAI Gymなどのシミュレーションプラットフォーム上に構築された環境を統合するように設計されている。
環境仮想化を通じて、UDEはリモートマシン上で実行するための環境をオフロードし、統一されたインターフェースを維持します。
UDEインターフェースはデフォルトでマルチエージェントをサポートするように設計されている。
環境仮想化とそのインターフェース設計により、エージェントポリシーはマルチエージェント環境のために複数のマシンでトレーニングすることができる。
さらに、UDEは研究者がこの利点を利用するために既存の主要なRLツールキットとの統合をサポートする。
本稿では,UDEの構成要素とその設計決定について論じる。
関連論文リスト
- Agent AI: Surveying the Horizons of Multimodal Interaction [83.18367129924997]
エージェントAI(Agent AI)とは、視覚刺激や言語入力、その他の環境データを知覚できる対話型システムである。
我々は,バーチャルリアリティやシミュレートされたシーンを容易に作成し,仮想環境内に具体化されたエージェントと対話できる未来を構想する。
論文 参考訳(メタデータ) (2024-01-07T19:11:18Z) - Enhancing Graph Representation of the Environment through Local and
Cloud Computation [2.9465623430708905]
複数の情報源からロボット環境のセマンティックな表現を提供するグラフベースの表現を提案する。
環境から情報を取得するために、このフレームワークは古典的なコンピュータビジョンツールと現代のコンピュータビジョンクラウドサービスを組み合わせる。
提案手法により、小さなオブジェクトも処理し、環境の意味表現に統合することが可能になる。
論文 参考訳(メタデータ) (2023-09-22T08:05:32Z) - EnvEdit: Environment Editing for Vision-and-Language Navigation [98.30038910061894]
Vision-and-Language Navigation (VLN)では、エージェントは自然言語命令に基づいて環境をナビゲートする必要がある。
本研究では,既存の環境を編集して新しい環境を作成するデータ拡張手法であるEnvEditを提案する。
提案手法は,事前学習および未学習のVLNエージェントにおいて,すべての指標において有意な改善が得られたことを示す。
論文 参考訳(メタデータ) (2022-03-29T15:44:32Z) - Composing Complex and Hybrid AI Solutions [52.00820391621739]
一般的なAIアプリケーションで上記の機能を実現するためのAcumosシステムの拡張について述べる。
当社の拡張機能には、gRPC/Protobufインターフェースによるより汎用的なコンポーネントのサポートが含まれています。
デプロイ可能なソリューションとそのインターフェースの例を提供する。
論文 参考訳(メタデータ) (2022-02-25T08:57:06Z) - SILG: The Multi-environment Symbolic Interactive Language Grounding
Benchmark [62.34200575624785]
マルチ環境対話型言語グラウンドベンチマーク(SILG)を提案する。
SILGは、新しいダイナミクス、エンティティ、部分的に観察された世界(RTFM、Messenger、NetHack)への一般化を必要とするグリッドワールド環境で構成されている。
SILGを用いた自己中心型局所的畳み込み,再帰状態追跡,エンティティ中心の注意,事前訓練によるLMなどの最近の進歩を評価した。
論文 参考訳(メタデータ) (2021-10-20T17:02:06Z) - SMASH: a Semantic-enabled Multi-agent Approach for Self-adaptation of
Human-centered IoT [0.8602553195689512]
本稿では、人間中心環境におけるIoTアプリケーションの自己適応のためのマルチエージェントアプローチであるSMASHを提案する。
SMASHエージェントは、BDIエージェントモデルに基づく4層アーキテクチャを備え、人間の価値観とゴール推論、計画、行動を統合する。
論文 参考訳(メタデータ) (2021-05-31T12:33:27Z) - A Reinforcement Learning Environment for Multi-Service UAV-enabled
Wireless Systems [4.0393766449982085]
我々は、様々なアプリケーションコンテキストで異なる通信サービスを提供する自律型UAVのための多目的環境を設計する。
我々は,実運用環境の異なる特性をシミュレートするために,openai gymフレームワークに基づく環境を開発する。
結果のポリシーの品質は、システムを評価するための単純なベースラインと比較され、さまざまなユースケースでこの技術を採用するためのガイドラインを導き出します。
論文 参考訳(メタデータ) (2021-05-11T14:45:24Z) - Emergent Complexity and Zero-shot Transfer via Unsupervised Environment
Design [121.73425076217471]
本研究では,未知のパラメータを持つ環境を提供するUnsupervised Environment Design (UED)を提案する。
プロタゴニスト・アンタゴニストによるレグレト環境デザイン(PAIRED)と呼ぶ。
実験により, PAIREDは複雑な環境の自然なカリキュラムを生産し, PAIREDエージェントは, 高度に新規な環境での試験において, 高いゼロショット転送性能が得られることを示した。
論文 参考訳(メタデータ) (2020-12-03T17:37:01Z) - Environment Shaping in Reinforcement Learning using State Abstraction [63.444831173608605]
状態抽象化を用いた環境形成の新しい枠組みを提案する。
私たちのキーとなるアイデアは、ノイズの多い信号で環境の大きな状態空間を抽象空間に圧縮することです。
エージェントの方針は, 形状の環境において学習し, 元の環境において, ほぼ最適動作を保っていることを示す。
論文 参考訳(メタデータ) (2020-06-23T17:00:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。