論文の概要: Agent-Arena: A General Framework for Evaluating Control Algorithms
- arxiv url: http://arxiv.org/abs/2504.06468v1
- Date: Tue, 08 Apr 2025 22:20:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-10 13:07:48.921883
- Title: Agent-Arena: A General Framework for Evaluating Control Algorithms
- Title(参考訳): Agent-Arena: 制御アルゴリズムの評価のための一般的なフレームワーク
- Authors: Halid Abdulrahim Kadi, Kasim Terzić,
- Abstract要約: Agent-Arenaは、意思決定ポリシーの統合、レプリケーション、開発、テストを簡単にするためのPythonフレームワークである。
既存のフレームワークとは異なり、Agent-Arenaはあらゆる種類の制御アルゴリズムをサポートするために一意に一般化されている。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Robotic research is inherently challenging, requiring expertise in diverse environments and control algorithms. Adapting algorithms to new environments often poses significant difficulties, compounded by the need for extensive hyper-parameter tuning in data-driven methods. To address these challenges, we present Agent-Arena, a Python framework designed to streamline the integration, replication, development, and testing of decision-making policies across a wide range of benchmark environments. Unlike existing frameworks, Agent-Arena is uniquely generalised to support all types of control algorithms and is adaptable to both simulation and real-robot scenarios. Please see our GitHub repository https://github.com/halid1020/agent-arena-v0.
- Abstract(参考訳): ロボットの研究は本質的に困難であり、多様な環境や制御アルゴリズムの専門知識を必要とする。
アルゴリズムを新しい環境に適応させることは、データ駆動方式における広範なハイパーパラメータチューニングの必要性によって、しばしば重大な困難を引き起こす。
これらの課題に対処するために、幅広いベンチマーク環境における意思決定ポリシーの統合、レプリケーション、開発、テストの合理化を目的として設計されたPythonフレームワークであるAgent-Arenaを紹介します。
既存のフレームワークとは異なり、Agent-Arenaはあらゆる種類の制御アルゴリズムをサポートするために一意に一般化されており、シミュレーションと実際のロボットシナリオの両方に対応できる。
GitHubリポジトリ https://github.com/halid1020/agent-arena-v0 をご覧ください。
関連論文リスト
- A Multiagent Path Search Algorithm for Large-Scale Coalition Structure Generation [61.08720171136229]
結合構造生成はマルチエージェントシステムにおける基本的な計算問題である。
我々はCSGの多エージェントパス探索アルゴリズムであるSALDAEを開発し、連立構造グラフ上で運用する。
論文 参考訳(メタデータ) (2025-02-14T15:21:27Z) - IntellAgent: A Multi-Agent Framework for Evaluating Conversational AI Systems [2.2810745411557316]
IntellAgentは、対話型AIシステムを評価するためのスケーラブルでオープンソースのフレームワークである。
IntellAgentは、ポリシー駆動グラフモデリング、リアルイベント生成、対話型ユーザエージェントシミュレーションを組み合わせることで、合成ベンチマークの作成を自動化する。
我々の研究は、IntellAgentが、研究と展開の橋渡しの課題に対処することで、会話AIを前進させるための効果的なフレームワークであることを示した。
論文 参考訳(メタデータ) (2025-01-19T14:58:35Z) - The BrowserGym Ecosystem for Web Agent Research [151.90034093362343]
BrowserGymエコシステムは、Webエージェントの効率的な評価とベンチマークの必要性の高まりに対処する。
本稿では,Webエージェント研究のためのBrowserGymベースの拡張エコシステムを提案する。
大規模なマルチベンチマークWebエージェント実験を初めて実施し、6つのWebエージェントベンチマークで6つの最先端LCMの性能を比較した。
論文 参考訳(メタデータ) (2024-12-06T23:43:59Z) - Pangu-Agent: A Fine-Tunable Generalist Agent with Structured Reasoning [50.47568731994238]
人工知能(AI)エージェント作成の鍵となる方法は強化学習(RL)である
本稿では,構造化推論をAIエージェントのポリシーに統合し,学習するための一般的なフレームワークモデルを提案する。
論文 参考訳(メタデータ) (2023-12-22T17:57:57Z) - Contribution \`a l'Optimisation d'un Comportement Collectif pour un
Groupe de Robots Autonomes [0.0]
この論文は集団ロボット工学の分野、特にマルチロボットシステムの最適化問題を研究している。
最初の貢献は、未知領域探索問題の解決にButterfly Algorithm Optimization (BOA) を用いることである。
第2の貢献は、ロボット工学における動的増分問題をベンチマークするための新しいシミュレーションフレームワークの開発である。
論文 参考訳(メタデータ) (2023-06-10T21:49:08Z) - Factorization of Multi-Agent Sampling-Based Motion Planning [72.42734061131569]
現代のロボティクスは、共有環境内で複数のエンボディエージェントを動作させることが多い。
標準的なサンプリングベースのアルゴリズムは、ロボットの関節空間における解の探索に使用できる。
我々は、因子化の概念をサンプリングベースアルゴリズムに統合し、既存の手法への最小限の変更しか必要としない。
本稿では, PRM* のサンプル複雑性の観点から解析的ゲインを導出し, RRG の実証結果を示す。
論文 参考訳(メタデータ) (2023-04-01T15:50:18Z) - Near-optimal Policy Identification in Active Reinforcement Learning [84.27592560211909]
AE-LSVI はカーネル化された最小二乗値 RL (LSVI) アルゴリズムの新しい変種であり、楽観主義と悲観主義を組み合わせて活発な探索を行う。
AE-LSVIは初期状態に対するロバスト性が必要な場合、様々な環境で他のアルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-12-19T14:46:57Z) - Policy Search for Model Predictive Control with Application to Agile
Drone Flight [56.24908013905407]
MPCのためのポリシ・フォー・モデル・予測制御フレームワークを提案する。
具体的には、パラメータ化コントローラとしてMPCを定式化し、パラメータ化の難しい決定変数を高レベルポリシーとして表現する。
シミュレーションと実環境の両方において,我々の制御器が堅牢かつリアルタイムに制御性能を発揮することを示す実験を行った。
論文 参考訳(メタデータ) (2021-12-07T17:39:24Z) - Towards Automatic Actor-Critic Solutions to Continuous Control [7.312692481631664]
本稿では,アクター批判アルゴリズムを新しいドメインにチューニングする進化的アプローチを提案する。
私たちの設計は、サンプル効率が高く、ベースラインアプローチよりも実用的な利点を提供します。
次に、計算と研究の最小限の労力で高性能なソリューションを見つけるために、新しい制御タスクに適用する。
論文 参考訳(メタデータ) (2021-06-16T16:18:20Z) - Asynchronous Multi Agent Active Search [6.587280549237275]
SPATS (Sparse Parallel Asynchronous Thompson Smpling) とLATSI (Laplace Thompson Smpling with Information gain) という2つの異なる能動探索アルゴリズムを提案する。
ターゲットは、圧縮的な検知仮定に従って、環境の周囲にわずかに配置されているとみなす。
提案アルゴリズムの有効性を実証するために,シミュレーション結果と理論的解析結果を提供する。
論文 参考訳(メタデータ) (2020-06-25T22:17:20Z) - A Survey of Reinforcement Learning Algorithms for Dynamically Varying
Environments [1.713291434132985]
強化学習(Reinforcement Learning, RL)アルゴリズムは、在庫管理、レコメンデータシステム、車両交通管理、クラウドコンピューティング、ロボット工学などの分野で応用されている。
これらの領域で生じる多くのタスクの現実的な合併症は、古典的RLアルゴリズムの基礎となる基本的な仮定で解くのを難しくする。
本稿では、動的に変化する環境モデルを扱うために開発されたRL法について調査する。
これらのアルゴリズムの代表的コレクションは、それらの分類と相対的なメリットとデメリットと共に、この研究で詳細に議論されている。
論文 参考訳(メタデータ) (2020-05-19T09:42:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。