論文の概要: Cost Aware Asynchronous Multi-Agent Active Search
- arxiv url: http://arxiv.org/abs/2210.02259v1
- Date: Wed, 5 Oct 2022 13:38:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 15:37:13.884112
- Title: Cost Aware Asynchronous Multi-Agent Active Search
- Title(参考訳): コストを考慮した非同期マルチエージェントアクティブ検索
- Authors: Arundhati Banerjee, Ramina Ghods and Jeff Schneider
- Abstract要約: 未知の環境でターゲットを検出するオンライン能動探索アルゴリズムを提案する。
我々のアルゴリズムは、トンプソンサンプリング、モンテカルロ木探索、最適信頼境界の原理を組み合わせる。
我々は,コストを考慮した能動探索において,アルゴリズムの性能をシミュレーションで解析し,その有効性を示す。
- 参考スコア(独自算出の注目度): 6.587280549237275
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-agent active search requires autonomous agents to choose sensing
actions that efficiently locate targets. In a realistic setting, agents also
must consider the costs that their decisions incur. Previously proposed active
search algorithms simplify the problem by ignoring uncertainty in the agent's
environment, using myopic decision making, and/or overlooking costs. In this
paper, we introduce an online active search algorithm to detect targets in an
unknown environment by making adaptive cost-aware decisions regarding the
agent's actions. Our algorithm combines principles from Thompson Sampling (for
search space exploration and decentralized multi-agent decision making), Monte
Carlo Tree Search (for long horizon planning) and pareto-optimal confidence
bounds (for multi-objective optimization in an unknown environment) to propose
an online lookahead planner that removes all the simplifications. We analyze
the algorithm's performance in simulation to show its efficacy in cost aware
active search.
- Abstract(参考訳): マルチエージェントアクティブサーチでは、自律エージェントがターゲットを効率的に特定するセンシングアクションを選択する必要がある。
現実的な環境では、エージェントは彼らの決定がもたらすコストも考慮しなければならない。
従来提案された能動探索アルゴリズムは, エージェントの環境における不確実性を無視し, 筋力決定やコストの見落としによって問題を単純化していた。
本稿では,エージェントの行動に関する適応的コスト認識決定を行うことにより,未知環境内のターゲットを検出するオンラインアクティブサーチアルゴリズムを提案する。
我々のアルゴリズムは、トンプソンサンプリング(探索空間探索と分散化マルチエージェント決定のための)、モンテカルロ木探索(長期水平計画のための)、および(未知の環境での多目的最適化のための)最適信頼境界の原理を組み合わせて、すべての単純化を除去するオンラインルックアヘッドプランナーを提案する。
アルゴリズムの性能をシミュレーションで解析し,コストを考慮したアクティブサーチの有効性を示す。
関連論文リスト
- Tree Search for Language Model Agents [69.43007235771383]
対話型Web環境での探索と多段階計画を行うために,LMエージェントの推論時探索アルゴリズムを提案する。
我々のアプローチは、実環境空間内で機能する最優先木探索の一形態である。
現実的なWebタスクにおいて有効性を示すLMエージェントのための最初の木探索アルゴリズムである。
論文 参考訳(メタデータ) (2024-07-01T17:07:55Z) - A Dynamic LLM-Powered Agent Network for Task-Oriented Agent Collaboration [55.35849138235116]
本稿では,様々なタスクやドメインに対する動的コミュニケーション構造において,候補からエージェントのチームを自動的に選択する手法を提案する。
具体的には, LLMを利用したエージェント協調のための動的LLMパワーエージェントネットワーク(textDyLAN$)というフレームワークを構築した。
我々は、コード生成、意思決定、一般的な推論、算術的推論タスクにおいて、適度な計算コストで、DyLANが強力なベースラインを上回ることを実証する。
論文 参考訳(メタデータ) (2023-10-03T16:05:48Z) - Factorization of Multi-Agent Sampling-Based Motion Planning [72.42734061131569]
現代のロボティクスは、共有環境内で複数のエンボディエージェントを動作させることが多い。
標準的なサンプリングベースのアルゴリズムは、ロボットの関節空間における解の探索に使用できる。
我々は、因子化の概念をサンプリングベースアルゴリズムに統合し、既存の手法への最小限の変更しか必要としない。
本稿では, PRM* のサンプル複雑性の観点から解析的ゲインを導出し, RRG の実証結果を示す。
論文 参考訳(メタデータ) (2023-04-01T15:50:18Z) - Multi-Agent Active Search using Detection and Location Uncertainty [6.587280549237275]
アクティブ検索アルゴリズムは、検出の不確実性と位置不確実性という2つのタイプの不確実性とを競合しなければならない。
まず,ターゲット検出と位置不確実性の両方を共同で扱う推論手法を提案する。
次に、トンプソンサンプリングを用いて、分散マルチエージェント能動探索を可能にする意思決定アルゴリズムを構築する。
論文 参考訳(メタデータ) (2022-03-09T04:53:37Z) - On Reward-Free RL with Kernel and Neural Function Approximations:
Single-Agent MDP and Markov Game [140.19656665344917]
エージェントが事前に特定された報酬関数を使わずに環境を徹底的に探索することを目的とした報酬のないRL問題について検討する。
関数近似の文脈でこの問題に取り組み、強力な関数近似器を活用する。
我々は、カーネルとニューラルファンクション近似器を用いた、証明可能な効率の良い報酬なしRLアルゴリズムを確立した。
論文 参考訳(メタデータ) (2021-10-19T07:26:33Z) - Nonmyopic Multifidelity Active Search [15.689830609697685]
本稿では,多要素能動探索のモデルと,この設定のための新しい,計算効率の良いポリシーを提案する。
実世界のデータセット上でのソリューションの性能を評価し,自然ベンチマークよりもはるかに優れた性能を示す。
論文 参考訳(メタデータ) (2021-06-11T12:55:51Z) - Inverse Bayesian Optimization: Learning Human Search Strategies in a
Sequential Optimization Task [0.10499611180329801]
本稿では,ベイズ最適化の逆問題について考察する。
観察された探索経路に基づいてエージェントの潜時獲得関数を推定する。
実験から人間の行動を解析し,その方法を説明する。
論文 参考訳(メタデータ) (2021-04-16T15:40:34Z) - Selection-Expansion: A Unifying Framework for Motion-Planning and
Diversity Search Algorithms [69.87173070473717]
本稿では,2つの多様性探索アルゴリズム,ノベルティ探索アルゴリズムとゴール探索処理アルゴリズムの特性について検討する。
mpアルゴリズムとの関係は、ポリシーパラメータ空間と結果空間の間のマッピングの滑らかさ、あるいは滑らかさの欠如が検索効率において重要な役割を担っていることを示している。
論文 参考訳(メタデータ) (2021-04-10T13:52:27Z) - Exploration and Incentives in Reinforcement Learning [107.42240386544633]
各エージェントが同一(ただし未知)のMDPに直面する複雑な探索問題を考察する。
エージェントはポリシーの選択を制御するが、アルゴリズムは推奨事項のみを発行できる。
MDPのすべての到達可能な状態を探索するアルゴリズムを設計します。
論文 参考訳(メタデータ) (2021-02-28T00:15:53Z) - Asynchronous Multi Agent Active Search [6.587280549237275]
SPATS (Sparse Parallel Asynchronous Thompson Smpling) とLATSI (Laplace Thompson Smpling with Information gain) という2つの異なる能動探索アルゴリズムを提案する。
ターゲットは、圧縮的な検知仮定に従って、環境の周囲にわずかに配置されているとみなす。
提案アルゴリズムの有効性を実証するために,シミュレーション結果と理論的解析結果を提供する。
論文 参考訳(メタデータ) (2020-06-25T22:17:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。