論文の概要: Swarm Bug Algorithms for Path Generation in Unknown Environments
- arxiv url: http://arxiv.org/abs/2308.07736v1
- Date: Tue, 15 Aug 2023 12:30:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-16 13:02:24.378373
- Title: Swarm Bug Algorithms for Path Generation in Unknown Environments
- Title(参考訳): 未知環境における経路生成のためのSwarm Bugアルゴリズム
- Authors: Alexander Johansson and Johan Markdahl
- Abstract要約: 我々は,古典経路生成アルゴリズムCom,Bug1,Bug2のSwarmCom,SwarmBug1,SwarmBug2と呼ばれるSwarm一般化を提案する。
潜在的なアプリケーションには、損傷した環境が典型的である検索・救助操作が含まれる。
- 参考スコア(独自算出の注目度): 56.07676459156789
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we consider the problem of a swarm traveling between two
points as fast as possible in an unknown environment cluttered with obstacles.
Potential applications include search-and-rescue operations where damaged
environments are typical. We present swarm generalizations, called SwarmCom,
SwarmBug1, and SwarmBug2, of the classical path generation algorithms Com,
Bug1, and Bug2. These algorithms were developed for unknown environments and
require low computational power and memory storage, thereby freeing up
resources for other tasks. We show the upper bound of the worst-case travel
time for the first agent in the swarm to reach the target point for SwarmBug1.
For SwarmBug2, we show that the algorithm underperforms in terms of worst-case
travel time compared to SwarmBug1. For SwarmCom, we show that there exists a
trivial scene for which the algorithm will not halt, and it thus has no
performance guarantees. Moreover, by comparing the upper bound of the travel
time for SwarmBug1 with a universal lower bound for any path generation
algorithm, it is shown that in the limit when the number of agents in the swarm
approaches infinity, no other algorithm has strictly better worst-case
performance than SwarmBug1 and the universal lower bound is tight.
- Abstract(参考訳): 本稿では,障害物が散らばっている未知の環境において,二点間をできるだけ速く移動する群れの問題を考える。
潜在的なアプリケーションには、損傷した環境が典型的である検索・救助操作が含まれる。
我々は,古典経路生成アルゴリズムCom,Bug1,Bug2のSwarmCom,SwarmBug1,SwarmBug2と呼ばれるSwarm一般化を提案する。
これらのアルゴリズムは未知の環境向けに開発され、低計算能力とメモリストレージを必要とするため、他のタスクのリソースを解放する。
swarmで最初のエージェントがswarmbug1のターゲットポイントに到達するための最悪の場合の移動時間の上限を示す。
SwarmBug2の場合、このアルゴリズムはSwarmBug1と比較して最悪の走行時間では性能が劣っている。
SwarmComでは,アルゴリズムが停止しないような簡単なシーンが存在し,性能保証がないことを示す。
さらに、SwarmBug1の走行時間の上限を任意の経路生成アルゴリズムの普遍的な下限と比較することにより、SwarmBug1のエージェント数が無限大に近づくときの限界において、他のアルゴリズムがSwarmBug1よりも厳密に最悪のケース性能を有し、普遍的な下限が厳密であることを示す。
関連論文リスト
- In Search of Excellence: SHOA as a Competitive Shrike Optimization Algorithm for Multimodal Problems [4.939986309170004]
提案アルゴリズムの主なインスピレーションは、自然界におけるシロチョウの群れ行動から取られたものである。
最適化探索と利用の2つの部分は、シロイヌナズナの繁殖と食物の探索をモデル化して設計されている。
本論文は,SHOAが最適化を行うための数学的モデルである。
論文 参考訳(メタデータ) (2024-07-09T11:19:37Z) - AlphaZeroES: Direct score maximization outperforms planning loss minimization [61.17702187957206]
実行時の計画では、シングルエージェントとマルチエージェントの両方の設定でエージェントのパフォーマンスが劇的に向上することが示されている。
実行時に計画するアプローチのファミリは、AlphaZeroとその変種で、Monte Carlo Tree Searchと、状態値とアクション確率を予測することによって検索をガイドするニューラルネットワークを使用する。
複数の環境にまたがって、エピソードスコアを直接最大化し、計画損失を最小限に抑えることを示す。
論文 参考訳(メタデータ) (2024-06-12T23:00:59Z) - Tabular and Deep Reinforcement Learning for Gittins Index [3.7209456282942734]
マルチアームバンディット問題の領域では、ギッティンス指数ポリシーはマルコフの腕を引いて得られる期待の総割引報酬を最大化するのに最適であることが知られている。
しかし、ほとんどの現実的なシナリオでは、マルコフ状態遷移確率は未知であり、したがってGittinsインデックスは計算できない。
次に、得られた報酬を最大限に活用しながら、状態空間を探索してこれらの指標を学習する強化学習(RL)アルゴリズムを利用することができる。
論文 参考訳(メタデータ) (2024-05-02T10:19:32Z) - Instance-Dependent Regret Analysis of Kernelized Bandits [19.252319300590653]
雑音の多いゼロオーダーオーラを問合せするための適応戦略を設計することを含む、カーネル化された帯域幅問題について検討する。
正規化された累積後悔を解消する(関数クラス上)アルゴリズムに対して、不一致依存的後悔の下限を導出する。
論文 参考訳(メタデータ) (2022-03-12T00:53:59Z) - Efficient Pure Exploration for Combinatorial Bandits with Semi-Bandit
Feedback [51.21673420940346]
コンビナーシャルバンディットはマルチアームバンディットを一般化し、エージェントが腕のセットを選択し、選択したセットに含まれる各腕の騒々しい報酬を観察します。
我々は, 最善の腕を一定の信頼度で識別する純粋爆発問題と, 応答集合の構造が動作集合の1つと異なるような, より一般的な設定に注目する。
有限多面体に対するプロジェクションフリーオンライン学習アルゴリズムに基づいて、凸的に最適であり、競争力のある経験的性能を持つ最初の計算効率の良いアルゴリズムである。
論文 参考訳(メタデータ) (2021-01-21T10:35:09Z) - Corralling Stochastic Bandit Algorithms [54.10645564702416]
相関アルゴリズムの後悔は、最も報酬の高い腕を含む最高のアルゴリズムの後悔よりも悪くはないことを示す。
最高報酬と他の報酬の差は、最高報酬と他の報酬の差に依存することを示す。
論文 参考訳(メタデータ) (2020-06-16T15:33:12Z) - Corruption-Tolerant Gaussian Process Bandit Optimization [130.60115798580136]
未知(典型的には非生成)関数を有界ノルムで最適化する問題を考察する。
我々は「高速だが非ローバスト」と「スロー」に基づく高速スローGP-UCBに基づくアルゴリズムを提案する。
ある種の依存関係は、汚職レベルによっては要求できない、と我々は主張する。
論文 参考訳(メタデータ) (2020-03-04T09:46:58Z) - Double Explore-then-Commit: Asymptotic Optimality and Beyond [101.77632893858063]
ガウス級報酬を用いたマルチアームバンディット問題について検討する。
本研究では,探索-then-commit (ETC) アルゴリズムの変種により,マルチアームバンディット問題に対する最適性が得られることを示す。
論文 参考訳(メタデータ) (2020-02-21T08:07:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。