論文の概要: Three-Dimensional Swarming Using Cyclic Stochastic Optimization
- arxiv url: http://arxiv.org/abs/2010.05328v2
- Date: Mon, 2 Aug 2021 19:17:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 13:07:26.635067
- Title: Three-Dimensional Swarming Using Cyclic Stochastic Optimization
- Title(参考訳): 周期確率最適化を用いた三次元スワーミング
- Authors: Carsten H. Botts
- Abstract要約: 循環最適化(CSO)を実装した協調型移動センシングエージェントのアンサンブルをシミュレートする。
本稿では,シミュレーションに基づく実験を通して,CSO収束の3次元的意味と適用性について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we simulate an ensemble of cooperating, mobile sensing agents
that implement the cyclic stochastic optimization (CSO) algorithm in an attempt
to survey and track multiple targets. In the CSO algorithm proposed, each agent
uses its sensed measurements, its shared information, and its predictions of
others' future motion to decide on its next action. This decision is selected
to minimize a loss function that decreases as the uncertainty in the targets'
state estimates decreases. Only noisy measurements of this loss function are
available to each agent, and in this study, each agent attempts to minimize
this function by calculating its stochastic gradient. This paper examines, via
simulation-based experiments, the implications and applicability of CSO
convergence in three dimensions.
- Abstract(参考訳): 本稿では,複数の目標を探索・追跡するために,循環確率最適化(CSO)アルゴリズムを実装した協調型移動センシングエージェントのアンサンブルをシミュレートする。
提案したCSOアルゴリズムでは、各エージェントは、その知覚された測定値、共有情報、および将来の動作の予測を用いて次の動作を決定する。
この決定は、目標状態の不確実性が減少するにつれて減少する損失関数を最小化する。
この損失関数のノイズ測定は各エージェントにのみ利用可能であり、本研究では各エージェントが確率勾配を計算してこの関数を最小化しようとする。
本稿では,シミュレーションに基づく実験を通して,CSO収束の3次元的意味と適用性について検討する。
関連論文リスト
- Gradient Descent Efficiency Index [0.0]
本研究では,各イテレーションの有効性を定量化するために,新しい効率指標Ekを導入する。
提案した測定基準は、誤差の相対的変化と繰り返し間の損失関数の安定性の両方を考慮に入れている。
Ekは、機械学習アプリケーションにおける最適化アルゴリズムの選択とチューニングにおいて、より詳細な決定を導く可能性がある。
論文 参考訳(メタデータ) (2024-10-25T10:22:22Z) - A Data-Driven State Aggregation Approach for Dynamic Discrete Choice
Models [7.7347261505610865]
本稿では,状態の選択と集約のためのデータ駆動型手法を提案する。
提案した2段階のアプローチは,問題次元を減らして次元の呪いを緩和する。
2つの古典的動的離散的選択推定法におけるアルゴリズムの実証的性能を実証する。
論文 参考訳(メタデータ) (2023-04-11T01:07:24Z) - Smoothing Policy Iteration for Zero-sum Markov Games [9.158672246275348]
ゼロサムMGの解法としてスムージングポリシロバストネス(SPI)アルゴリズムを提案する。
特に、対向ポリシーは、作用空間上の効率的なサンプリングを可能にする重み関数として機能する。
また,SPIを関数近似で拡張することにより,Smooth adversarial Actor-critic (SaAC) と呼ばれるモデルベースアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-03T14:39:06Z) - Adaptive LASSO estimation for functional hidden dynamic geostatistical
model [69.10717733870575]
関数型隠れ統計モデル(f-HD)のためのペナル化極大推定器(PMLE)に基づく新しいモデル選択アルゴリズムを提案する。
このアルゴリズムは反復最適化に基づいており、適応最小限の収縮・セレクタ演算子(GMSOLAS)ペナルティ関数を用いており、これは不給付のf-HD最大線量推定器によって得られる。
論文 参考訳(メタデータ) (2022-08-10T19:17:45Z) - Scalable Intervention Target Estimation in Linear Models [52.60799340056917]
因果構造学習への現在のアプローチは、既知の介入目標を扱うか、仮説テストを使用して未知の介入目標を発見する。
本稿では、全ての介入対象を一貫して識別するスケーラブルで効率的なアルゴリズムを提案する。
提案アルゴリズムは、与えられた観測マルコフ同値クラスを介入マルコフ同値クラスに更新することも可能である。
論文 参考訳(メタデータ) (2021-11-15T03:16:56Z) - Meta Learning Low Rank Covariance Factors for Energy-Based Deterministic
Uncertainty [58.144520501201995]
ニューラルネットワーク層のBi-Lipschitz正規化は、各レイヤの特徴空間におけるデータインスタンス間の相対距離を保存する。
注意セットエンコーダを用いて,タスク固有の共分散行列を効率的に構築するために,対角的,対角的,低ランクな要素のメタ学習を提案する。
また,最終的な予測分布を達成するために,スケールしたエネルギーを利用する推論手法を提案する。
論文 参考訳(メタデータ) (2021-10-12T22:04:19Z) - Energy-Efficient and Federated Meta-Learning via Projected Stochastic
Gradient Ascent [79.58680275615752]
エネルギー効率のよいメタラーニングフレームワークを提案する。
各タスクは別々のエージェントによって所有されていると仮定するため、メタモデルをトレーニングするために限られたタスクが使用される。
論文 参考訳(メタデータ) (2021-05-31T08:15:44Z) - An Efficient Algorithm for Deep Stochastic Contextual Bandits [10.298368632706817]
コンテキスト境界の問題では、エージェントは特定の観察されたコンテキストに基づいてアクションを選択し、反復よりも報酬を最大化します。
近年、ディープニューラルネットワーク(DNN)を用いて行動に対する期待される報酬を予測する研究がいくつか行われ、勾配に基づく手法で訓練されている。
論文 参考訳(メタデータ) (2021-04-12T16:34:43Z) - Full Matching on Low Resolution for Disparity Estimation [84.45201205560431]
本研究では,マルチステージ完全一致格差推定法(MFM)を提案する。
また,低分解能3次元コストを見積もる代わりに,低分解能4次元ボリュームから全類似度スコアを段階的に切り離すことを実証した。
実験の結果,提案手法は,シーンフローやkitti 2012,kitti 2015のデータセットにおいて,より正確な不一致推定結果を達成し,最先端の手法を上回った。
論文 参考訳(メタデータ) (2020-12-10T11:11:23Z) - Multi-agent active perception with prediction rewards [18.780904566592852]
マルチエージェントアクティブな知覚は、エージェントのチームが協調して観測を集め、隠れた変数の合同推定を計算するタスクである。
我々は,マルチエージェントの能動知覚を,凸集中型予測報酬を用いた部分観測可能なマルコフ決定プロセス(Dec-POMDP)としてモデル化する。
この結果から,任意のDec-POMDP解法をマルチエージェント能動認識問題に適用し,共同推定の明示的な計算を行なわずに不確実性を抑えることが可能となった。
論文 参考訳(メタデータ) (2020-10-22T16:10:15Z) - Discrete Action On-Policy Learning with Action-Value Critic [72.20609919995086]
離散的な行動空間における強化学習(RL)は、実世界の応用では至るところで行われているが、その複雑さは行動空間次元とともに指数関数的に増大する。
我々は,行動値関数を推定し,相関行動に適用し,これらの評価値を組み合わせて勾配推定の分散を制御する。
これらの取り組みにより、分散制御技術に頼って、関連するRLアルゴリズムを実証的に上回る、新たな離散的なRLアルゴリズムが実現される。
論文 参考訳(メタデータ) (2020-02-10T04:23:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。