論文の概要: Deep Recurrent Q-learning for Energy-constrained Coverage with a Mobile
Robot
- arxiv url: http://arxiv.org/abs/2210.00327v1
- Date: Sat, 1 Oct 2022 17:34:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 13:39:59.758593
- Title: Deep Recurrent Q-learning for Energy-constrained Coverage with a Mobile
Robot
- Title(参考訳): 移動ロボットを用いたエネルギー制約被覆のための深部繰り返しQ-ラーニング
- Authors: Aaron Zellner, Ayan Dutta, Iliya Kulbaka, Gokarna Sharma
- Abstract要約: 本研究では,複数の充電ステーションの存在下でのエネルギー制約型ロボットによる環境被覆の問題について検討する。
ロボットの電源は限られているので、環境のすべての点を1回の充電でカバーできるエネルギーは十分ではないかもしれない。
本稿では,包括性を最大化し,予算違反を最小限に抑える政策を策定する深層Q-ラーニングフレームワークを提案する。
- 参考スコア(独自算出の注目度): 4.817429789586126
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we study the problem of coverage of an environment with an
energy-constrained robot in the presence of multiple charging stations. As the
robot's on-board power supply is limited, it might not have enough energy to
cover all the points in the environment with a single charge. Instead, it will
need to stop at one or more charging stations to recharge its battery
intermittently. The robot cannot violate the energy constraint, i.e., visit a
location with negative available energy. To solve this problem, we propose a
deep Q-learning framework that produces a policy to maximize the coverage and
minimize the budget violations. Our proposed framework also leverages the
memory of a recurrent neural network (RNN) to better suit this multi-objective
optimization problem. We have tested the presented framework within a 16 x 16
grid environment having charging stations and various obstacle configurations.
Results show that our proposed method finds feasible solutions and outperforms
a comparable existing technique.
- Abstract(参考訳): 本稿では,複数の充電ステーションの存在下でのエネルギー制約型ロボットによる環境被覆の問題点について検討する。
ロボットの電源は限られているので、環境のすべての点を1回の充電でカバーできるエネルギーは十分ではないかもしれない。
代わりに、バッテリーを断続的に充電するには1つまたは複数の充電ステーションで停止する必要がある。
ロボットはエネルギー制約、すなわち負のエネルギーのある場所を訪れることはできない。
この問題を解決するために,我々は,カバー範囲を最大化し,予算違反を最小限に抑えるためのポリシを生成する,深層q学習フレームワークを提案する。
また,提案フレームワークでは,再帰ニューラルネットワーク(rnn)のメモリを活用して,この多目的最適化問題に適合する。
提案フレームワークを16×16のグリッド環境において,充電ステーションと各種障害物設定を備えたテストを行った。
その結果,提案手法は実現可能な解を見つけ,既存の手法に匹敵する性能を示した。
関連論文リスト
- Generalizability of Graph Neural Networks for Decentralized Unlabeled Motion Planning [72.86540018081531]
ラベルなしの動作計画では、衝突回避を確保しながら、ロボットのセットを目標の場所に割り当てる。
この問題は、探査、監視、輸送などの応用において、マルチロボットシステムにとって不可欠なビルディングブロックを形成している。
この問題に対処するために、各ロボットは、その400ドルのアネレストロボットと$k$アネレストターゲットの位置のみを知っている分散環境で対処する。
論文 参考訳(メタデータ) (2024-09-29T23:57:25Z) - Formalizing, Normalizing, and Splitting the Energy Network Re-Dispatch for Quantum Annealing [37.81697222352684]
断熱量子計算(AQC)は、量子系の基底状態を近似するための確立された方法である。
本研究では,エネルギーネットワーク再ディスパッチ問題における課題について検討する。
本結果は,オープンソースのエネルギーネットワークシミュレーションのベースラインと比較した。
論文 参考訳(メタデータ) (2024-09-15T20:29:40Z) - E-QUARTIC: Energy Efficient Edge Ensemble of Convolutional Neural Networks for Resource-Optimized Learning [9.957458251671486]
Convolutional Neural Networks(CNN)のようなモデルを組み立てると、メモリとコンピューティングのオーバーヘッドが高くなり、組み込みシステムへのデプロイが妨げられる。
人工知能(AI)をベースとした組込みシステムを対象としたCNNのアンサンブルを構築するための,新しいエネルギー効率の良いエッジ組立フレームワークであるE-QUARTICを提案する。
論文 参考訳(メタデータ) (2024-09-12T19:30:22Z) - Distributed Management of Fluctuating Energy Resources in Dynamic Networked Systems [3.716849174391564]
本稿では,複数のDERからなるシステムにおけるエネルギー共有問題について検討する。
我々はこの問題を,各ノードのエネルギー生産限界に対応する制約付き帯域凸最適化問題としてモデル化する。
そこで我々は, 動的後悔という概念をパフォーマンス指標として活用する, 定式化問題を解決するために, 分散意思決定ポリシーを提案する。
論文 参考訳(メタデータ) (2024-05-29T11:54:11Z) - Energy Regularized RNNs for Solving Non-Stationary Bandit Problems [97.72614340294547]
我々は、ニューラルネットワークが特定の行動を支持するのに自信過剰になるのを防ぐエネルギー用語を提案する。
提案手法は,ロッティングバンドのサブプロブレムを解く方法と同じくらい有効であることを示す。
論文 参考訳(メタデータ) (2023-03-12T03:32:43Z) - Unsupervised Optimal Power Flow Using Graph Neural Networks [172.33624307594158]
グラフニューラルネットワークを用いて、要求された電力と対応するアロケーションとの間の非線形パラメトリゼーションを学習する。
シミュレーションを通して、この教師なし学習コンテキストにおけるGNNの使用は、標準解法に匹敵するソリューションにつながることを示す。
論文 参考訳(メタデータ) (2022-10-17T17:30:09Z) - Adversarially Robust Learning for Security-Constrained Optimal Power
Flow [55.816266355623085]
我々は、N-kセキュリティ制約付き最適電力流(SCOPF)の課題に取り組む。
N-k SCOPFは電力網の運用における中核的な問題である。
N-k SCOPF を極小最適化問題とみなす。
論文 参考訳(メタデータ) (2021-11-12T22:08:10Z) - ECO: Enabling Energy-Neutral IoT Devices through Runtime Allocation of
Harvested Energy [0.8774604259603302]
本稿では,エネルギー制約下での目標デバイスの有用性を最適化するランタイムベースのエネルギー配分フレームワークを提案する。
提案フレームワークは, 効率的な反復アルゴリズムを用いて, 初期エネルギー割り当てを1日の初めに計算する。
このフレームワークは、太陽と運動エネルギーの収穫モードと、4772の異なるユーザーからのアメリカンタイムユースサーベイデータを使用して評価します。
論文 参考訳(メタデータ) (2021-02-26T17:21:25Z) - Exploring Energy-Accuracy Tradeoffs in AI Hardware [0.0]
我々は、アプリケーション依存のエネルギー要求を満たすために、AIシステムが最小限の精度で運用する必要があるシナリオを考察する。
本稿では,AIシステムのコストを意思決定プロセスのコストと意思決定実行のコストに分割する簡易関数を提案する。
論文 参考訳(メタデータ) (2020-11-17T17:14:28Z) - Demand-Side Scheduling Based on Multi-Agent Deep Actor-Critic Learning
for Smart Grids [56.35173057183362]
家庭用家電をネットでスケジュールできるスマートメーターが各家庭に備わっている需要側エネルギー管理の問題点を考察する。
目標は、リアルタイムの料金体系の下で全体のコストを最小化することです。
マルコフゲームとしてスマートグリッド環境の定式化を提案する。
論文 参考訳(メタデータ) (2020-05-05T07:32:40Z) - Risk-Aware Energy Scheduling for Edge Computing with Microgrid: A
Multi-Agent Deep Reinforcement Learning Approach [82.6692222294594]
マイクログリッドを用いたMECネットワークにおけるリスク対応エネルギースケジューリング問題について検討する。
ニューラルネットワークを用いたマルチエージェントディープ強化学習(MADRL)に基づくアドバンテージアクター・クリティック(A3C)アルゴリズムを適用し,その解を導出する。
論文 参考訳(メタデータ) (2020-02-21T02:14:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。