論文の概要: Deep Recurrent Q-learning for Energy-constrained Coverage with a Mobile
Robot
- arxiv url: http://arxiv.org/abs/2210.00327v1
- Date: Sat, 1 Oct 2022 17:34:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 13:39:59.758593
- Title: Deep Recurrent Q-learning for Energy-constrained Coverage with a Mobile
Robot
- Title(参考訳): 移動ロボットを用いたエネルギー制約被覆のための深部繰り返しQ-ラーニング
- Authors: Aaron Zellner, Ayan Dutta, Iliya Kulbaka, Gokarna Sharma
- Abstract要約: 本研究では,複数の充電ステーションの存在下でのエネルギー制約型ロボットによる環境被覆の問題について検討する。
ロボットの電源は限られているので、環境のすべての点を1回の充電でカバーできるエネルギーは十分ではないかもしれない。
本稿では,包括性を最大化し,予算違反を最小限に抑える政策を策定する深層Q-ラーニングフレームワークを提案する。
- 参考スコア(独自算出の注目度): 4.817429789586126
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we study the problem of coverage of an environment with an
energy-constrained robot in the presence of multiple charging stations. As the
robot's on-board power supply is limited, it might not have enough energy to
cover all the points in the environment with a single charge. Instead, it will
need to stop at one or more charging stations to recharge its battery
intermittently. The robot cannot violate the energy constraint, i.e., visit a
location with negative available energy. To solve this problem, we propose a
deep Q-learning framework that produces a policy to maximize the coverage and
minimize the budget violations. Our proposed framework also leverages the
memory of a recurrent neural network (RNN) to better suit this multi-objective
optimization problem. We have tested the presented framework within a 16 x 16
grid environment having charging stations and various obstacle configurations.
Results show that our proposed method finds feasible solutions and outperforms
a comparable existing technique.
- Abstract(参考訳): 本稿では,複数の充電ステーションの存在下でのエネルギー制約型ロボットによる環境被覆の問題点について検討する。
ロボットの電源は限られているので、環境のすべての点を1回の充電でカバーできるエネルギーは十分ではないかもしれない。
代わりに、バッテリーを断続的に充電するには1つまたは複数の充電ステーションで停止する必要がある。
ロボットはエネルギー制約、すなわち負のエネルギーのある場所を訪れることはできない。
この問題を解決するために,我々は,カバー範囲を最大化し,予算違反を最小限に抑えるためのポリシを生成する,深層q学習フレームワークを提案する。
また,提案フレームワークでは,再帰ニューラルネットワーク(rnn)のメモリを活用して,この多目的最適化問題に適合する。
提案フレームワークを16×16のグリッド環境において,充電ステーションと各種障害物設定を備えたテストを行った。
その結果,提案手法は実現可能な解を見つけ,既存の手法に匹敵する性能を示した。
関連論文リスト
- PolyThrottle: Energy-efficient Neural Network Inference on Edge Devices [10.01838504586422]
ML駆動システムの連続運転は、推論中にかなりのエネルギー消費をもたらす。
本稿では,GPU,メモリ,CPU周波数などのデバイス上のハードウェア要素の構成が,通常の微調整によるNN推論のエネルギー消費に与える影響について検討する。
本稿では,Constrained Bayesian Optimization を用いて,各ハードウェアコンポーネント間の構成をエネルギー保存的に最適化するPolyThrottleを提案する。
論文 参考訳(メタデータ) (2023-10-30T20:19:41Z) - Sustainable Edge Intelligence Through Energy-Aware Early Exiting [0.726437825413781]
EHエッジインテリジェンスシステムにおいて,エネルギー適応型動的早期退避を提案する。
提案手法は, サンプルごとの最適計算量を決定する, エネルギー対応のEEポリシーを導出する。
その結果, エネルギーに依存しない政策と比較して, 精度は25%, サービスレートは35%向上した。
論文 参考訳(メタデータ) (2023-05-23T14:17:44Z) - Energy Regularized RNNs for Solving Non-Stationary Bandit Problems [97.72614340294547]
我々は、ニューラルネットワークが特定の行動を支持するのに自信過剰になるのを防ぐエネルギー用語を提案する。
提案手法は,ロッティングバンドのサブプロブレムを解く方法と同じくらい有効であることを示す。
論文 参考訳(メタデータ) (2023-03-12T03:32:43Z) - Unsupervised Optimal Power Flow Using Graph Neural Networks [172.33624307594158]
グラフニューラルネットワークを用いて、要求された電力と対応するアロケーションとの間の非線形パラメトリゼーションを学習する。
シミュレーションを通して、この教師なし学習コンテキストにおけるGNNの使用は、標準解法に匹敵するソリューションにつながることを示す。
論文 参考訳(メタデータ) (2022-10-17T17:30:09Z) - Adversarially Robust Learning for Security-Constrained Optimal Power
Flow [55.816266355623085]
我々は、N-kセキュリティ制約付き最適電力流(SCOPF)の課題に取り組む。
N-k SCOPFは電力網の運用における中核的な問題である。
N-k SCOPF を極小最適化問題とみなす。
論文 参考訳(メタデータ) (2021-11-12T22:08:10Z) - Enforcing Policy Feasibility Constraints through Differentiable
Projection for Energy Optimization [57.88118988775461]
本稿では,ニューラルポリシー内での凸操作制約を強制するために,PROF(Projected Feasibility)を提案する。
エネルギー効率の高い建築操作とインバータ制御の2つの応用についてPROFを実証する。
論文 参考訳(メタデータ) (2021-05-19T01:58:10Z) - ECO: Enabling Energy-Neutral IoT Devices through Runtime Allocation of
Harvested Energy [0.8774604259603302]
本稿では,エネルギー制約下での目標デバイスの有用性を最適化するランタイムベースのエネルギー配分フレームワークを提案する。
提案フレームワークは, 効率的な反復アルゴリズムを用いて, 初期エネルギー割り当てを1日の初めに計算する。
このフレームワークは、太陽と運動エネルギーの収穫モードと、4772の異なるユーザーからのアメリカンタイムユースサーベイデータを使用して評価します。
論文 参考訳(メタデータ) (2021-02-26T17:21:25Z) - Exploring Energy-Accuracy Tradeoffs in AI Hardware [0.0]
我々は、アプリケーション依存のエネルギー要求を満たすために、AIシステムが最小限の精度で運用する必要があるシナリオを考察する。
本稿では,AIシステムのコストを意思決定プロセスのコストと意思決定実行のコストに分割する簡易関数を提案する。
論文 参考訳(メタデータ) (2020-11-17T17:14:28Z) - Demand-Side Scheduling Based on Multi-Agent Deep Actor-Critic Learning
for Smart Grids [56.35173057183362]
家庭用家電をネットでスケジュールできるスマートメーターが各家庭に備わっている需要側エネルギー管理の問題点を考察する。
目標は、リアルタイムの料金体系の下で全体のコストを最小化することです。
マルコフゲームとしてスマートグリッド環境の定式化を提案する。
論文 参考訳(メタデータ) (2020-05-05T07:32:40Z) - Risk-Aware Energy Scheduling for Edge Computing with Microgrid: A
Multi-Agent Deep Reinforcement Learning Approach [82.6692222294594]
マイクログリッドを用いたMECネットワークにおけるリスク対応エネルギースケジューリング問題について検討する。
ニューラルネットワークを用いたマルチエージェントディープ強化学習(MADRL)に基づくアドバンテージアクター・クリティック(A3C)アルゴリズムを適用し,その解を導出する。
論文 参考訳(メタデータ) (2020-02-21T02:14:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。