論文の概要: Learning to run a power network with trust
- arxiv url: http://arxiv.org/abs/2110.12908v1
- Date: Thu, 21 Oct 2021 18:57:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-01 05:58:52.192195
- Title: Learning to run a power network with trust
- Title(参考訳): 信頼で電力ネットワークを実行することを学ぶ
- Authors: Antoine Marot, Benjamin Donnot, Karim Chaouache, Adrian Kelly, Qiuhua
Huang, Ramij-Raja Hossain, Jochen L. Cremer
- Abstract要約: 我々は,このループを人間とみなし,この問題に対する独自の定式化を提案する。
まず,提案手法が信頼性の低いエージェントを前もって操作者アラームに送信する能力を持つエージェントを前進させる。
我々は、オペレーターが利用できる注意をアラームの送信時に減少する予算としてモデル化する。
- 参考スコア(独自算出の注目度): 0.769672852567215
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Artificial agents are promising for realtime power system operations,
particularly, to compute remedial actions for congestion management. Currently,
these agents are limited to only autonomously run by themselves. However,
autonomous agents will not be deployed any time soon. Operators will still be
in charge of taking action in the future. Aiming at designing an assistant for
operators, we here consider humans in the loop and propose an original
formulation for this problem. We first advance an agent with the ability to
send to the operator alarms ahead of time when the proposed actions are of low
confidence. We further model the operator's available attention as a budget
that decreases when alarms are sent. We present the design and results of our
competition "Learning to run a power network with trust" in which we benchmark
the ability of submitted agents to send relevant alarms while operating the
network to their best.
- Abstract(参考訳): 人工エージェントはリアルタイム電力系統の運用、特に混雑管理のための仲介動作を計算することを約束している。
現在、これらのエージェントは自律走行のみに限定されている。
しかし、自律型エージェントはすぐには配備されない。
オペレーターは今後も行動を起こす責任を負う。
本稿では,オペレータのためのアシスタントの設計を目指して,ループ内の人間を考察し,この問題に対する独自の定式化を提案する。
まず,提案する動作が信頼性が低い場合に,先行してオペレータアラームに送信する能力を有するエージェントを前進させる。
我々は、オペレーターが利用できる注意をアラーム送信時に減少する予算としてモデル化する。
我々は,提案するエージェントがネットワークを最大限に運用しながら,関連するアラームを送信する能力のベンチマークを行う「信頼を持って電力ネットワークを実行する学習」の設計と結果を示す。
関連論文リスト
- Robust Defense Against Extreme Grid Events Using Dual-Policy Reinforcement Learning Agents [0.0]
強化学習(RL)エージェントは電力グリッドを管理する強力なツールである。
大量のデータを使ってアクションを通知し、フィードバックとして報酬を受け取り、システムに対して好意的な反応を学習する。
この能力は、RL剤の需要が増加している電力ネットワークの脱炭に特に有用である。
論文 参考訳(メタデータ) (2024-11-17T21:30:48Z) - Asynchronous Tool Usage for Real-Time Agents [61.3041983544042]
並列処理とリアルタイムツール利用が可能な非同期AIエージェントを導入する。
私たちの重要な貢献は、エージェントの実行とプロンプトのためのイベント駆動有限状態マシンアーキテクチャです。
この研究は、流体とマルチタスクの相互作用が可能なAIエージェントを作成するための概念的なフレームワークと実践的なツールの両方を提示している。
論文 参考訳(メタデータ) (2024-10-28T23:57:19Z) - Agent-as-a-Judge: Evaluate Agents with Agents [61.33974108405561]
本稿ではエージェント・アズ・ア・ジャッジ(Agent-as-a-Judge)フレームワークを紹介し,エージェント・システムを用いてエージェント・システムの評価を行う。
これはLLM-as-a-Judgeフレームワークの有機的拡張であり、タスク解決プロセス全体の中間フィードバックを可能にするエージェント的特徴を取り入れている。
55のリアルな自動化AI開発タスクのベンチマークであるDevAIを紹介します。
論文 参考訳(メタデータ) (2024-10-14T17:57:02Z) - Imitation Learning for Intra-Day Power Grid Operation through Topology Actions [0.24578723416255752]
本研究では、トポロジ的動作による日頭電力グリッド動作における模倣学習の性能について検討する。
我々は、専門家のステートアクションペアに完全接続ニューラルネットワーク(FCNN)をトレーニングし、それを2つの方法で評価する。
パワーシステムエージェントとして、FCNNは専門家エージェントよりもわずかに劣っている。
論文 参考訳(メタデータ) (2024-07-29T10:34:19Z) - Multi-Agent Neural Rewriter for Vehicle Routing with Limited Disclosure
of Costs [65.23158435596518]
チームのマルコフゲームとして、部分的に観測可能なコストでマルチサイクルルーティング問題を解く。
我々のマルチエージェント強化学習アプローチである、いわゆるマルチエージェントニューラルリライタは、1エージェントニューラルリライタを利用して、反復的に書き換えるソリューションによって問題を解決する。
論文 参考訳(メタデータ) (2022-06-13T09:17:40Z) - The Concept of Criticality in AI Safety [8.442084903594528]
AIエージェントが行動と人間の価値観を一致させなければ、深刻な害を引き起こす可能性がある。
バリューアライメント問題を解決する方法の1つは、エージェントのすべてのアクションを監視する人間のオペレータを含めることである。
我々は、オペレータが監視タスクを無視することなく、他のアクティビティに関わることができる、より効率的なソリューションを提案する。
論文 参考訳(メタデータ) (2022-01-12T17:44:22Z) - Multiagent Model-based Credit Assignment for Continuous Control [3.2595483703857835]
本研究は,継続的制御のための分散マルチエージェント強化学習フレームワークを提案する。
我々はまず,集中型最適化が可能な協調型マルチエージェントPPOフレームワークを開発する。
次にエージェント固有の報酬信号を計算する汎用ゲーム理論クレジット割り当てフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-27T23:26:00Z) - Learning Connectivity for Data Distribution in Robot Teams [96.39864514115136]
グラフニューラルネットワーク(GNN)を用いたアドホックネットワークにおけるデータ分散のためのタスク非依存,分散化,低レイテンシ手法を提案する。
当社のアプローチは、グローバル状態情報に基づいたマルチエージェントアルゴリズムを各ロボットで利用可能にすることで機能させます。
我々は,情報の平均年齢を報酬関数として強化学習を通じて分散gnn通信政策を訓練し,タスク固有の報酬関数と比較してトレーニング安定性が向上することを示す。
論文 参考訳(メタデータ) (2021-03-08T21:48:55Z) - Adversarial Attacks On Multi-Agent Communication [80.4392160849506]
現代の自律システムはすぐに大規模に展開され、協調型マルチエージェントシステムの可能性を広げる。
このような利点は、セキュリティ侵害に対して脆弱であることが示されている通信チャネルに大きく依存している。
本稿では,エージェントが学習した中間表現を共有してコミュニケーションする新しいマルチエージェント環境において,このような攻撃を探索する。
論文 参考訳(メタデータ) (2021-01-17T00:35:26Z) - Safe Reinforcement Learning via Curriculum Induction [94.67835258431202]
安全クリティカルなアプリケーションでは、自律エージェントはミスが非常にコストがかかる環境で学ぶ必要がある。
既存の安全な強化学習手法は、エージェントが危険な状況を避けるために、事前にエージェントを頼りにしている。
本稿では,エージェントが自動インストラクターの指導の下で学習する,人間の指導にインスパイアされた代替手法を提案する。
論文 参考訳(メタデータ) (2020-06-22T10:48:17Z) - Resource Management in Wireless Networks via Multi-Agent Deep
Reinforcement Learning [15.091308167639815]
マルチエージェント深部強化学習(RL)を用いた無線ネットワークにおける分散リソース管理と干渉軽減機構を提案する。
ネットワーク内の各送信機に深部RLエージェントを装備し、それに関連するユーザからの遅延観測を受信するとともに、近隣のエージェントと観測を交換する。
提案フレームワークは,エージェントが他のエージェントの同時決定を知らずに,同時かつ分散的に意思決定を行うことを可能にする。
論文 参考訳(メタデータ) (2020-02-14T19:01:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。