論文の概要: Partially Observable Games for Secure Autonomy
- arxiv url: http://arxiv.org/abs/2002.01969v1
- Date: Wed, 5 Feb 2020 19:31:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 21:57:13.767534
- Title: Partially Observable Games for Secure Autonomy
- Title(参考訳): 安全な自律のための部分的に観察可能なゲーム
- Authors: Mohamadreza Ahmadi, Arun A. Viswanathan, Michel D. Ingham, Kymie Tan,
and Aaron D. Ames
- Abstract要約: 2人のプレイヤーによる部分的に観察可能なゲームフォーマリズムは、不確実性の下でのハイレベルな自律ミッション計画と、不完全な情報に基づく敵の意思決定の両方を捉えることを提案した。
自律型意思決定とサイバーアドバイザリーの両方の有限メモリ仮定の下で,このようなゲームに対する準最適戦略の合成が可能であることを示す。
- 参考スコア(独自算出の注目度): 24.23487459915111
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Technology development efforts in autonomy and cyber-defense have been
evolving independently of each other, over the past decade. In this paper, we
report our ongoing effort to integrate these two presently distinct areas into
a single framework. To this end, we propose the two-player partially observable
stochastic game formalism to capture both high-level autonomous mission
planning under uncertainty and adversarial decision making subject to imperfect
information. We show that synthesizing sub-optimal strategies for such games is
possible under finite-memory assumptions for both the autonomous decision maker
and the cyber-adversary. We then describe an experimental testbed to evaluate
the efficacy of the proposed framework.
- Abstract(参考訳): 自律性とサイバー防衛における技術開発努力は、過去10年間、互いに独立して進化してきた。
本稿では,この2つの異なる領域をひとつのフレームワークに統合する取り組みについて報告する。
そこで本稿では,不確実性の下での高レベルの自律ミッション計画と,不完全情報に基づく対角的決定の両方を捉えるために,2人のプレイヤーによる部分的に観測可能な確率的ゲームフォーマリズムを提案する。
自律型意思決定とサイバーアドバイザリーの両方において,そのようなゲームに対する準最適戦略の合成が有限メモリの仮定の下で可能であることを示す。
次に,提案フレームワークの有効性を評価する実験台について述べる。
関連論文リスト
- Automated Security Response through Online Learning with Adaptive
Conjectures [14.5729517924905]
我々はITインフラに対する自動セキュリティ対応について研究する。
我々は攻撃者とディフェンダーとの相互作用を部分的に観察された非静止ゲームとして定式化する。
論文 参考訳(メタデータ) (2024-02-19T20:06:15Z) - Counterfactual Prediction Under Selective Confounding [3.6860485638625673]
この研究は、全ての共同創設者が知られていない場合、バイナリ処理とその結果の間の因果推論を行うという課題に対処する。
我々は、希望する処置の下ですべての共同創設者を知るという要求を緩和し、選択的共起(Selective Confounding)と呼ぶ。
提案手法の有効性に関する理論的誤差境界と実証的証拠の両方を,実世界と実世界の子配置データを用いて提示する。
論文 参考訳(メタデータ) (2023-10-21T16:54:59Z) - A Stochastic Online Forecast-and-Optimize Framework for Real-Time Energy
Dispatch in Virtual Power Plants under Uncertainty [18.485617498705736]
本稿では,2つの要素から構成されるリアルタイム不確実性を考慮したエネルギー分散フレームワークを提案する。
提案するフレームワークは,リアルタイムデータ配信に迅速に適応すると同時に,データドリフトやモデルの不一致,制御プロセスの環境摂動などによる不確実性もターゲットとすることができる。
このフレームワークはCityLearn Challenge 2022で優勝し、エネルギー領域におけるAIアプリケーションの可能性を調べる影響力のある機会となった。
論文 参考訳(メタデータ) (2023-09-15T00:04:00Z) - A Semantic Approach to Decidability in Epistemic Planning (Extended
Version) [72.77805489645604]
我々は決定可能性を達成するために新しい意味論的アプローチを用いる。
具体的には、知識の論理S5$_n$と(知識)可換性と呼ばれる相互作用公理を拡大する。
我々は,本フレームワークが,独立した知識である共通知識の有限的非固定点的特徴を認めていることを証明した。
論文 参考訳(メタデータ) (2023-07-28T11:26:26Z) - Reinforcement Learning with a Terminator [80.34572413850186]
我々は, TerMDP のパラメータを学習し, 推定問題の構造を活用し, 状態ワイドな信頼境界を提供する。
我々はこれらを用いて証明可能な効率のよいアルゴリズムを構築し、終端を考慮し、その後悔を抑える。
論文 参考訳(メタデータ) (2022-05-30T18:40:28Z) - Socially-Optimal Mechanism Design for Incentivized Online Learning [32.55657244414989]
マルチアーム・バンディット(英: Multi-arm bandit、MAB)は、不確実な環境でのシーケンシャルな意思決定を研究する古典的なオンライン学習フレームワークである。
これは、スペクトル共有、クラウドセンシング、エッジコンピューティングなど、多くのアプリケーションにおいて事実上重要なシナリオである。
本稿では,このシナリオに対するインセンティブ付きオンライン学習(IOL)フレームワークを確立する。
論文 参考訳(メタデータ) (2021-12-29T00:21:40Z) - Deep Structured Reactive Planning [94.92994828905984]
自動運転のための新しいデータ駆動型リアクティブ計画目標を提案する。
本モデルは,非常に複雑な操作を成功させる上で,非反応性変種よりも優れることを示す。
論文 参考訳(メタデータ) (2021-01-18T01:43:36Z) - Safe Active Dynamics Learning and Control: A Sequential
Exploration-Exploitation Framework [30.58186749790728]
本研究では,力学の不確実性の存在下での安全性を維持するための理論的に正当なアプローチを提案する。
我々のフレームワークは、常に全ての制約の高確率満足度を保証します。
この理論解析は、オンライン適応能力を改善する最終層メタラーニングモデルの2つの正則化を動機付けている。
論文 参考訳(メタデータ) (2020-08-26T17:39:58Z) - Beyond Individual and Group Fairness [90.4666341812857]
本稿では,不公平な不公平な苦情に導かれる公平さの新しいデータ駆動モデルを提案する。
我々のモデルは、複数のフェアネス基準をサポートし、それらの潜在的な不整合を考慮に入れている。
論文 参考訳(メタデータ) (2020-08-21T14:14:44Z) - DSDNet: Deep Structured self-Driving Network [92.9456652486422]
本稿では,1つのニューラルネットワークを用いて物体検出,動き予測,動き計画を行うDeep Structured Self-Driving Network (DSDNet)を提案する。
我々は,アクター間の相互作用を考慮し,社会的に一貫したマルチモーダル未来予測を生成する,深く構造化されたエネルギーベースモデルを開発する。
論文 参考訳(メタデータ) (2020-08-13T17:54:06Z) - Towards Understanding the Adversarial Vulnerability of Skeleton-based
Action Recognition [133.35968094967626]
骨格に基づく行動認識は、動的状況への強い適応性から注目を集めている。
ディープラーニング技術の助けを借りて、かなり進歩し、現在、良識のある環境で約90%の精度を達成している。
異なる対角的環境下での骨格に基づく行動認識の脆弱性に関する研究はいまだ研究されていない。
論文 参考訳(メタデータ) (2020-05-14T17:12:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。