論文の概要: Robust Verification of Concurrent Stochastic Games
- arxiv url: http://arxiv.org/abs/2601.12003v2
- Date: Wed, 21 Jan 2026 09:31:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-22 14:57:00.069689
- Title: Robust Verification of Concurrent Stochastic Games
- Title(参考訳): 同時確率ゲームにおけるロバスト検証
- Authors: Angel Y. He, David Parker,
- Abstract要約: 我々は *robust CSGs* とそのサブクラス *interval CSGs* (ICSGs) を紹介する。
本稿では、遷移の不確実性に関する最悪の仮定の下で、これらのモデルの *robust* 検証のための新しいフレームワークを提案する。
我々はPRISMgamesモデルチェッカーの実装を構築し、大規模なベンチマークからICSGの堅牢な検証が可能であることを実証する。
- 参考スコア(独自算出の注目度): 3.2964666213105587
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous systems often operate in multi-agent settings and need to make concurrent, strategic decisions, typically in uncertain environments. Verification and control problems for these systems can be tackled with concurrent stochastic games (CSGs), but this model requires transition probabilities to be precisely specified - an unrealistic requirement in many real-world settings. We introduce *robust CSGs* and their subclass *interval CSGs* (ICSGs), which capture epistemic uncertainty about transition probabilities in CSGs. We propose a novel framework for *robust* verification of these models under worst-case assumptions about transition uncertainty. Specifically, we develop the underlying theoretical foundations and efficient algorithms, for finite- and infinite-horizon objectives in both zero-sum and nonzero-sum settings, the latter based on (social-welfare optimal) Nash equilibria. We build an implementation in the PRISM-games model checker and demonstrate the feasibility of robust verification of ICSGs across a selection of large benchmarks.
- Abstract(参考訳): 自律システムは、しばしばマルチエージェント環境で動作し、通常は不確実な環境で、同時かつ戦略的決定を行う必要がある。
これらのシステムの検証と制御問題は、CSG(Concurrent Stochastic Game)に対処することができるが、このモデルは、多くの現実世界で非現実的な要件である遷移確率を正確に指定する必要がある。
我々は,CSGsの遷移確率に関する疫学的な不確実性を捉えた, *robust CSGs* とそのサブクラス *interval CSGs* (ICSGs) を紹介する。
本稿では、遷移の不確実性に関する最悪の仮定の下で、これらのモデルの *robust* 検証のための新しいフレームワークを提案する。
具体的には、ゼロサムと非ゼロサム設定の両方において有限および無限水平目的に対して基礎となる理論的基礎と効率的なアルゴリズムを開発する。
我々はPRISM-Gamesモデルチェッカーの実装を構築し、大規模なベンチマークからICSGの堅牢な検証が可能であることを実証する。
関連論文リスト
- A Statistical Side-Channel Risk Model for Timing Variability in Lattice-Based Post-Quantum Cryptography [0.0]
タイミングサイドチャネルは、実装で対処する必要がある暗号にとって重要な脅威である。
格子ベースのスキームは、複雑な算術と制御フローの助けを借りて、秘密依存のタイミング可変を生成する。
制御された実行条件下での分布微分可能性の問題として, タイミングリークに対するシナリオベース統計リスクモデルを提案する。
論文 参考訳(メタデータ) (2025-12-26T03:12:33Z) - NDCG-Consistent Softmax Approximation with Accelerated Convergence [67.10365329542365]
本稿では,ランキングの指標と直接一致した新たな損失定式化を提案する。
提案したRG損失を高効率な Alternating Least Squares (ALS) 最適化手法と統合する。
実世界のデータセットに対する実証的な評価は、我々のアプローチが同等または上位のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2025-06-11T06:59:17Z) - Automatically Adaptive Conformal Risk Control [49.95190019041905]
本稿では,テストサンプルの難易度に適応して,統計的リスクの近似的条件制御を実現する手法を提案する。
我々のフレームワークは、ユーザが提供するコンディショニングイベントに基づく従来のコンディショニングリスク制御を超えて、コンディショニングに適した関数クラスのアルゴリズム的、データ駆動決定を行う。
論文 参考訳(メタデータ) (2024-06-25T08:29:32Z) - LLM4Rerank: LLM-based Auto-Reranking Framework for Recommendations [51.76373105981212]
リグレードはレコメンデーションシステムにおいて重要な要素であり、レコメンデーションアルゴリズムの出力を精査する上で重要な役割を果たす。
そこで我々は,様々な格付け基準をシームレスに統合する包括的格付けフレームワークを提案する。
カスタマイズ可能な入力機構も統合されており、言語モデルのフォーカスを特定の再配置のニーズに合わせることができる。
論文 参考訳(メタデータ) (2024-06-18T09:29:18Z) - Asynchronous Federated Learning with Incentive Mechanism Based on
Contract Theory [5.502596101979607]
本稿では,契約理論に基づくインセンティブ機構を統合した新しい非同期FLフレームワークを提案する。
攻撃対象のローカルSGDよりも精度が1.35%向上した。
論文 参考訳(メタデータ) (2023-10-10T09:17:17Z) - Calibrated Stackelberg Games: Learning Optimal Commitments Against
Calibrated Agents [15.145023509806977]
Calibrated Stackelberg Games (CSGs)は、新しいタイプのStackelberg Games (SGs)である。
CSGでは、プリンシパルは(標準のSGとは対照的に)エージェントと繰り返し対話し、プリンシパルのアクションに直接アクセスするのではなく、それに関するキャリブレーションされた予測に対応する。
CSGでは,ゲームにおける最適スタックルバーグ値に収束するユーティリティを,有限条件と連続条件の両方で実現可能であることを示す。
論文 参考訳(メタデータ) (2023-06-05T08:55:50Z) - Rational Verification for Probabilistic Systems [2.4254101826561847]
我々は確率的システムにおける合理的な検証の理論とアルゴリズムを開発する。
複雑なマルチエージェント環境における不確実性とランダム性をモデル化するための並列ゲーム(CSG)に焦点を当てる。
論文 参考訳(メタデータ) (2021-07-19T19:24:16Z) - Stochastic Gradient Descent-Ascent and Consensus Optimization for Smooth
Games: Convergence Analysis under Expected Co-coercivity [49.66890309455787]
本稿では,SGDA と SCO の最終的な収束保証として,期待されるコヒーレンシティ条件を導入し,その利点を説明する。
定常的なステップサイズを用いた場合、両手法の線形収束性を解の近傍に証明する。
我々の収束保証は任意のサンプリングパラダイムの下で保たれ、ミニバッチの複雑さに関する洞察を与える。
論文 参考訳(メタデータ) (2021-06-30T18:32:46Z) - Pointwise Feasibility of Gaussian Process-based Safety-Critical Control
under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。
本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-13T23:08:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。