論文の概要: Robust Verification of Concurrent Stochastic Games
- arxiv url: http://arxiv.org/abs/2601.12003v2
- Date: Wed, 21 Jan 2026 09:31:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-22 14:57:00.069689
- Title: Robust Verification of Concurrent Stochastic Games
- Title(参考訳): 同時確率ゲームにおけるロバスト検証
- Authors: Angel Y. He, David Parker,
- Abstract要約: 我々は *robust CSGs* とそのサブクラス *interval CSGs* (ICSGs) を紹介する。
本稿では、遷移の不確実性に関する最悪の仮定の下で、これらのモデルの *robust* 検証のための新しいフレームワークを提案する。
我々はPRISMgamesモデルチェッカーの実装を構築し、大規模なベンチマークからICSGの堅牢な検証が可能であることを実証する。
- 参考スコア(独自算出の注目度): 3.2964666213105587
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous systems often operate in multi-agent settings and need to make concurrent, strategic decisions, typically in uncertain environments. Verification and control problems for these systems can be tackled with concurrent stochastic games (CSGs), but this model requires transition probabilities to be precisely specified - an unrealistic requirement in many real-world settings. We introduce *robust CSGs* and their subclass *interval CSGs* (ICSGs), which capture epistemic uncertainty about transition probabilities in CSGs. We propose a novel framework for *robust* verification of these models under worst-case assumptions about transition uncertainty. Specifically, we develop the underlying theoretical foundations and efficient algorithms, for finite- and infinite-horizon objectives in both zero-sum and nonzero-sum settings, the latter based on (social-welfare optimal) Nash equilibria. We build an implementation in the PRISM-games model checker and demonstrate the feasibility of robust verification of ICSGs across a selection of large benchmarks.
- Abstract(参考訳): 自律システムは、しばしばマルチエージェント環境で動作し、通常は不確実な環境で、同時かつ戦略的決定を行う必要がある。
これらのシステムの検証と制御問題は、CSG(Concurrent Stochastic Game)に対処することができるが、このモデルは、多くの現実世界で非現実的な要件である遷移確率を正確に指定する必要がある。
我々は,CSGsの遷移確率に関する疫学的な不確実性を捉えた, *robust CSGs* とそのサブクラス *interval CSGs* (ICSGs) を紹介する。
本稿では、遷移の不確実性に関する最悪の仮定の下で、これらのモデルの *robust* 検証のための新しいフレームワークを提案する。
具体的には、ゼロサムと非ゼロサム設定の両方において有限および無限水平目的に対して基礎となる理論的基礎と効率的なアルゴリズムを開発する。
我々はPRISM-Gamesモデルチェッカーの実装を構築し、大規模なベンチマークからICSGの堅牢な検証が可能であることを実証する。
関連論文リスト
- SURE: Semi-dense Uncertainty-REfined Feature Matching [28.68008638977835]
SUREは、一致と信頼を共同で予測する半密度不確実性再定義マッチングフレームワークである。
我々のアプローチは、軽量な空間融合モジュールとともに、信頼に値する座標回帰のための新しい明らかな頭部を軌道に乗せる。
提案手法は精度と効率の両面で既存の最先端のセミセンスマッチングモデルより一貫して優れている。
論文 参考訳(メタデータ) (2026-03-05T06:53:11Z) - GTS: Inference-Time Scaling of Latent Reasoning with a Learnable Gaussian Thought Sampler [54.10960908347221]
我々は、学習可能な密度から条件付きサンプリングとして潜在思考探索をモデル化し、このアイデアをガウス思想サンプリング(GTS)としてインスタンス化する。
GTSは、連続的推論状態における文脈依存摂動分布を予測し、バックボーンを凍結させながらGRPOスタイルのポリシー最適化を訓練する。
論文 参考訳(メタデータ) (2026-02-15T09:57:47Z) - CreditAudit: 2$^\ ext{nd}$ Dimension for LLM Evaluation and Selection [44.251742023911135]
CreditAuditはデプロイ指向の信用監査フレームワークで、セマンティックアライメントと非敵対的なシステムプロンプトテンプレートのファミリ下でモデルを評価する。
同様の平均能力を持つモデルは、かなり異なる変動を示し、安定リスクは、エージェントまたは高失敗コストの制度における優先順位決定を覆す可能性があることを示す。
論文 参考訳(メタデータ) (2026-01-23T07:53:25Z) - A Statistical Side-Channel Risk Model for Timing Variability in Lattice-Based Post-Quantum Cryptography [0.0]
タイミングサイドチャネルは、実装で対処する必要がある暗号にとって重要な脅威である。
格子ベースのスキームは、複雑な算術と制御フローの助けを借りて、秘密依存のタイミング可変を生成する。
制御された実行条件下での分布微分可能性の問題として, タイミングリークに対するシナリオベース統計リスクモデルを提案する。
論文 参考訳(メタデータ) (2025-12-26T03:12:33Z) - NDCG-Consistent Softmax Approximation with Accelerated Convergence [67.10365329542365]
本稿では,ランキングの指標と直接一致した新たな損失定式化を提案する。
提案したRG損失を高効率な Alternating Least Squares (ALS) 最適化手法と統合する。
実世界のデータセットに対する実証的な評価は、我々のアプローチが同等または上位のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2025-06-11T06:59:17Z) - Automatically Adaptive Conformal Risk Control [49.95190019041905]
本稿では,テストサンプルの難易度に適応して,統計的リスクの近似的条件制御を実現する手法を提案する。
我々のフレームワークは、ユーザが提供するコンディショニングイベントに基づく従来のコンディショニングリスク制御を超えて、コンディショニングに適した関数クラスのアルゴリズム的、データ駆動決定を行う。
論文 参考訳(メタデータ) (2024-06-25T08:29:32Z) - LLM4Rerank: LLM-based Auto-Reranking Framework for Recommendations [51.76373105981212]
リグレードはレコメンデーションシステムにおいて重要な要素であり、レコメンデーションアルゴリズムの出力を精査する上で重要な役割を果たす。
そこで我々は,様々な格付け基準をシームレスに統合する包括的格付けフレームワークを提案する。
カスタマイズ可能な入力機構も統合されており、言語モデルのフォーカスを特定の再配置のニーズに合わせることができる。
論文 参考訳(メタデータ) (2024-06-18T09:29:18Z) - Asynchronous Federated Learning with Incentive Mechanism Based on
Contract Theory [5.502596101979607]
本稿では,契約理論に基づくインセンティブ機構を統合した新しい非同期FLフレームワークを提案する。
攻撃対象のローカルSGDよりも精度が1.35%向上した。
論文 参考訳(メタデータ) (2023-10-10T09:17:17Z) - Calibrated Stackelberg Games: Learning Optimal Commitments Against
Calibrated Agents [15.145023509806977]
Calibrated Stackelberg Games (CSGs)は、新しいタイプのStackelberg Games (SGs)である。
CSGでは、プリンシパルは(標準のSGとは対照的に)エージェントと繰り返し対話し、プリンシパルのアクションに直接アクセスするのではなく、それに関するキャリブレーションされた予測に対応する。
CSGでは,ゲームにおける最適スタックルバーグ値に収束するユーティリティを,有限条件と連続条件の両方で実現可能であることを示す。
論文 参考訳(メタデータ) (2023-06-05T08:55:50Z) - Rational Verification for Probabilistic Systems [2.4254101826561847]
我々は確率的システムにおける合理的な検証の理論とアルゴリズムを開発する。
複雑なマルチエージェント環境における不確実性とランダム性をモデル化するための並列ゲーム(CSG)に焦点を当てる。
論文 参考訳(メタデータ) (2021-07-19T19:24:16Z) - Stochastic Gradient Descent-Ascent and Consensus Optimization for Smooth
Games: Convergence Analysis under Expected Co-coercivity [49.66890309455787]
本稿では,SGDA と SCO の最終的な収束保証として,期待されるコヒーレンシティ条件を導入し,その利点を説明する。
定常的なステップサイズを用いた場合、両手法の線形収束性を解の近傍に証明する。
我々の収束保証は任意のサンプリングパラダイムの下で保たれ、ミニバッチの複雑さに関する洞察を与える。
論文 参考訳(メタデータ) (2021-06-30T18:32:46Z) - Pointwise Feasibility of Gaussian Process-based Safety-Critical Control
under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。
本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-13T23:08:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。