論文の概要: Norm-Governed Multi-Agent Decision-Making in Simulator-Coupled Environments:The Reinsurance Constrained Multi-Agent Simulation Process (R-CMASP)
- arxiv url: http://arxiv.org/abs/2512.09939v1
- Date: Thu, 04 Dec 2025 10:30:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-12 16:15:41.974172
- Title: Norm-Governed Multi-Agent Decision-Making in Simulator-Coupled Environments:The Reinsurance Constrained Multi-Agent Simulation Process (R-CMASP)
- Title(参考訳): シミュレータ結合環境におけるノルム支配型マルチエージェント意思決定:Reinsurance Constrained Multi-Agent Simulation Process (R-CMASP)
- Authors: Stella C. Dong,
- Abstract要約: マルチエージェントの協調を統括するドメイン校正された合成環境が,決定論的自動化よりも安定的で一貫性があり,規範に順応した行動をもたらすことを示す。
その結果, 制御されたシミュレータ駆動型意思決定環境は, 規範的, シミュレータ結合型マルチエージェントシステムとしてモデル化されていることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reinsurance decision-making exhibits the core structural properties that motivate multi-agent models: distributed and asymmetric information, partial observability, heterogeneous epistemic responsibilities, simulator-driven environment dynamics, and binding prudential and regulatory constraints. Deterministic workflow automation cannot meet these requirements, as it lacks the epistemic flexibility, cooperative coordination mechanisms, and norm-sensitive behaviour required for institutional risk-transfer. We propose the Reinsurance Constrained Multi-Agent Simulation Process (R-CMASP), a formal model that extends stochastic games and Dec-POMDPs by adding three missing elements: (i) simulator-coupled transition dynamics grounded in catastrophe, capital, and portfolio engines; (ii) role-specialized agents with structured observability, belief updates, and typed communication; and (iii) a normative feasibility layer encoding solvency, regulatory, and organizational rules as admissibility constraints on joint actions. Using LLM-based agents with tool access and typed message protocols, we show in a domain-calibrated synthetic environment that governed multi-agent coordination yields more stable, coherent, and norm-adherent behaviour than deterministic automation or monolithic LLM baselines--reducing pricing variance, improving capital efficiency, and increasing clause-interpretation accuracy. Embedding prudential norms as admissibility constraints and structuring communication into typed acts measurably enhances equilibrium stability. Overall, the results suggest that regulated, simulator-driven decision environments are most naturally modelled as norm-governed, simulator-coupled multi-agent systems.
- Abstract(参考訳): 再保険決定は、分散および非対称情報、部分可観測性、異種てんかんの責任、シミュレータ駆動環境力学、および結合プルーデンシャルおよび規制制約といった、マルチエージェントモデルを動機付ける中核的な構造特性を示す。
決定論的ワークフロー自動化は、エピステマティックな柔軟性、協調協調機構、そして制度的なリスク伝達に必要な規範に敏感な振る舞いが欠如しているため、これらの要件を満たすことができない。
Reinsurance Constrained Multi-Agent Simulation Process (R-CMASP)を提案する。
一 カタストロフィ、資本及びポートフォリオエンジンに接地したシミュレータ結合遷移ダイナミクス
二 構造化可観測性、信条更新及びタイプドコミュニケーションを有する役割特化剤
三 共同行動の許容制約として、可算性、規制及び組織規則を符号化する規範的実現レイヤ
ツールアクセスと型付きメッセージプロトコルを備えたLLMエージェントを用いて、マルチエージェント協調を管理するドメイン校正合成環境において、決定論的自動化やモノリシックなLCMベースラインよりも安定的で一貫性があり、規範に順応する振る舞いが得られ、価格の分散が低減し、資本効率が向上し、節解釈精度が向上することを示す。
適応性制約としてプルーデンシャルノルムを埋め込み、型付き行為へのコミュニケーションを構造化することは、平衡安定性を計測的に向上させる。
その結果, 制御されたシミュレータ駆動型意思決定環境が最も自然に, シミュレータ結合型マルチエージェントシステムとしてモデル化されていることが示唆された。
関連論文リスト
- Beyond Single-Agent Safety: A Taxonomy of Risks in LLM-to-LLM Interactions [0.0]
本稿では,大規模な言語モデルが相互に相互作用する環境に,人間-モデル相互作用用に設計された安全メカニズムがスケールしない理由について検討する。
モデルレベルの安全性からシステムレベルの安全性への概念的移行を提案し,ESRH(Emergent Systemic Risk Horizon)の枠組みを導入する。
i) LLMの相互作用における集団的リスクの理論的考察,(ii)マイクロ,メソ,マクロレベルの障害モードを接続する分類法,および(iii)マルチエージェントシステムに適応的監視を組み込むアーキテクチャであるInstitutionalAIの設計を提案する。
論文 参考訳(メタデータ) (2025-12-02T12:06:57Z) - An Adaptive, Data-Integrated Agent-Based Modeling Framework for Explainable and Contestable Policy Design [0.0]
マルチエージェントシステムはフィードバック、適応、非定常性の下で運用されることが多い。
本稿では,一般適応型マルチエージェント学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-24T21:41:45Z) - Drift No More? Context Equilibria in Multi-Turn LLM Interactions [58.69551510148673]
コンテキストドリフト(Contexts drift)とは、ターン間のゴール一貫性のある振る舞いからモデルが出力する出力の段階的なばらつきである。
シングルターンエラーとは異なり、ドリフトは時間的に展開し、静的な評価指標では捉えにくい。
マルチターンドリフトは、避けられない崩壊というよりも、制御可能な平衡現象として理解できることを示す。
論文 参考訳(メタデータ) (2025-10-09T04:48:49Z) - Adaptability in Multi-Agent Reinforcement Learning: A Framework and Unified Review [9.246912481179464]
MARL(Multi-Agent Reinforcement Learning)は、シミュレーションベンチマークと制約付きシナリオ間で複数のエージェントを協調する上で、明らかな効果を示している。
この調査は、動的で実世界のマルチエージェントシステムへのデプロイに適したアルゴリズムの開発に寄与する。
論文 参考訳(メタデータ) (2025-07-14T10:39:17Z) - Probabilistic and reinforced mining of association rules [0.0]
本研究は、アソシエーション・ルール・マイニング(ARM)のための4つの新しい確率的および強化駆動方式を導入する。
GPAR、BARM、MAB-ARM、RLARは、事前知識、モデリングの不確実性、アイテム依存、確率的推論、適応的な検索戦略を組み込む機能拡張を提供する。
これらのイノベーションは、小売、地理、ファイナンス、医療診断、リスクに敏感なシナリオなど、さまざまなアプリケーションドメインに対して、事前および依存関係インフォームド、不確実性対応、スケーラブルなARMフレームワークを提供する。
論文 参考訳(メタデータ) (2025-06-22T19:51:15Z) - LLM4Rerank: LLM-based Auto-Reranking Framework for Recommendations [51.76373105981212]
リグレードはレコメンデーションシステムにおいて重要な要素であり、レコメンデーションアルゴリズムの出力を精査する上で重要な役割を果たす。
そこで我々は,様々な格付け基準をシームレスに統合する包括的格付けフレームワークを提案する。
カスタマイズ可能な入力機構も統合されており、言語モデルのフォーカスを特定の再配置のニーズに合わせることができる。
論文 参考訳(メタデータ) (2024-06-18T09:29:18Z) - INTAGS: Interactive Agent-Guided Simulation [4.04638613278729]
マルチエージェントシステム(MAS)を含む多くのアプリケーションでは、実稼働に先立って、実験的な(Exp)自律エージェントを高忠実度シミュレータでテストすることが必須である。
本稿では,ExpエージェントとBGエージェントのライブインタラクションによって評価される実システムと合成マルチエージェントシステムとを区別する指標を提案する。
InTAGSを用いてシミュレータのキャリブレーションを行い、現状のWasserstein Generative Adversarial Networkアプローチと比較して、より現実的な市場データを生成することができることを示す。
論文 参考訳(メタデータ) (2023-09-04T19:56:18Z) - ERMAS: Becoming Robust to Reward Function Sim-to-Real Gaps in
Multi-Agent Simulations [110.72725220033983]
Epsilon-Robust Multi-Agent Simulation (ERMAS)は、このようなマルチエージェントのsim-to-realギャップに対して堅牢なAIポリシーを学ぶためのフレームワークである。
ERMASは、エージェントリスク回避の変化に対して堅牢な税政策を学び、複雑な時間シミュレーションで最大15%社会福祉を改善する。
特に、ERMASは、エージェントリスク回避の変化に対して堅牢な税制政策を学び、複雑な時間シミュレーションにおいて、社会福祉を最大15%改善する。
論文 参考訳(メタデータ) (2021-06-10T04:32:20Z) - Reinforcement Learning for Adaptive Mesh Refinement [63.7867809197671]
マルコフ決定過程としてのAMRの新規な定式化を提案し,シミュレーションから直接改良政策を訓練するために深部強化学習を適用した。
これらのポリシーアーキテクチャのモデルサイズはメッシュサイズに依存しないため、任意に大きく複雑なシミュレーションにスケールします。
論文 参考訳(メタデータ) (2021-03-01T22:55:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。