論文の概要: Structural Distinguishability of Static and Adaptive Policy Regimes in Agent-Based Regulatory Simulation
- arxiv url: http://arxiv.org/abs/2606.20699v1
- Date: Mon, 15 Jun 2026 10:06:32 GMT
- ステータス: 情報取得中
- システム内更新日: 2026-06-23 11:22:46.436592
- Title: Structural Distinguishability of Static and Adaptive Policy Regimes in Agent-Based Regulatory Simulation
- Title(参考訳): エージェントベース規制シミュレーションにおける静的および適応的政策規則の構造的区別性
- Authors: Roberto Garrone,
- Abstract要約: 本稿では,新しい汎用フレームワークではなく,制御されたシミュレーションベンチマークに寄与する。
本研究は, ナイーブな固定ポリシー, トラッキング対応の固定ポリシ, および, セットポイント, 安全マージン, 片側制御の3つの適応コントローラを評価する。
このコントリビューションは、スカラーインジケータ、キャップ相対的なシンボル診断、軌跡モチーフ、視覚検査によって、平均的な結果が類似しているように見える場合でも、どのように規制の結論が異なるかを共同で明らかにする。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Agent-based models are widely used to evaluate policy interventions in complex socio-technical systems, yet many policy-oriented ABMs represent regulation as a fixed scenario parameter. This limits their ability to distinguish whether regulatory conclusions depend on agent adaptation, policy adaptation, or the interaction between both. Building on a previously proposed four-regime architecture, this paper contributes a controlled simulation benchmark rather than a new general framework. Using a single configurable emissions-regulation ABM, we compare constant policy/constant agents, constant policy/adaptive agents, adaptive policy/constant agents, and adaptive policy/adaptive agents under matched simulation conditions. We evaluate naive fixed policies, tracking-aware calibrated fixed policies, and three adaptive controllers: setpoint, safety-margin, and one-sided control. The benchmark recovers expected controller archetypes: setpoint control tracks the cap but produces frequent boundary crossings, safety-margin control reduces violations through conservatism, and one-sided control can limit violations but may ratchet toward over-conservatism when combined with adaptive agents. The contribution is methodological: scalar indicators, cap-relative symbolic diagnostics, trajectory motifs, and visual inspection jointly reveal how regulatory conclusions can differ even when average outcomes appear similar. Adaptive policy-oriented ABMs should therefore be evaluated through regime distinguishability, not only through average performance.
- Abstract(参考訳): エージェントベースモデルは複雑な社会技術システムにおける政策介入を評価するために広く用いられているが、多くの政策指向のABMは規制を固定シナリオパラメータとして表現している。
このことは、規制の結論がエージェント適応、政策適応、または両者間の相互作用に依存するかどうかを識別する能力を制限する。
従来提案されていた4つの登録アーキテクチャに基づいて構築された本論文は,新しい汎用フレームワークではなく,制御されたシミュレーションベンチマークに寄与する。
一つの構成可能な排出規制 ABM を用いて,一定の政策適応エージェント,一定の政策適応エージェント,適応的政策適応エージェント,一致したシミュレーション条件下での適応的政策適応エージェントを比較した。
そこで我々は, ナイーブな固定ポリシ, トラッキング対応の固定ポリシ, および, セットポイント, 安全マージン, 片側制御の3つの適応コントローラを評価した。
セットポイント制御はキャップを追跡するが、頻繁に境界交差を発生させ、安全マージン制御は保守主義を通じて違反を減らし、一方の制御は違反を制限することができるが、適応的エージェントと組み合わせると過保守主義に向かうことができる。
このコントリビューションは、スカラーインジケータ、キャップ相対的なシンボル診断、軌跡モチーフ、視覚検査によって、平均的な結果が類似しているように見える場合でも、どのように規制の結論が異なるかを共同で明らかにする。
したがって、アダプティブポリシー指向のABMは、平均的なパフォーマンスだけでなく、レシエーションの区別性を通じて評価されるべきである。
関連論文リスト
- Machine-Coached Policy Revision in Adaptive Agent-Based Regulatory Simulation: A Controller-Level Contestability Layer [0.0]
本稿では,適応型エージェントベース規制のための軽量な機械学習対応ポリシ・リビジョン層を提案する。
このコントリビューションは、新しい最適コントローラではなく、無制限のマシンコーチングの正式な保証を主張するものではない。
論文 参考訳(メタデータ) (2026-06-15T10:36:10Z) - PolicyBank: Evolving Policy Understanding for LLM Agents [51.86716874651299]
PolicyBankは構造化されたツールレベルの政策洞察を維持し、それらを反復的に洗練する。
PolicyBankは、人間の神託に対するギャップの最大82%を閉じている。
論文 参考訳(メタデータ) (2026-04-16T20:29:30Z) - Separating Diagnosis from Control: Auditable Policy Adaptation in Agent-Based Simulations with LLM-Based Diagnostics [10.25117941762109]
高齢者の孤独を緩和するには、適応性と監査性の両方を達成するための政策介入が必要である。
本研究は,両特性を同時に達成するために,診断を制御から分離する3層フレームワークを提案する。
その結果、明示的な制御規則は、完全な監査性を維持しながら、エンドツーエンドのLCMアプローチを11.7%上回る結果となった。
論文 参考訳(メタデータ) (2026-03-24T07:52:10Z) - Authority-Level Priors: An Under-Specified Constraint in Hierarchical Predictive Processing [0.0]
オーソリティ・レベル優先(英: Authority-Level Priors、ALP)は、アイデンティティレベルの仮説の規制が許容できるサブセットを定義するメタ構造制約である。
ALPは、追加の表現状態や精度よりも高優先度であり、規制制御に許容される仮説を制約している。
計算形式化は、認可された仮説によって生成されるポリシーに対するポリシー最適化を制限する。
論文 参考訳(メタデータ) (2026-03-19T13:27:47Z) - Norm-Governed Multi-Agent Decision-Making in Simulator-Coupled Environments:The Reinsurance Constrained Multi-Agent Simulation Process (R-CMASP) [0.0]
マルチエージェントの協調を統括するドメイン校正された合成環境が,決定論的自動化よりも安定的で一貫性があり,規範に順応した行動をもたらすことを示す。
その結果, 制御されたシミュレータ駆動型意思決定環境は, 規範的, シミュレータ結合型マルチエージェントシステムとしてモデル化されていることが示唆された。
論文 参考訳(メタデータ) (2025-12-04T10:30:26Z) - Active Inference with Reusable State-Dependent Value Profiles [0.0]
生成モデルにおける隠れ状態に割り当てられた値関連パラメータの小さな再利用可能なバンドル。
この枠組みを確率論的逆転学習において評価し,静的精度,エントロピー結合動的精度,プロファイルベースモデルを比較した。
論文 参考訳(メタデータ) (2025-12-03T04:11:57Z) - Learning Deterministic Policies with Policy Gradients in Constrained Markov Decision Processes [59.27926064817273]
我々はC-PGと呼ばれる探索非依存のアルゴリズムを導入し,支配的仮定の下でのグローバルな最終点収束保証を享受する。
制約制御タスクにおいて,アクションベース(C-PGAE)とパラメータベース(C-PGPE)の両方を実証的に検証する。
論文 参考訳(メタデータ) (2025-06-06T10:29:05Z) - Last-Iterate Global Convergence of Policy Gradients for Constrained Reinforcement Learning [62.81324245896717]
我々はC-PGと呼ばれる探索非依存のアルゴリズムを導入し、このアルゴリズムは(弱)勾配支配仮定の下でのグローバルな最終点収束を保証する。
制約付き制御問題に対して,我々のアルゴリズムを数値的に検証し,それらを最先端のベースラインと比較する。
論文 参考訳(メタデータ) (2024-07-15T14:54:57Z) - Conformal Policy Learning for Sensorimotor Control Under Distribution
Shifts [61.929388479847525]
本稿では,センサコントローラの観測値の分布変化を検知・応答する問題に焦点をあてる。
鍵となる考え方は、整合量子を入力として取ることができるスイッチングポリシーの設計である。
本稿では, 基本方針を異なる特性で切り替えるために, 共形量子関数を用いてこのようなポリシーを設計する方法を示す。
論文 参考訳(メタデータ) (2023-11-02T17:59:30Z) - Hallucinated Adversarial Control for Conservative Offline Policy
Evaluation [64.94009515033984]
本研究では,環境相互作用のオフラインデータセットが与えられた場合,政策のパフォーマンスを低く抑えることを目的とした,保守的非政治評価(COPE)の課題について検討する。
本稿では,遷移力学の不確実性を考慮した学習モデルに基づくHAMBOを紹介する。
結果のCOPE推定値が妥当な下界であることを証明し、正則性条件下では、真に期待された戻り値への収束を示す。
論文 参考訳(メタデータ) (2023-03-02T08:57:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。