論文の概要: Mechanical Conscience: A Mathematical Framework for Dependability of Machine Intelligenc
- arxiv url: http://arxiv.org/abs/2605.03847v1
- Date: Tue, 05 May 2026 15:14:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.995105
- Title: Mechanical Conscience: A Mathematical Framework for Dependability of Machine Intelligenc
- Title(参考訳): 機械的良心:機械知能の依存性に関する数学的枠組み
- Authors: Munkhdegerekh Batzorig, Purevbaatar Ganbold, Kyungbin Park, Pilkong Jeong, Kangbin,
- Abstract要約: 本稿では、新しい概念と単純化された数学的枠組みである機械的良心(MC)を紹介する。
MCは、単一エージェントと分散インテリジェントシステムの両方のトラジェクトリレベルの規範的規制を運用している。
中心となる理論的性質は、許容性等価性、最適規制の存在、単調偏差減少である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Distributed collaborative intelligence (DCI), encompassing edge-to-edge architectures, federated learning, transfer learning, and swarm systems, creates environments in which emergent risk is structurally unavoidable: locally correct decisions by individual agents compose into globally unacceptable behavioral trajectories under uncertainty. Existing approaches such as constrained optimization, safe reinforcement learning, and runtime assurance evaluate acceptability at the level of individual actions rather than across behavioral trajectories, and none addresses the multi-participant, uncertainty-laden nature of DCI deployments. This paper introduces mechanical conscience (MC), a novel concept and simplified mathematical framework that operationalizes trajectory-level normative regulation for both single-agent and distributed intelligent systems. Mechanical conscience is defined as a supervisory filter that minimally corrects a baseline policy's actions to reduce cumulative deviation from a normatively admissible region, while accounting for epistemic uncertainty. We introduce associated constructs, conscience score, mechanical guilt, and resonant dependability, that provide an interpretable vocabulary and computable governance signals for this emerging field. Core theoretical properties are established: admissibility equivalence, existence of optimal regulation, and monotonic deviation reduction. Illustrative results demonstrate that MC-regulated agents maintain trajectory-level normative acceptability where conventional controllers drift outside admissible bounds, and that the framework naturally extends to suppress interaction-induced emergent risk in multi-agent DCI settings.
- Abstract(参考訳): 分散協調インテリジェンス(DCI)は、エッジ・ツー・エッジアーキテクチャ、フェデレーションド・ラーニング、トランスファー・ラーニング、スウォーム・システムを含む、創発的リスクが構造的に避けられない環境を作り出す。
制約付き最適化、安全な強化学習、実行時保証といった既存のアプローチは、行動軌跡を越えてではなく、個々の行動のレベルで受け入れ可能性を評価しており、DCIデプロイメントの多人数で不確実な性質に対処するものではない。
本稿では,単一エージェントと分散インテリジェントシステムの両方に対して,軌道レベルの規範的規制を運用する,新しい概念と単純化された数学的枠組みである,機械的良心(MC)を紹介する。
機械的良心は、基準政策の行動を最小限に補正し、基準的に許容できる領域からの累積偏差を減らすとともに、てんかんの不確かさを考慮に入れた監督フィルターとして定義される。
我々は,この新興分野に対して,解釈可能な語彙と計算可能な統治信号を提供する,関連する構成,良心スコア,機械的罪悪感,共鳴信頼性を導入する。
中心となる理論的性質は、許容性等価性、最適規制の存在、単調偏差減少である。
実験の結果, MC制御エージェントは, 従来のコントローラが許容範囲外を漂流する軌道レベルの規範的受容性を維持しており, 多エージェントDCI設定における相互作用誘発創発的リスクを抑制するために, フレームワークが自然に拡張されることが示唆された。
関連論文リスト
- Towards a Risk-Cost Model for Financial Adaptive Authentication [9.133320151595084]
金融システムにおける適応認証のための形式的リスクコストモデル(RCM)を導入する。
RCMは、(i)不正損失、機会コスト、テールリスクを明示的に把握するコスト感受性リスク機能と、(ii)敵対的探索と分配的ドリフトに適応するシーケンシャルな意思決定メカニズムの3つの重要な要素を統合している。
論文 参考訳(メタデータ) (2026-05-04T02:08:24Z) - MC-CPO: Mastery-Conditioned Constrained Policy Optimization [1.4323566945483497]
エンゲージメント最適化適応学習システムは、持続的な学習結果よりも短期的な行動信号を優先することができる。
本稿では,構造的行動マスキングと制約付きポリシー最適化を統合した2段階の原始双対アルゴリズムであるMastery-Conditioned Constrained Policy Optimization (MC-CPO)を紹介する。
10個のランダムシードと100万のトレーニングステップで、MC-CPOは許容範囲内の制約予算を満たし、制約のない、報酬型のベースラインに対する安全性コストを低減し、Reward Hacking Severity Index(RHSI)を大幅に低下させる。
論文 参考訳(メタデータ) (2026-04-05T20:13:34Z) - GRASP: Gradient Realignment via Active Shared Perception for Multi-Agent Collaborative Optimization [41.52202306408042]
非定常性は、同時ポリシー更新によって発生し、持続的な環境変動を引き起こす。
本稿では,一般ベルマン均衡を政策進化の安定目標として定義する新しい枠組みである,アクティブ共有知覚(GRASP)によるRealignmentを提案する。
論文 参考訳(メタデータ) (2026-04-01T10:26:22Z) - Beyond Benchmark Islands: Toward Representative Trustworthiness Evaluation for Agentic AI [45.21562889170875]
シナリオ多様体に対するエージェントの信頼性を特徴付けるシステム評価パラダイムを提案する。
このフレームワークは,静的認知と政策分析,対話型サンドボックスシミュレーション,社会倫理アライメントアライメントアセスメント,および(iv)分散対応の代表サンプリングエンジンの4つの補完的コンポーネントを統合している。
論文 参考訳(メタデータ) (2026-03-16T08:51:33Z) - Accelerated Online Risk-Averse Policy Evaluation in POMDPs with Theoretical Guarantees and Novel CVaR Bounds [9.269394037577177]
この研究は、部分的に観測可能な領域における条件付き値-アット・リスク評価を加速するための理論的枠組みを導入する。
単純化された信念-MDPから計算可能なCVaR値関数の上下境界を確立する。
我々は,確率的保証を伴う粒子信頼型MDPフレームワーク内で,これらの境界に対する推定器を開発する。
論文 参考訳(メタデータ) (2026-02-26T15:01:40Z) - Unsupervised Anomaly Detection in Multi-Agent Trajectory Prediction via Transformer-Based Models [45.08545174556591]
マルチエージェントトランスを用いた教師なし異常検出フレームワークを提案する。
検出安定性と物理的アライメントの両方を評価するための二重評価手法が提案されている。
本フレームワークでは,時間対衝突および統計ベースラインに欠落した388個の特異な異常を同定する。
論文 参考訳(メタデータ) (2026-01-28T08:33:10Z) - From Linear Risk to Emergent Harm: Complexity as the Missing Core of AI Governance [0.0]
リスクベースのAI規制は、予想される損害に対応する比例制御を約束する。
本稿では、そのようなフレームワークは構造上の理由から失敗することが多いと論じる。
我々は,規制を制御ではなく介入として扱う,AIガバナンスのための複雑性ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-14T14:19:21Z) - Norm-Governed Multi-Agent Decision-Making in Simulator-Coupled Environments:The Reinsurance Constrained Multi-Agent Simulation Process (R-CMASP) [0.0]
マルチエージェントの協調を統括するドメイン校正された合成環境が,決定論的自動化よりも安定的で一貫性があり,規範に順応した行動をもたらすことを示す。
その結果, 制御されたシミュレータ駆動型意思決定環境は, 規範的, シミュレータ結合型マルチエージェントシステムとしてモデル化されていることが示唆された。
論文 参考訳(メタデータ) (2025-12-04T10:30:26Z) - A Survey on Autonomy-Induced Security Risks in Large Model-Based Agents [45.53643260046778]
大規模言語モデル(LLM)の最近の進歩は、自律型AIエージェントの台頭を触媒している。
これらの大きなモデルエージェントは、静的推論システムからインタラクティブなメモリ拡張エンティティへのパラダイムシフトを示す。
論文 参考訳(メタデータ) (2025-06-30T13:34:34Z) - Sample-Efficient Robust Multi-Agent Reinforcement Learning in the Face of Environmental Uncertainty [40.55653383218379]
本研究は,ロバストなマルコフゲーム(RMG)の学習に焦点を当てる。
ゲーム理論平衡の様々な概念の頑健な変種を学習するために,有限サンプルの複雑性を保証するサンプル効率モデルベースアルゴリズム(DRNVI)を提案する。
論文 参考訳(メタデータ) (2024-04-29T17:51:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。