論文の概要: Towards Selection as Power: Bounding Decision Authority in Autonomous Agents
- arxiv url: http://arxiv.org/abs/2602.14606v1
- Date: Mon, 16 Feb 2026 10:10:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 16:22:50.362615
- Title: Towards Selection as Power: Bounding Decision Authority in Autonomous Agents
- Title(参考訳): 権力としての選択に向けて:自律エージェントにおける境界決定機関
- Authors: Jose Manuel de la Chica Rodriguez, Juan Manuel Vera Díaz,
- Abstract要約: 我々は、認知、選択、行動を独立したドメインに分離し、自律性を主権のベクトルとしてモデル化するガバナンスアーキテクチャを提案する。
変動操作,しきい値ゲーム,フレーミングスキュー,順序付け効果,エントロピー探索を対象とし,複数の規制された金融シナリオを対象としたシステムの評価を行った。
その結果、機械的選択ガバナンスは実装可能であり、監査可能であり、推論能力を維持しながら決定論的結果の獲得を防止することが示されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous agentic systems are increasingly deployed in regulated, high-stakes domains where decisions may be irreversible and institutionally constrained. Existing safety approaches emphasize alignment, interpretability, or action-level filtering. We argue that these mechanisms are necessary but insufficient because they do not directly govern selection power: the authority to determine which options are generated, surfaced, and framed for decision. We propose a governance architecture that separates cognition, selection, and action into distinct domains and models autonomy as a vector of sovereignty. Cognitive autonomy remains unconstrained, while selection and action autonomy are bounded through mechanically enforced primitives operating outside the agent's optimization space. The architecture integrates external candidate generation (CEFL), a governed reducer, commit-reveal entropy isolation, rationale validation, and fail-loud circuit breakers. We evaluate the system across multiple regulated financial scenarios under adversarial stress targeting variance manipulation, threshold gaming, framing skew, ordering effects, and entropy probing. Metrics quantify selection concentration, narrative diversity, governance activation cost, and failure visibility. Results show that mechanical selection governance is implementable, auditable, and prevents deterministic outcome capture while preserving reasoning capacity. Although probabilistic concentration remains, the architecture measurably bounds selection authority relative to conventional scalar pipelines. This work reframes governance as bounded causal power rather than internal intent alignment, offering a foundation for deploying autonomous agents where silent failure is unacceptable.
- Abstract(参考訳): 自律的なエージェントシステムは、意思決定が不可逆であり、制度的に制約される可能性のある、規制された高レベルのドメインにますます展開されている。
既存の安全性アプローチでは、アライメント、解釈可能性、アクションレベルのフィルタリングが重視されている。
選択力を直接支配しないため、これらのメカニズムは必要だが不十分である、と我々は主張する。
我々は、認知、選択、行動を独立したドメインに分離し、自律性を主権のベクトルとしてモデル化するガバナンスアーキテクチャを提案する。
認知的自律性は制限されないままであり、選択と行動自律性はエージェントの最適化空間の外で動作する機械的に強制されたプリミティブによって拘束される。
アーキテクチャは外部候補生成(CEFL)、管理されたリデューサ、コミット-リベラルエントロピー分離、合理性検証、フェールルード回路ブレーカを統合している。
変動操作,しきい値ゲーム,フレーミングスキュー,順序付け効果,エントロピー探索を対象とし,複数の規制された金融シナリオを対象としたシステムの評価を行った。
メトリクスは、選択の集中度、物語の多様性、ガバナンスのアクティベーションコスト、失敗の可視性を定量化する。
その結果、機械的選択ガバナンスは実装可能であり、監査可能であり、推論能力を維持しながら決定論的結果の獲得を防止することが示されている。
確率的集中は残るが、このアーキテクチャは従来のスカラーパイプラインと比較して選択権限を計測的に拘束する。
この作業は、ガバナンスを内部意図のアライメントではなく、境界付けられた因果力として再設定し、サイレント障害が受け入れられない自律エージェントをデプロイするための基盤を提供する。
関連論文リスト
- Agentic AI for Cybersecurity: A Meta-Cognitive Architecture for Governable Autonomy [0.0]
本稿では,サイバーセキュリティのオーケストレーションはエージェント型マルチエージェント認知システムとして再認識されるべきである,と論じる。
本稿では,特定・仮説形成・文脈解釈・説明・ガバナンスに責任を負う異種AIエージェントを,メタ認知判断機能を通じて協調する概念的枠組みを提案する。
我々の貢献は、メタ認知判断を第一級システム機能として組み込むことによって、この認知構造をアーキテクチャ的に明確化し、統制可能にすることである。
論文 参考訳(メタデータ) (2026-02-12T12:52:49Z) - Budgeting Discretion: Theory and Evidence on Street-Level Decision-Making [10.816276884713611]
そこで本研究では,実運用制約下での意思決定の時間的制限について,基本的モデルを提案する。
我々は、オーバライドがダイナミックなしきい値ルールに従うことを示し、機会が時間と予算に依存したカットオフを超えた場合にのみ、裁量を使用する。
これらの結果から,判断は手続き的制約と福祉的改善の両面において,明確に予算化された資源として扱われることが示唆された。
論文 参考訳(メタデータ) (2026-02-10T18:02:14Z) - Agentic Uncertainty Quantification [76.94013626702183]
本稿では,言語化された不確実性をアクティブな双方向制御信号に変換する統合されたデュアルプロセスエージェントUQ(AUQ)フレームワークを提案する。
システム1(Uncertainty-Aware Memory, UAM)とシステム2(Uncertainty-Aware Reflection, UAR)は、これらの説明を合理的な手段として利用し、必要な時にのみターゲットの推論時間解決をトリガーする。
論文 参考訳(メタデータ) (2026-01-22T07:16:26Z) - Admissibility Alignment [0.0]
本稿では,不確実性を考慮した意思決定のための新しい制御プレーンシステムアーキテクチャMAP-AIを提案する。
モンテカルロによる結果分布の推定と、許容性制御された政策選択を通じてアライメントを実施する。
本研究では,アライメント評価を意思決定自体に統合し,適応性制御された行動選択機構を実現する方法を示す。
論文 参考訳(メタデータ) (2026-01-05T05:58:19Z) - Assured Autonomy: How Operations Research Powers and Orchestrates Generative AI Systems [18.881800772626427]
生成モデルは、実現可能性、分散シフトに対する堅牢性、ストレステストを提供するメカニズムと組み合わせない限り、運用領域で脆弱である可能性がある、と我々は主張する。
我々は,運用研究に根ざした自律性確保のための概念的枠組みを開発する。
これらの要素は、安全クリティカルで信頼性に敏感な運用領域における自律性を保証するための研究アジェンダを定義する。
論文 参考訳(メタデータ) (2025-12-30T04:24:06Z) - Collaborative Trustworthiness for Good Decision Making in Autonomous Systems [0.26999000177990923]
本稿では,運用環境における信頼度を高めるための総合的な協調的アプローチを提案する。
矛盾する情報が存在する場合、アグリゲーションは、コラボレーティブなデータ共有に基づく信頼できる意思決定において、大きな問題となる。
私たちは、信念の集約と伝播の形式モデルとしてバイナリ決定図(BDD)を使用し、BDDのサイズを減らすために削減ルールを定式化します。
論文 参考訳(メタデータ) (2025-07-15T09:37:28Z) - Toward a Theory of Agents as Tool-Use Decision-Makers [89.26889709510242]
真の自律性は、エージェントが、彼らが知っていること、必要なこと、そしてその知識を効率的に獲得する方法を統治する、一貫性のある疫学の枠組みに根ざす必要がある、と我々は主張する。
本研究では,内的推論と外的行動を等価な疫学ツールとして扱う統一理論を提案し,エージェントが内観と相互作用を体系的に調整することを可能にする。
この視点は、エージェントの設計を単なるアクションエグゼクタから知識駆動インテリジェンスシステムにシフトさせ、適応的で効率的でゴール指向の行動が可能な基礎エージェントを構築するための原則化された道筋を提供する。
論文 参考訳(メタデータ) (2025-06-01T07:52:16Z) - The Geometry of Refusal in Large Language Models: Concept Cones and Representational Independence [57.57786477441956]
以前の研究は、モデルのアクティベーション空間における1つの拒絶方向が、LCMが要求を拒否するかどうかを決定することを示唆している。
本稿では,表現工学における勾配に基づく新しい手法を提案し,それを用いて拒絶方向を同定する。
LLMの拒絶機構は複雑な空間構造によって制御され、機能的に独立な方向を識別する。
論文 参考訳(メタデータ) (2025-02-24T18:52:59Z) - Conformal Decision Theory: Safe Autonomous Decisions from Imperfect Predictions [80.34972679938483]
不完全な機械学習予測にも拘わらず、安全な自律的意思決定を実現するためのフレームワークであるコンフォーマル決定理論を導入する。
私たちのアルゴリズムが生み出す決定は、リスクが低いという証明可能な統計的保証があるという意味では安全です。
実験は、人間のまわりのロボットの動き計画、自動株式取引、ロボット製造において、我々のアプローチの有用性を実証する。
論文 参考訳(メタデータ) (2023-10-09T17:59:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。