論文の概要: Active Inference Agency Formalization, Metrics, and Convergence Assessments
- arxiv url: http://arxiv.org/abs/2603.21319v1
- Date: Sun, 22 Mar 2026 17:01:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.352605
- Title: Active Inference Agency Formalization, Metrics, and Convergence Assessments
- Title(参考訳): アクティブ推論エージェンシーの形式化・メトリクス・収束評価
- Authors: Eduard Kapelko,
- Abstract要約: エージェンシーは、オートポエシスを実現する蓄積された経験の連続表現として概念化されている。
エージェント関数は全抽象関数空間の驚くほど小さな部分を占める。
本稿では,ある系の行動等価度と「理想的」エージェント関数との距離に基づく距離について紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper addresses the critical challenge of mesa-optimization in AI safety by providing a formal definition of agency and a framework for its analysis. Agency is conceptualized as a Continuous Representation of accumulated experience that achieves autopoiesis through a dynamic balance between curiosity (minimizing prediction error to ensure non-computability and novelty) and empowerment (maximizing the control channel's information capacity to ensure subjectivity and goal-directedness). Empirical evidence suggests that this active inference-based model successfully accounts for classical instrumental goals, such as self-preservation and resource acquisition. The analysis demonstrates that the proposed agency function is smooth and convex, possessing favorable properties for optimization. While agentic functions occupy a vanishingly small fraction of the total abstract function space, they exhibit logarithmic convergence in sparse environments. This suggests a high probability for the spontaneous emergence of agency during the training of modern, large-scale models. To quantify the degree of agency, the paper introduces a metric based on the distance between the behavioral equivalents of a given system and an "ideal" agentic function within the space of canonicalized rewards (STARC). This formalization provides a concrete apparatus for classifying and detecting mesa-optimizers by measuring their proximity to an ideal agentic objective, offering a robust tool for analyzing and identifying undesirable inner optimization in complex AI systems.
- Abstract(参考訳): 本稿では,機関の正式な定義と分析の枠組みを提供することにより,AI安全性におけるメザ最適化の課題に対処する。
エージェンシーは、好奇心(非計算性と新規性を保証するための予測誤差を最小化する)とエンパワーメント(主観性と目標指向性を確保するための制御チャネルの情報容量を最大化する)の動的バランスを通じて自己ポエシスを達成する蓄積経験の連続表現として概念化されている。
実証的な証拠は、この活動的推論に基づくモデルは、自己保存や資源獲得のような古典的な機器目標をうまく説明できることを示している。
解析により,提案するエージェンシー関数は滑らかで凸であり,最適化に好適な特性を有することが示された。
エージェント関数は全抽象関数空間の驚くほど小さな部分を占めるが、スパース環境における対数収束を示す。
これは、現代の大規模モデルのトレーニング中にエージェンシーが自発的に出現する確率が高いことを示唆している。
そこで本研究では,与えられたシステムの行動等価度と,正準化報酬空間(STARC)内の「理想的」エージェント関数との距離に基づく距離を定量化する手法を提案する。
この形式化は、理想的なエージェント目的に近づき、複雑なAIシステムにおいて望ましくない内部最適化を分析し、識別する堅牢なツールを提供することにより、メザ最適化を分類し、検出する具体的装置を提供する。
関連論文リスト
- Agentic Problem Frames: A Systematic Approach to Engineering Reliable Domain Agents [0.0]
大きな言語モデル(LLM)は、自律的なエージェントへと進化していますが、現在の"フレームワークレス"な開発は、あいまいな自然言語に基づいています。
本研究では,内部モデルインテリジェンスからエージェントと環境間の構造的相互作用に焦点を移すシステム工学フレームワークであるエージェント問題フレーム(APF)を提案する。
論文 参考訳(メタデータ) (2026-02-22T06:32:32Z) - From Passive Metric to Active Signal: The Evolving Role of Uncertainty Quantification in Large Language Models [77.04403907729738]
このサーベイは、受動的診断基準からリアルタイムモデル動作を導くアクティブ制御信号への不確実性の進化をグラフ化する。
3つのフロンティアにまたがるアクティブ制御信号として不確実性がいかに活用されているかを示す。
この調査は、次世代のスケーラブルで信頼性があり、信頼できるAIを構築するためには、新しい不確実性のトレンドを習得することが不可欠である、と論じている。
論文 参考訳(メタデータ) (2026-01-22T06:21:31Z) - Towards Efficient Agents: A Co-Design of Inference Architecture and System [66.59916327634639]
本稿では,エージェントアクセラレーションのための統合フレームワークであるAgentInferを提案する。
問題をAgentCollab、AgentSched、AgentSAM、AgentCompressの4つの相乗的コンポーネントに分解する。
BrowseComp-zhとDeepDiverベンチマークの実験では、これらの手法の相乗的コラボレーションを通じて、AgentInferは非効率なトークン消費を50%以上削減することを示した。
論文 参考訳(メタデータ) (2025-12-20T12:06:13Z) - STARec: An Efficient Agent Framework for Recommender Systems via Autonomous Deliberate Reasoning [54.28691219536054]
我々は、自律的な熟考的推論機能を備えたレコメンデータシステムを支援する、ゆっくり考えられた拡張エージェントフレームワークSTARecを紹介する。
我々は,先進的推論モデルと嗜好整合型報酬形成から構造化知識の蒸留を組み合わせた2段階のパラダイムであるアンカー強化訓練を開発する。
MovieLens 1MとAmazon CDsベンチマークの実験では、STARecは最先端のベースラインと比較して、大幅なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2025-08-26T08:47:58Z) - A Framework for Analyzing Abnormal Emergence in Service Ecosystems Through LLM-based Agent Intention Mining [18.607974352313832]
本稿では,マルチエージェント・インテンション(EAMI)に基づく創発分析の枠組みを紹介する。
EAMIは動的かつ解釈可能な出現分析を可能にする。
複合オンラインオフライン(O2O)サービスシステムにおけるEAMIを検証する実験。
論文 参考訳(メタデータ) (2025-07-21T16:26:49Z) - Tuning for Trustworthiness -- Balancing Performance and Explanation Consistency in Neural Network Optimization [49.567092222782435]
我々は,異なる特徴帰属法間の合意として定義された,XAI整合性という新しい概念を紹介する。
予測性能と説明のバランスをとる多目的最適化フレームワークを構築した。
本研究は、トレードオフゾーンバランス性能損失とXAI整合性による強靭性向上のモデルについて、今後の研究基盤を提供する。
論文 参考訳(メタデータ) (2025-05-12T13:19:14Z) - Computational Irreducibility as the Foundation of Agency: A Formal Model Connecting Undecidability to Autonomous Behavior in Complex Systems [0.0]
我々は正確な数学的つながりを確立し 真に自律的なシステムに対して その将来の行動に関する疑問は 基本的に決定不可能であることを証明します
この発見は、人工知能、生物学的モデリング、そして自由意志のような哲学的概念に重大な影響を及ぼす。
論文 参考訳(メタデータ) (2025-05-05T21:24:50Z) - Cooperative Resilience in Artificial Intelligence Multiagent Systems [2.0608564715600273]
本稿では, 協調レジリエンスの明確な定義とその定量化手法を提案する。
その結果は、集団システムが破壊に直面してどのように準備し、抵抗し、回復し、幸福を維持し、変革するかを分析する上で、レジリエンス指標の重要な役割を強調している。
論文 参考訳(メタデータ) (2024-09-20T03:28:48Z) - Reflexion: Language Agents with Verbal Reinforcement Learning [44.85337947858337]
リフレクション(Reflexion)は、ウェイトを更新するのではなく、言語フィードバックによって言語エージェントを強化する新しいフレームワークである。
様々なタイプ(スカラー値または自由形式言語)とフィードバック信号のソース(外部または内部シミュレート)を組み込むのに十分な柔軟性がある。
例えば、ReflexionはHumanEvalのコーディングベンチマークで91%のパス@1精度を達成した。
論文 参考訳(メタデータ) (2023-03-20T18:08:50Z) - Efficient Empowerment Estimation for Unsupervised Stabilization [75.32013242448151]
エンパワーメント原理は 直立位置での 力学系の教師なし安定化を可能にする
本稿では,ガウスチャネルとして動的システムのトレーニング可能な表現に基づく代替解を提案する。
提案手法は, サンプルの複雑さが低く, 訓練時より安定であり, エンパワーメント機能の本質的特性を有し, 画像からエンパワーメントを推定できることを示す。
論文 参考訳(メタデータ) (2020-07-14T21:10:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。