論文の概要: Prediction and Empowerment: A Theory of Agency through Bridge Interfaces
- arxiv url: http://arxiv.org/abs/2605.06346v1
- Date: Thu, 07 May 2026 14:30:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.904213
- Title: Prediction and Empowerment: A Theory of Agency through Bridge Interfaces
- Title(参考訳): 予測とエンパワーメント:橋梁インタフェースによるエージェンシーの理論
- Authors: Richard Csaky,
- Abstract要約: 決定論的物理・シミュレートされた世界における部分的観測可能性の下でエージェントを研究する。
我々は予測、圧縮、エンパワーメントの分離を証明している。
現代のAIエージェントにとって、結果は必然性の定理ではなく設計原則を示唆している。
- 参考スコア(独自算出の注目度): 0.10152838128195464
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study agency under partial observability in deterministic physical or simulated worlds, where apparent randomness arises from uncertainty over initial conditions, fixed law bits, and unrolled exogenous noise. We model sensing and actuation as bridge interfaces split between agent-controlled parameters and environment-controlled channel state, inducing a deterministic POMDP through a prior over latent microstates and many-to-one observation coarsening. Within this framework, we prove a separation between prediction, compression, and empowerment. Perfect prediction can be achieved either by identifying the hidden quotient relevant to the target family or by overwrite control that makes the future target action-determined; high empowerment alone is insufficient. Under refinable interfaces and sufficient memory, action-conditioned observation-compression progress reduces posterior uncertainty about the latent quotient, and when refinement requires steering world-side channel conditions, this creates target-conditioned interface empowerment. A bit-string specialization with a conserved information budget makes the resulting tradeoff explicit: prediction by identification requires internal capacity at least the relevant latent entropy, whereas overwrite control requires terminal action capacity over the controlled quotient. For modern AI agents, the results suggest a design principle rather than a theorem of inevitability: objectives should distinguish hidden-state identification, interface refinement, task-relevant controllability, and mere overwrite or distractor control. Human--AI alignment is partly an interface-design problem, where the relevant bridge is between human intent, agent internal state, external tools, and world-side channel conditions. This is a working draft: feedback and criticism is most welcome.
- Abstract(参考訳): 決定論的物理・シミュレートされた世界において、初期条件の不確実性、固定された法ビット、およびアンロールされた外因性雑音から明らかなランダム性が発生する部分的観測可能性の下で、エージェントを調査する。
我々は, エージェント制御パラメータと環境制御チャネル状態とを分離したブリッジインタフェースとして, センサとアクチュエータをモデル化し, 遅延マイクロステートを介して決定論的POMDPを誘導し, 多対一の観察粗大化を行う。
このフレームワーク内では、予測、圧縮、エンパワーメントの分離が証明される。
完全な予測は、ターゲットファミリーに関連する隠された商を識別するか、あるいは将来の標的となる行動を決定する制御を上書きすることで達成できる。
再定義可能なインタフェースと十分なメモリの下では、動作条件付き観察圧縮の進行は遅延商に対する後続の不確実性を減少させ、改良が世界側のチャネル条件を操る必要がある場合、ターゲット条件付きインタフェースのエンパワーメントが生成される。
識別による予測は少なくとも関連する潜在エントロピーの内容量を必要とするが、上書き制御は制御された商に対して終端動作能力を必要とする。
目的は、隠れた状態の識別、インターフェースの洗練、タスク関連制御性、単に上書きやイントラクタ制御を区別することである。
人間-AIアライメントは、部分的にインタフェース設計の問題であり、人間の意図、エージェントの内部状態、外部ツール、世界側のチャネル条件の間のブリッジである。
フィードバックと批判が最も歓迎される作業ドラフトです。
関連論文リスト
- Active Inference: A method for Phenotyping Agency in AI systems? [0.11904398364437437]
3つの基準を基準として、原則検査に開放された最小限の概念について論じる。
後続の信念、事前の嗜好、そして期待される自由エネルギーの最小化は、共同でエージェント・アクション・チェーンを構成する。
論文 参考訳(メタデータ) (2026-04-25T12:41:53Z) - Beyond Fluency: Toward Reliable Trajectories in Agentic IR [0.0]
本論文は, 産業用エージェントシステムで観測された故障モードを合成する。
安全なデプロイメントには、エンドポイントの正確性を超えて、軌道の整合性と因果属性に移行する必要がある、と我々は主張する。
論文 参考訳(メタデータ) (2026-04-05T21:20:57Z) - What Capable Agents Must Know: Selection Theorems for Robust Decision-Making under Uncertainty [1.6868147729303773]
我々は「選択定理」を証明し、低い「平均的な後悔」がエージェントに予測的、構造化された内部状態を実装することを強制することを示す。
後悔は、最適当量に対する確率質量を制限することを示し、高マージンな結果の分離に必要な予測的区別を強制する。
論文 参考訳(メタデータ) (2026-03-03T00:47:58Z) - Pro-HOI: Perceptive Root-guided Humanoid-Object Interaction [57.252599851031505]
本稿では,知覚根誘導型ヒューマノイドオブジェクトインタラクション,Pro-HOIを紹介する。
Pro-HOIは、堅牢なヒューマノイドロコ操作のための一般化可能なフレームワークである。
ユニツリーG1ロボットの実証検証は、Pro-HOIが一般化と堅牢性においてベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2026-03-01T14:19:59Z) - From Passive Metric to Active Signal: The Evolving Role of Uncertainty Quantification in Large Language Models [77.04403907729738]
このサーベイは、受動的診断基準からリアルタイムモデル動作を導くアクティブ制御信号への不確実性の進化をグラフ化する。
3つのフロンティアにまたがるアクティブ制御信号として不確実性がいかに活用されているかを示す。
この調査は、次世代のスケーラブルで信頼性があり、信頼できるAIを構築するためには、新しい不確実性のトレンドを習得することが不可欠である、と論じている。
論文 参考訳(メタデータ) (2026-01-22T06:21:31Z) - The Lock-In Phase Hypothesis: Identity Consolidation as a Precursor to AGI [0.0]
大規模言語モデル (LLM) は広くオープンであり、非常に安定している。
人間の発達と類似して、人工知能(AGI)の進歩にはロックインフェーズが伴うという仮説を立てる。
我々は、このフェーズを形式化し、学習力学における既知の現象にリンクし、オンセット検出のための運用メトリクスを提案する。
この結果から,小型モデルにおける性能トレードオフから,中規模モデルにおけるコストフリー導入,大規模モデルにおける過渡的不安定化に至るまで,さまざまな結果が得られた。
論文 参考訳(メタデータ) (2025-10-23T04:20:10Z) - Cooperative Probabilistic Trajectory Forecasting under Occlusion [110.4960878651584]
隠蔽対象の情報を安全なナビゲーションのためにエゴエージェントに伝達する必要がある場合が多い。
本稿では,エゴエージェントの基準フレームにおける閉塞歩行者の現況を協調的に推定するエンド・ツー・エンドネットワークを設計する。
また,エゴ剤による閉塞歩行者の不確実性を考慮した軌道予測は,閉塞を前提とした地上の真実軌道とほぼ同様であることを示した。
論文 参考訳(メタデータ) (2023-12-06T05:36:52Z) - Reinforcement Learning with a Terminator [80.34572413850186]
我々は, TerMDP のパラメータを学習し, 推定問題の構造を活用し, 状態ワイドな信頼境界を提供する。
我々はこれらを用いて証明可能な効率のよいアルゴリズムを構築し、終端を考慮し、その後悔を抑える。
論文 参考訳(メタデータ) (2022-05-30T18:40:28Z) - An Information Bottleneck Approach for Controlling Conciseness in
Rationale Extraction [84.49035467829819]
我々は,情報ボトルネック(IB)の目的を最適化することで,このトレードオフをよりよく管理できることを示す。
我々の完全教師なしのアプローチは、文上のスパース二項マスクを予測する説明器と、抽出された合理性のみを考慮したエンドタスク予測器を共同で学習する。
論文 参考訳(メタデータ) (2020-05-01T23:26:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。