論文の概要: Plasticity as the Mirror of Empowerment
- arxiv url: http://arxiv.org/abs/2505.10361v1
- Date: Thu, 15 May 2025 14:52:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-16 22:29:06.363918
- Title: Plasticity as the Mirror of Empowerment
- Title(参考訳): エンパワーメントの鏡としての塑性
- Authors: David Abel, Michael Bowling, André Barreto, Will Dabney, Shi Dong, Steven Hansen, Anna Harutyunyan, Khimya Khetarpal, Clare Lyle, Razvan Pascanu, Georgios Piliouras, Doina Precup, Jonathan Richens, Mark Rowland, Tom Schaul, Satinder Singh,
- Abstract要約: 可塑性は環境のエンパワーメントと同一であることを示す。
我々は, 可塑性, エンパワーメント, およびそれらの関係性は, エージェンシーの理解に不可欠であることを示唆する。
- 参考スコア(独自算出の注目度): 94.91580596320331
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Agents are minimally entities that are influenced by their past observations and act to influence future observations. This latter capacity is captured by empowerment, which has served as a vital framing concept across artificial intelligence and cognitive science. This former capacity, however, is equally foundational: In what ways, and to what extent, can an agent be influenced by what it observes? In this paper, we ground this concept in a universal agent-centric measure that we refer to as plasticity, and reveal a fundamental connection to empowerment. Following a set of desiderata on a suitable definition, we define plasticity using a new information-theoretic quantity we call the generalized directed information. We show that this new quantity strictly generalizes the directed information introduced by Massey (1990) while preserving all of its desirable properties. Our first finding is that plasticity is the mirror of empowerment: The agent's plasticity is identical to the empowerment of the environment, and vice versa. Our second finding establishes a tension between the plasticity and empowerment of an agent, suggesting that agent design needs to be mindful of both characteristics. We explore the implications of these findings, and suggest that plasticity, empowerment, and their relationship are essential to understanding agency.
- Abstract(参考訳): エージェントは、過去の観測の影響を受け、将来の観測に影響を与えるために作用する最小限の実体である。
後者の能力は、人工知能と認知科学にまたがる重要なフレーミングの概念として機能するエンパワーメントによって捉えられている。
しかし、この以前の能力は、同じように基礎的だ: どんな方法で、どの程度、エージェントが観察するものの影響を受けられるのか?
本稿では, この概念を, 可塑性と呼ぶ普遍的なエージェント中心の尺度で論じ, エンパワーメントへの根本的な関連を明らかにする。
適切な定義でデシラタのセットに従うと、一般化された有向情報と呼ばれる新しい情報理論量を用いて可塑性を定義する。
この新量は、マシーが1990年に導入した指示情報を、その望ましい性質をすべて保存しながら厳密に一般化することを示します。
最初の発見は、可塑性はエンパワーメントの鏡であり、エージェントの可塑性は環境のエンパワーメントと同一であり、その逆である。
第2の発見は、エージェントの可塑性とエンパワーメントの緊張関係を確立し、エージェント設計が両方の特性に注意する必要があることを示唆している。
これらの発見がもたらす意味を考察し, 可塑性, エンパワーメント, およびそれらの関係性は, エージェントの理解に不可欠であることを示唆する。
関連論文リスト
- A Theoretical Framework for Explaining Reinforcement Learning with Shapley Values [0.0]
我々は、国家的特徴の影響を通じて強化学習を説明する理論的枠組みを開発する。
説明の恩恵を受けるエージェント環境相互作用の3つの中核要素を同定する。
このアプローチは、明確な意味論と理論的保証を持つ数学的根拠のある説明の族を生み出す。
論文 参考訳(メタデータ) (2025-05-12T17:48:28Z) - Generating Causal Explanations of Vehicular Agent Behavioural Interactions with Learnt Reward Profiles [13.450023647228843]
我々はエージェント間相互作用の説明を因果的に推測できるようなエージェントに対する報酬指標の重み付けを学習する。
3つの実世界の運転データセットに対して定量的かつ定性的にアプローチを検証する。
論文 参考訳(メタデータ) (2025-03-18T01:53:59Z) - Agency Is Frame-Dependent [94.91580596320331]
エージェンシーは、目標に向かって成果を操縦するシステムの能力である。
私たちは、エージェンシーは基本的にフレーム依存であると主張している。
我々はあらゆる基礎科学がフレーム依存を必要とすると結論付けている。
論文 参考訳(メタデータ) (2025-02-06T08:34:57Z) - Symmetry and Complexity in Object-Centric Deep Active Inference Models [4.298360054690217]
生成モデルの潜在状態空間における特定の対象の固有対称性が、深いアクティブな推論の下で学習されることを示す。
特に,対象中心の表現に焦点をあて,エージェントが視点を移すにつれて,新しい対象の視点を予測するために画素から学習する。
論文 参考訳(メタデータ) (2023-04-14T10:21:26Z) - Intrinsic Physical Concepts Discovery with Object-Centric Predictive
Models [86.25460882547581]
PHYsical Concepts Inference NEtwork (PHYCINE) は、異なる抽象レベルの物理概念を監督なしで推論するシステムである。
物理概念変数を含むオブジェクト表現は因果推論タスクの性能向上に有効であることを示す。
論文 参考訳(メタデータ) (2023-03-03T11:52:21Z) - Designing Ecosystems of Intelligence from First Principles [34.429740648284685]
このホワイトペーパーは、今後10年間(そしてそれ以上)、人工知能の分野における研究と発展のビジョンを概説している。
そのデノウメントは自然と合成の感覚形成のサイバー物理的なエコシステムであり、人間は統合的な参加者である。
このビジョンは、知性の物理学として読むことができる適応的行動の定式化である能動推論に基づいている。
論文 参考訳(メタデータ) (2022-12-02T18:24:06Z) - Information is Power: Intrinsic Control via Information Capture [110.3143711650806]
我々は,潜時状態空間モデルを用いて推定したエージェントの状態訪問のエントロピーを最小化する,コンパクトで汎用的な学習目的を論じる。
この目的は、不確実性の低減に対応する環境情報収集と、将来の世界状態の予測不可能性の低減に対応する環境制御の両方をエージェントに誘導する。
論文 参考訳(メタデータ) (2021-12-07T18:50:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。