論文の概要: Neural Policy Composition from Free Energy Minimization
- arxiv url: http://arxiv.org/abs/2512.04745v1
- Date: Thu, 04 Dec 2025 12:31:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-05 21:11:46.161257
- Title: Neural Policy Composition from Free Energy Minimization
- Title(参考訳): 自由エネルギー最小化によるニューラルポリシーの構成
- Authors: Francesca Rossi, Veronica Centorrino, Francesco Bullo, Giovanni Russo,
- Abstract要約: 本稿では,ゲーティングの出現と基礎となる意思決定課題を結びつける理論的基礎計算モデルであるGateModを紹介する。
GateModは、ニューラルポリシーゲーティング、タスク目標のリンク、動的計算、回路レベルのメカニズムのための統一フレームワークを提供する。
これは、現在の説明以上の自然なエージェントのゲーティングを理解し、この能力で機械を装備するためのフレームワークを提供する。
- 参考スコア(独自算出の注目度): 4.383110412734042
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The ability to compose acquired skills to plan and execute behaviors is a hallmark of natural intelligence. Yet, despite remarkable cross-disciplinary efforts, a principled account of how task structure shapes gating and how such computations could be delivered in neural circuits, remains elusive. Here we introduce GateMod, an interpretable theoretically grounded computational model linking the emergence of gating to the underlying decision-making task, and to a neural circuit architecture. We first develop GateFrame, a normative framework casting policy gating into the minimization of the free energy. This framework, relating gating rules to task, applies broadly across neuroscience, cognitive and computational sciences. We then derive GateFlow, a continuous-time energy based dynamics that provably converges to GateFrame optimal solution. Convergence, exponential and global, follows from a contractivity property that also yields robustness and other desirable properties. Finally, we derive a neural circuit from GateFlow, GateNet. This is a soft-competitive recurrent circuit whose components perform local and contextual computations consistent with known dendritic and neural processing motifs. We evaluate GateMod across two different settings: collective behaviors in multi-agent systems and human decision-making in multi-armed bandits. In all settings, GateMod provides interpretable mechanistic explanations of gating and quantitatively matches or outperforms established models. GateMod offers a unifying framework for neural policy gating, linking task objectives, dynamical computation, and circuit-level mechanisms. It provides a framework to understand gating in natural agents beyond current explanations and to equip machines with this ability.
- Abstract(参考訳): 行動計画と実行のための獲得したスキルを構成する能力は、自然知性の目印である。
しかし、卓越した学際的な努力にもかかわらず、タスク構造がゲーティングをどのように形成し、そのような計算をニューラルネットワークでどのように配信するかという原則的な説明は、いまだ解明されていない。
ここでは、ゲーティングの出現を根底にある意思決定タスク、およびニューラルネットワークアーキテクチャにリンクさせる解釈可能な理論的基盤計算モデルであるGateModを紹介する。
我々はまず,自由エネルギーの最小化にこだわる規範的枠組みキャスティング政策であるGateFrameを開発した。
この枠組みは、ゲーティングルールをタスクに関連付けるもので、神経科学、認知科学、計算科学に広く適用される。
次に、GateFrameの最適解に確実に収束する連続時間エネルギーベースのダイナミクスであるGateFlowを導出する。
収束性(英語版)は指数関数的かつ大域的であり、強靭性やその他の望ましい性質をもたらす収縮性から従う。
最後に、GateFlow, GateNetからニューラルネットワークを導出する。
これはソフトコンペティティブ・リカレント回路であり、コンポーネントは既知の樹状突起およびニューラルプロセッシングモチーフと整合した局所的および文脈的な計算を行う。
マルチエージェントシステムにおける集団行動と,マルチアームバンディットにおける人的意思決定の2つの異なる設定でGateModを評価した。
あらゆる設定において、GateModはゲーティングと定量的に一致するか、確立されたモデルより優れているかを解釈可能なメカニスティックな説明を提供する。
GateModは、ニューラルポリシーゲーティング、タスク目標のリンク、動的計算、回路レベルのメカニズムのための統一フレームワークを提供する。
これは、現在の説明以上の自然なエージェントのゲーティングを理解し、この能力で機械を装備するためのフレームワークを提供する。
関連論文リスト
- Reconfigurable qubit states and quantum trajectories in a synthetic artificial neuron network with a process to direct information generation from co-integrated burst-mode spiking under non-Markovianity [0.0]
量子情報処理とスパイキング計算を併用した状態で機能する人工ニューロンネットワークを提案する。
これにより、クォービットのコヒーレンス状態と絡み合い、タンデムで読み出しや基本演算のような関数を実行することができる。
これにより、高度な機能を備えた情報パケットの生成と計算処理が可能になり、ルーティングにおけるセキュリティレベルが向上する。
論文 参考訳(メタデータ) (2025-07-22T15:02:06Z) - Experimental neuromorphic computing based on quantum memristor [0.2618499987393917]
本研究は, 経験的フィードバックループによって非線形性が向上し, テストアルゴリズムの性能が向上することを示す。
このような場合、量子経験的要素の本質的な役割を強調し、より洗練されたネットワークにおけるビルディングブロックとして使用する可能性を示す。
論文 参考訳(メタデータ) (2025-04-25T21:03:19Z) - ActPC-Chem: Discrete Active Predictive Coding for Goal-Guided Algorithmic Chemistry as a Potential Cognitive Kernel for Hyperon & PRIMUS-Based AGI [0.0]
バイオインスパイアされたゴール誘導人工知能(AI)のための新しいパラダイム(ラベル付き ActPC-Chem)を探求する。
ActPCは、離散アクティブ予測符号化(ActPC)の形式で、書き換え規則のアルゴリズム化学で運用されている。
論文 参考訳(メタデータ) (2024-12-21T09:14:25Z) - Topology Optimization of Random Memristors for Input-Aware Dynamic SNN [44.38472635536787]
入力対応動的旋回型スパイクニューラルネットワーク(PRIME)のプルーニング最適化について紹介する。
信号表現の面では、PRIMEは脳固有のスパイキング機構をエミュレートするために、漏れやすい統合と発火のニューロンを使用する。
計算深度の動的調整にインスパイアされた再構成性のために、PRIMEは入力対応の動的早期停止ポリシーを採用している。
論文 参考訳(メタデータ) (2024-07-26T09:35:02Z) - Logical blocks for fault-tolerant topological quantum computation [55.41644538483948]
本稿では,プラットフォームに依存しない論理ゲート定義の必要性から,普遍的なフォールトトレラント論理の枠組みを提案する。
資源オーバーヘッドを改善するユニバーサル論理の新しいスキームについて検討する。
境界のない計算に好適な論理誤差率を動機として,新しい計算手法を提案する。
論文 参考訳(メタデータ) (2021-12-22T19:00:03Z) - Universal computation using localized limit-cycle attractors in neural
networks [0.0]
しきい値ネットワークにおける局所的アトラクタの相互作用は普遍的な計算結果をもたらすことを示す。
生物にインスパイアされた2次元しきい値ネットワークにおいて,普遍的なブールゲートを構築できるスイッチングアルゴリズムを開発した。
これらのゲートは普遍的なコンピュータを構築するのに利用できることを示す。
論文 参考訳(メタデータ) (2021-12-10T14:12:21Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Training End-to-End Analog Neural Networks with Equilibrium Propagation [64.0476282000118]
本稿では,勾配降下による終端から終端までのアナログニューラルネットワークの学習法を提案する。
数学的には、アナログニューラルネットワークのクラス(非線形抵抗性ネットワークと呼ばれる)がエネルギーベースモデルであることが示される。
我々の研究は、オンチップ学習をサポートする、超高速でコンパクトで低消費電力のニューラルネットワークの新世代の開発を導くことができる。
論文 参考訳(メタデータ) (2020-06-02T23:38:35Z) - Refined Gate: A Simple and Effective Gating Mechanism for Recurrent
Units [68.30422112784355]
本稿では,この問題に対処する一般ゲートリカレントニューラルネットワークにおける新しいゲーティング機構を提案する。
提案したゲートは、抽出された入力特徴とバニラゲートの出力を直接的にショートする。
LSTM, GRU, MGUの3種類のゲートRNNに対して, 提案したゲーティング機構を検証する。
論文 参考訳(メタデータ) (2020-02-26T07:51:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。