論文の概要: Intrinsic Goals for Autonomous Agents: Model-Based Exploration in Virtual Zebrafish Predicts Ethological Behavior and Whole-Brain Dynamics
- arxiv url: http://arxiv.org/abs/2506.00138v2
- Date: Fri, 24 Oct 2025 17:52:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 09:00:14.982801
- Title: Intrinsic Goals for Autonomous Agents: Model-Based Exploration in Virtual Zebrafish Predicts Ethological Behavior and Whole-Brain Dynamics
- Title(参考訳): 自律型エージェントの本質的な目標:仮想ゼブラフィッシュにおけるモデルに基づく探索による行動予測と全脳動態予測
- Authors: Reece Keller, Alyn Kirsch, Felix Pei, Xaq Pitkow, Leo Kozachkov, Aran Nayebi,
- Abstract要約: 自律性は動物の知能の目印であり、外部の報酬やタスク構造に頼ることなく、複雑な環境で適応的でインテリジェントな行動を可能にする。
本稿では,動物における自律探査の原則に則って設計された,新しいモデルに基づく固有ドライブを提案する。
本研究は,モデルに基づく本質的なモチベーションと自然主義的行動とを結合する計算枠組みを構築した。
- 参考スコア(独自算出の注目度): 5.442633631358052
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomy is a hallmark of animal intelligence, enabling adaptive and intelligent behavior in complex environments without relying on external reward or task structure. Existing reinforcement learning approaches to exploration in reward-free environments, including a class of methods known as model-based intrinsic motivation, exhibit inconsistent exploration patterns and do not converge to an exploratory policy, thus failing to capture robust autonomous behaviors observed in animals. Moreover, systems neuroscience has largely overlooked the neural basis of autonomy, focusing instead on experimental paradigms where animals are motivated by external reward rather than engaging in ethological, naturalistic and task-independent behavior. To bridge these gaps, we introduce a novel model-based intrinsic drive explicitly designed after the principles of autonomous exploration in animals. Our method (3M-Progress) achieves animal-like exploration by tracking divergence between an online world model and a fixed prior learned from an ecological niche. To the best of our knowledge, we introduce the first autonomous embodied agent that predicts brain data entirely from self-supervised optimization of an intrinsic goal -- without any behavioral or neural training data -- demonstrating that 3M-Progress agents capture the explainable variance in behavioral patterns and whole-brain neural-glial dynamics recorded from autonomously behaving larval zebrafish, thereby providing the first goal-driven, population-level model of neural-glial computation. Our findings establish a computational framework connecting model-based intrinsic motivation to naturalistic behavior, providing a foundation for building artificial agents with animal-like autonomy.
- Abstract(参考訳): 自律性は動物の知能の目印であり、外部の報酬やタスク構造に頼ることなく、複雑な環境で適応的でインテリジェントな行動を可能にする。
モデルに基づく本質的なモチベーションとして知られる一連の手法を含む、報酬のない環境での探索に対する既存の強化学習アプローチは、一貫性のない探索パターンを示し、探索政策に収束せず、動物で観察される堅牢な自律的な行動の獲得に失敗する。
さらに、システム神経科学は、動物が倫理的、自然主義的、タスク非依存的な行動に従事するのではなく、外部報酬によって動機づけられる実験的なパラダイムに焦点を絞って、自律性の神経基盤を見落としてきた。
これらのギャップを埋めるために,動物における自律探査の原則に則って設計されたモデルに基づく本質的なドライブを導入する。
本手法(3M-Progress)は,生態学的なニッチから学習したオンライン世界モデルと固定された事前学習との差異を追跡することにより,動物的な探索を実現する。
我々の知る限りでは、3M-プログレッシブエージェントが自律的に行動パターンと自律的に行動する幼虫ゼブラフィッシュから記録される脳神経グリアダイナミクスの説明可能なばらつきを捉え、最初の目標駆動型人口レベルのニューラルグリア計算モデルを提供することを示す。
本研究は,モデルに基づく本質的な動機づけを自然主義的行動に結びつけるための計算枠組みを確立し,動物のような自律性を持つ人工エージェント構築の基盤となる。
関連論文リスト
- Langevin Flows for Modeling Neural Latent Dynamics [81.81271685018284]
逐次変分自動エンコーダであるLangevinFlowを導入し、潜伏変数の時間的進化をアンダーダム化したLangevin方程式で制御する。
われわれのアプローチは、慣性、減衰、学習されたポテンシャル関数、力などの物理的事前を組み込んで、ニューラルネットワークにおける自律的および非自律的プロセスの両方を表現する。
本手法は,ロレンツ誘引器によって生成される合成神経集団に対する最先端のベースラインより優れる。
論文 参考訳(メタデータ) (2025-07-15T17:57:48Z) - Neural Brain: A Neuroscience-inspired Framework for Embodied Agents [58.58177409853298]
大規模な言語モデルのような現在のAIシステムは、いまだに解体され続けており、物理的に世界と関わりが持てない。
この課題の核心は、人間のような適応性を持つエンボディエージェントを駆動するために設計された中枢知能システムであるNeural Brain(ニューラル・ブレイン)の概念である。
本稿では,2つの基本的な課題に対処する,エンボディエージェントのニューラルブレインの統一的枠組みを提案する。
論文 参考訳(メタデータ) (2025-05-12T15:05:34Z) - Emergence of Goal-Directed Behaviors via Active Inference with Self-Prior [4.863927022806184]
幼児は、外部報酬基準が提供されていない場合でも、感覚刺激に手を伸ばすなど、目標指向の行動を示すことが多い。
我々は「自己優先」と呼ばれるエージェント自身のマルチモーダル感覚経験のための新しい密度モデルを提案する。
本研究は、エージェント自身の感覚経験によって形成される本態的に動機づけられた行動を実装し、初期発達における意図的行動の自然発生を実証する。
論文 参考訳(メタデータ) (2025-04-15T11:16:27Z) - Meta-Representational Predictive Coding: Biomimetic Self-Supervised Learning [51.22185316175418]
メタ表現予測符号化(MPC)と呼ばれる新しい予測符号化方式を提案する。
MPCは、並列ストリームにまたがる感覚入力の表現を予測することを学ぶことによって、感覚入力の生成モデルを学ぶ必要性を助長する。
論文 参考訳(メタデータ) (2025-03-22T22:13:14Z) - Modeling Dynamic Neural Activity by combining Naturalistic Video Stimuli and Stimulus-independent Latent Factors [5.967290675400836]
本稿では,映像刺激と刺激非依存の潜伏因子からニューロン反応の結合分布を予測する確率モデルを提案する。
その結果,他のニューロンからの反応を条件づけた場合,対数様態で映像のみのモデルより優れ,可能性や相関性が向上することが判明した。
論文 参考訳(メタデータ) (2024-10-21T16:01:39Z) - From Data-Fitting to Discovery: Interpreting the Neural Dynamics of
Motor Control through Reinforcement Learning [3.6159844753873087]
足の移動を行う仮想ロボットの構造的神経活動について検討した。
歩行訓練されたエンボディードエージェントは、タングリングを避けるスムーズなダイナミックスを示す。
論文 参考訳(メタデータ) (2023-05-18T16:52:27Z) - Intrinsic Motivation in Dynamical Control Systems [5.635628182420597]
エージェントのエンパワーメントの最大化に基づく本質的なモチベーションに対する情報理論的アプローチについて検討する。
このアプローチは、本質的なモチベーションを形式化する以前の試みを一般化することを示す。
これにより、実用的な人工的な本質的なモチベーションを持つコントローラーを設計するための扉が開く。
論文 参考訳(メタデータ) (2022-12-29T05:20:08Z) - Inference of Affordances and Active Motor Control in Simulated Agents [0.5161531917413706]
本稿では,出力確率,時間的予測,モジュール型人工ニューラルネットワークアーキテクチャを提案する。
我々のアーキテクチャは、割当マップと解釈できる潜在状態が発達していることを示す。
アクティブな推論と組み合わせることで、フレキシブルでゴール指向の動作が実行可能であることを示す。
論文 参考訳(メタデータ) (2022-02-23T14:13:04Z) - Overcoming the Domain Gap in Contrastive Learning of Neural Action
Representations [60.47807856873544]
神経科学の基本的な目標は、神経活動と行動の関係を理解することである。
我々は,ハエが自然に生み出す行動からなる新しいマルチモーダルデータセットを作成した。
このデータセットと新しい拡張セットは、神経科学における自己教師あり学習手法の適用を加速することを約束します。
論文 参考訳(メタデータ) (2021-11-29T15:27:51Z) - Backprop-Free Reinforcement Learning with Active Neural Generative
Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。
我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。
我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文 参考訳(メタデータ) (2021-07-10T19:02:27Z) - Continuous Learning and Adaptation with Membrane Potential and
Activation Threshold Homeostasis [91.3755431537592]
本稿では,MPATH(Membrane Potential and Activation Threshold Homeostasis)ニューロンモデルを提案する。
このモデルにより、ニューロンは入力が提示されたときに自動的に活性を調節することで動的平衡の形式を維持することができる。
実験は、モデルがその入力から適応し、継続的に学習する能力を示す。
論文 参考訳(メタデータ) (2021-04-22T04:01:32Z) - Variational Dynamic for Self-Supervised Exploration in Deep Reinforcement Learning [12.76337275628074]
本研究では,条件付き変分推論に基づく変動力学モデルを提案し,多モード性および生成性をモデル化する。
環境遷移の負の対数類似度の上界を導出し、その上界を探査の本質的な報酬として利用する。
提案手法は,最先端の環境モデルに基づく探索手法よりも優れている。
論文 参考訳(メタデータ) (2020-10-17T09:54:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。