論文の概要: Dissecting Larval Zebrafish Hunting using Deep Reinforcement Learning Trained RNN Agents
- arxiv url: http://arxiv.org/abs/2510.03699v1
- Date: Sat, 04 Oct 2025 06:40:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.202335
- Title: Dissecting Larval Zebrafish Hunting using Deep Reinforcement Learning Trained RNN Agents
- Title(参考訳): 深部強化学習RNNエージェントを用いたラバールゼブラフィッシュ狩り
- Authors: Raaghav Malik, Satpreet H. Singh, Sonja Johnson-Yu, Nathan Wu, Roy Harpaz, Florian Engert, Kanaka Rajan,
- Abstract要約: 幼魚狩りは、生態的・エネルギ的制約が適応行動をどのように形成するかを研究するための、魅力的な環境を提供する。
我々は,最小限のエージェントベースモデルを構築し,ブーンベースのゼブラフィッシュシミュレータにおいて,深層強化学習による繰り返しポリシーを訓練する。
その単純さにもかかわらず、このモデルは本物の幼魚のゼブラフィッシュと密にマッチするハロウィン狩りの行動を再現する。
- 参考スコア(独自算出の注目度): 1.8853228540913756
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Larval zebrafish hunting provides a tractable setting to study how ecological and energetic constraints shape adaptive behavior in both biological brains and artificial agents. Here we develop a minimal agent-based model, training recurrent policies with deep reinforcement learning in a bout-based zebrafish simulator. Despite its simplicity, the model reproduces hallmark hunting behaviors -- including eye vergence-linked pursuit, speed modulation, and stereotyped approach trajectories -- that closely match real larval zebrafish. Quantitative trajectory analyses show that pursuit bouts systematically reduce prey angle by roughly half before strike, consistent with measurements. Virtual experiments and parameter sweeps vary ecological and energetic constraints, bout kinematics (coupled vs. uncoupled turns and forward motion), and environmental factors such as food density, food speed, and vergence limits. These manipulations reveal how constraints and environments shape pursuit dynamics, strike success, and abort rates, yielding falsifiable predictions for neuroscience experiments. These sweeps identify a compact set of constraints -- binocular sensing, the coupling of forward speed and turning in bout kinematics, and modest energetic costs on locomotion and vergence -- that are sufficient for zebrafish-like hunting to emerge. Strikingly, these behaviors arise in minimal agents without detailed biomechanics, fluid dynamics, circuit realism, or imitation learning from real zebrafish data. Taken together, this work provides a normative account of zebrafish hunting as the optimal balance between energetic cost and sensory benefit, highlighting the trade-offs that structure vergence and trajectory dynamics. We establish a virtual lab that narrows the experimental search space and generates falsifiable predictions about behavior and neural coding.
- Abstract(参考訳): 幼体のゼブラフィッシュ狩りは、生態的およびエネルギー的制約が、生物の脳と人工エージェントの両方で適応的な行動をどのように形成するかを研究するための、魅力的な環境を提供する。
ここではエージェントベースモデルを構築し,ブーンベースゼブラフィッシュシミュレータを用いた深層強化学習による繰り返しポリシーの訓練を行う。
その単純さにもかかわらず、このモデルは、実際の幼魚のゼブラフィッシュと密に一致した、目頂点の追跡行動、速度変調、ステレオタイプ化されたアプローチ軌跡を含む、目頂点の狩猟行動を再現する。定量的な軌道解析により、追尾は、ストライク前のほぼ半分の獲物角度を体系的に減少させ、測定と一致している。仮想実験とパラメータスリープは、生態的およびエネルギスティックな制約、ブーンキネマティクス(結合しない回転と前進)、食物密度、食物の速度、潜伏制限といった環境要因、そしてこれらの操作は、いかに制約や環境が動的に運動を追及し、成功し、脳卒中率、脳卒中率を予測し、神経科学実験の予測を行うかを明らかにする。
興味深いことに、これらの行動は、詳細なバイオメカニクス、流体力学、回路リアリズム、または実際のゼブラフィッシュデータからの模倣学習のない最小限のエージェントで発生する。
この研究は、ゼブラフィッシュの狩猟をエネルギー的コストと感覚的利益の最適なバランスとして規範的に説明し、頂点と軌道力学を構成するトレードオフを強調している。
我々は,実験空間を狭める仮想実験室を構築し,行動やニューラルコーディングに関する偽の予測を生成する。
関連論文リスト
- From Pheromones to Policies: Reinforcement Learning for Engineered Biological Swarms [0.0]
本研究では, フェロモンを介するセロモン凝集と強化学習(RL)の理論的等価性を確立する。
我々は,フェロモンが数学的に相互学習の更新を反映していることを示し,捕食作業を行う線虫群をモデル化した。
この結果から, 環境信号が外部メモリとして機能する分散RLプロセスは, スティグマイシン系が本質的にコード化されていることが示唆された。
論文 参考訳(メタデータ) (2025-09-24T13:16:35Z) - Langevin Flows for Modeling Neural Latent Dynamics [81.81271685018284]
逐次変分自動エンコーダであるLangevinFlowを導入し、潜伏変数の時間的進化をアンダーダム化したLangevin方程式で制御する。
われわれのアプローチは、慣性、減衰、学習されたポテンシャル関数、力などの物理的事前を組み込んで、ニューラルネットワークにおける自律的および非自律的プロセスの両方を表現する。
本手法は,ロレンツ誘引器によって生成される合成神経集団に対する最先端のベースラインより優れる。
論文 参考訳(メタデータ) (2025-07-15T17:57:48Z) - Self-supervised pretraining of vision transformers for animal behavioral analysis and neural encoding [12.25140375320834]
BEAST(Behavioral Analysis via Self-supervised pretraining of Transformers)は、様々な神経行動分析のために実験固有の視覚変換器を事前訓練する新しいフレームワークである。
本手法は,ラベル付きデータが不足しているシナリオにおいて,行動解析を高速化する,強力で汎用的なバックボーンモデルを確立する。
論文 参考訳(メタデータ) (2025-07-13T06:43:05Z) - Coordinating Spinal and Limb Dynamics for Enhanced Sprawling Robot Mobility [0.047116288835793156]
柔軟性のある脊椎は、脊椎に沿って波状の動きを通して身体を揺らぎ、不均一な地形や障害物を航行するのを助ける。
表面の不規則や摩擦の変動といった環境の不確実性は、体-肢の協調を著しく阻害する。
深い強化学習は、非決定論的環境を扱うための有望なフレームワークを提供する。
本研究では,サンショウウオのようなロボットを用いた学習型制御戦略と生物学的にインスパイアされた歩行設計手法について比較検討した。
論文 参考訳(メタデータ) (2025-04-18T23:08:48Z) - Predator-prey survival pressure is sufficient to evolve swarming
behaviors [22.69193229479221]
混合協調競合型マルチエージェント強化学習に基づく最小限の捕食者・捕食者共進化フレームワークを提案する。
驚くべきことに、我々のこのアプローチの分析は、獲物と捕食者の両方にとって予期せぬほど多様な行動を示す。
論文 参考訳(メタデータ) (2023-08-24T08:03:11Z) - From Data-Fitting to Discovery: Interpreting the Neural Dynamics of
Motor Control through Reinforcement Learning [3.6159844753873087]
足の移動を行う仮想ロボットの構造的神経活動について検討した。
歩行訓練されたエンボディードエージェントは、タングリングを避けるスムーズなダイナミックスを示す。
論文 参考訳(メタデータ) (2023-05-18T16:52:27Z) - Bridging the Gap to Real-World Object-Centric Learning [66.55867830853803]
自己教師付き方法で訓練されたモデルから特徴を再構成することは、完全に教師なしの方法でオブジェクト中心表現が生じるための十分な訓練信号であることを示す。
我々のアプローチであるDINOSAURは、シミュレーションデータ上で既存のオブジェクト中心学習モデルよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-09-29T15:24:47Z) - Hybrid Physics and Deep Learning Model for Interpretable Vehicle State
Prediction [75.1213178617367]
深層学習と物理運動モデルを組み合わせたハイブリッドアプローチを提案する。
ハイブリッドモデルの一部として,ディープニューラルネットワークの出力範囲を制限することで,解釈可能性を実現する。
その結果, ハイブリッドモデルでは, 既存のディープラーニング手法に比べて精度を低下させることなく, モデル解釈性が向上できることがわかった。
論文 参考訳(メタデータ) (2021-03-11T15:21:08Z) - Social NCE: Contrastive Learning of Socially-aware Motion
Representations [87.82126838588279]
実験結果から, 提案手法は最近の軌道予測, 行動クローニング, 強化学習アルゴリズムの衝突速度を劇的に低減することがわかった。
本手法は,ニューラルネットワークの設計に関する仮定をほとんど示さないため,神経運動モデルのロバスト性を促進する汎用的手法として使用できる。
論文 参考訳(メタデータ) (2020-12-21T22:25:06Z) - Variational Dynamic for Self-Supervised Exploration in Deep Reinforcement Learning [12.76337275628074]
本研究では,条件付き変分推論に基づく変動力学モデルを提案し,多モード性および生成性をモデル化する。
環境遷移の負の対数類似度の上界を導出し、その上界を探査の本質的な報酬として利用する。
提案手法は,最先端の環境モデルに基づく探索手法よりも優れている。
論文 参考訳(メタデータ) (2020-10-17T09:54:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。