論文の概要: Robots that learn to evaluate models of collective behavior
- arxiv url: http://arxiv.org/abs/2604.07303v1
- Date: Wed, 08 Apr 2026 17:11:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.653595
- Title: Robots that learn to evaluate models of collective behavior
- Title(参考訳): 集団行動モデルの評価を学習するロボット
- Authors: Mathis Hocke, Andreas Gerken, David Bierbach, Jens Krause, Tim Landgraf,
- Abstract要約: 本稿では,生物模倣ロボットフィッシュ(RoboFish)を用いて,クローズドループ相互作用による生魚の行動の計算モデルを評価する。
我々は,4つの異なる魚モデル – 単純な定位置ベースライン,2つのルールベースモデル,生物学的基盤を持つ畳み込みニューラルネットワークモデル – を用いて,シミュレーションのポリシを訓練し,これらのポリシを実際のRoboFishセットアップに転送した。
我々は、目標到達性能、個人間距離、壁相互作用などの行動指標のシミュレーションと実際の分布の間のワッサーシュタイン距離として定義されるシム・トゥ・リアルギャップを定量化し、魚モデルを評価する。
- 参考スコア(独自算出の注目度): 7.979981463085327
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Understanding and modeling animal behavior is essential for studying collective motion, decision-making, and bio-inspired robotics. Yet, evaluating the accuracy of behavioral models still often relies on offline comparisons to static trajectory statistics. Here we introduce a reinforcement-learning-based framework that uses a biomimetic robotic fish (RoboFish) to evaluate computational models of live fish behavior through closed-loop interaction. We trained policies in simulation using four distinct fish models-a simple constant-follow baseline, two rule-based models, and a biologically grounded convolutional neural network model-and transferred these policies to the real RoboFish setup, where they interacted with live fish. Policies were trained to guide a simulated fish to goal locations, enabling us to quantify how the response of real fish differs from the simulated fish's response. We evaluate the fish models by quantifying the sim-to-real gaps, defined as the Wasserstein distance between simulated and real distributions of behavioral metrics such as goal-reaching performance, inter-individual distances, wall interactions, and alignment. The neural network-based fish model exhibited the smallest gap across goal-reaching performance and most other metrics, indicating higher behavioral fidelity than conventional rule-based models under this benchmark. More importantly, this separation shows that the proposed evaluation can quantitatively distinguish candidate models under matched closed-loop conditions. Our work demonstrates how learning-based robotic experiments can uncover deficiencies in behavioral models and provides a general framework for evaluating animal behavior models through embodied interaction.
- Abstract(参考訳): 動物行動の理解とモデル化は、集団運動、意思決定、バイオインスパイアされたロボットの研究に不可欠である。
しかし、行動モデルの精度を評価することは、静的軌道統計学のオフライン比較に頼っていることが多い。
本稿では,生物模倣ロボットフィッシュ(RoboFish)を用いて,クローズドループ相互作用による生魚の行動の計算モデルを評価する。
4つの異なる魚モデル(単純な定位置ベースライン、2つのルールベースモデル、生物学的に基底付けられた畳み込みニューラルネットワークモデル)を用いて、シミュレーションのポリシーを訓練し、これらのポリシーを実際のRoboFishセットアップに転送し、そこでライブ魚と対話した。
実際の魚の反応が模擬魚の反応とどう違うのかを定量化できるように、模擬魚を目標地点に誘導する政策が訓練された。
本研究では,目標到達性能,個人間距離,壁相互作用,アライメントなどの行動指標のシミュレーションと実際の分布間のワッサースタイン距離を定量化することにより,魚のモデルを評価する。
ニューラルネットワークに基づく魚モデルでは、目標達成性能と他の指標の最も小さなギャップが示され、このベンチマークでは従来のルールベースモデルよりも行動の忠実度が高かった。
さらに, この分離により, 提案手法は, 整合した閉ループ条件下での候補モデルを定量的に識別できることを示す。
我々の研究は、学習に基づくロボット実験が行動モデルにおける欠陥を明らかにする方法を示し、具体的相互作用を通じて動物行動モデルを評価するための一般的な枠組みを提供する。
関連論文リスト
- Controlling Fish Schools via Reinforcement Learning of Virtual Fish Movement [2.5782420501870296]
本研究では,強化学習で訓練した仮想魚を用いて,魚学校を指導し,管理する方法について検討した。
画面上に表示される2D仮想魚を用いて、物理的ロボットエージェントに固有の耐久性や運動制限といった技術的課題を克服する。
論文 参考訳(メタデータ) (2026-03-17T11:12:36Z) - Transferable Post-training via Inverse Value Learning [83.75002867411263]
別個のニューラルネットワーク(すなわち値ネットワーク)を用いた後学習におけるロジットレベルのモデリング変更を提案する。
このネットワークをデモを使って小さなベースモデルでトレーニングした後、推論中に他のトレーニング済みモデルとシームレスに統合することができる。
得られた値ネットワークは、パラメータサイズの異なる事前学習されたモデル間で広い転送性を有することを示す。
論文 参考訳(メタデータ) (2024-10-28T13:48:43Z) - Predicting the long-term collective behaviour of fish pairs with deep learning [52.83927369492564]
本研究では,魚種Hemigrammus rhodostomusの社会的相互作用を評価するための深層学習モデルを提案する。
我々は、ディープラーニングのアプローチの結果と実験結果と、最先端の分析モデルの結果を比較した。
機械学習モデルにより、ソーシャルインタラクションは、微妙な実験的観測可能な解析的相互作用と直接競合できることを実証する。
論文 参考訳(メタデータ) (2023-02-14T05:25:03Z) - Conditional Generative Models for Simulation of EMG During Naturalistic
Movements [45.698312905115955]
本稿では、運動単位活性化電位波形を生成するために、逆向きに訓練された条件付き生成ニューラルネットワークを提案する。
本研究では,より少ない数の数値モデルの出力を高い精度で予測的に補間できることを実証する。
論文 参考訳(メタデータ) (2022-11-03T14:49:02Z) - Learning interaction rules from multi-animal trajectories via augmented
behavioral models [8.747278400158718]
グランガー因果関係は観測された時系列データから相互作用を分析するための実践的なフレームワークである。
この枠組みは動物行動における生成過程の構造を無視している。
マルチアニマル軌道からグラガー因果関係を学習するための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-07-12T11:33:56Z) - Movement Tracks for the Automatic Detection of Fish Behavior in Videos [63.85815474157357]
水中ビデオでサブルフィッシュ(Anoplopoma fimbria)の発芽行動のデータセットを提供し,その上での深層学習(DL)法による行動検出について検討した。
提案する検出システムは,Long Short-Term Memory(LSTM)ネットワークを用いて,サブルフィッシュの起動動作を識別する。
論文 参考訳(メタデータ) (2020-11-28T05:51:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。