論文の概要: Data-driven simulator of multi-animal behavior with unknown dynamics via offline and online reinforcement learning
- arxiv url: http://arxiv.org/abs/2510.10451v1
- Date: Sun, 12 Oct 2025 05:08:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:29.943546
- Title: Data-driven simulator of multi-animal behavior with unknown dynamics via offline and online reinforcement learning
- Title(参考訳): オフラインおよびオンライン強化学習による未知ダイナミクスを用いたマルチ動物行動のシミュレータ
- Authors: Keisuke Fujii, Kazushi Tsutsui, Yu Teshima, Makoto Itoh, Naoya Takeishi, Nozomi Nishiumi, Ryoya Tanaka, Shunsuke Shigaki, Yoshinobu Kawahara,
- Abstract要約: 生物学における現実的なマルチアニマルシミュレーションの重要な課題は、未知の現実世界の遷移モデルとそのシミュレーションモデルの間のギャップを埋めることである。
深層強化学習と対実シミュレーションに基づくマルチ動物行動のためのデータ駆動シミュレータを提案する。
- 参考スコア(独自算出の注目度): 8.835312357110618
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Simulators of animal movements play a valuable role in studying behavior. Advances in imitation learning for robotics have expanded possibilities for reproducing human and animal movements. A key challenge for realistic multi-animal simulation in biology is bridging the gap between unknown real-world transition models and their simulated counterparts. Because locomotion dynamics are seldom known, relying solely on mathematical models is insufficient; constructing a simulator that both reproduces real trajectories and supports reward-driven optimization remains an open problem. We introduce a data-driven simulator for multi-animal behavior based on deep reinforcement learning and counterfactual simulation. We address the ill-posed nature of the problem caused by high degrees of freedom in locomotion by estimating movement variables of an incomplete transition model as actions within an RL framework. We also employ a distance-based pseudo-reward to align and compare states between cyber and physical spaces. Validated on artificial agents, flies, newts, and silkmoth, our approach achieves higher reproducibility of species-specific behaviors and improved reward acquisition compared with standard imitation and RL methods. Moreover, it enables counterfactual behavior prediction in novel experimental settings and supports multi-individual modeling for flexible what-if trajectory generation, suggesting its potential to simulate and elucidate complex multi-animal behaviors.
- Abstract(参考訳): 動物運動のシミュレーターは行動を研究する上で貴重な役割を果たす。
ロボット工学における模倣学習の進歩は、人間と動物の運動を再現する可能性を広げている。
生物学における現実的なマルチアニマルシミュレーションの重要な課題は、未知の現実世界の遷移モデルとそのシミュレーションモデルの間のギャップを埋めることである。
運動力学はほとんど知られていないため、数学的モデルにのみ依存することは不十分であり、実際の軌道を再現し、報酬駆動最適化をサポートするシミュレータを構築することは未解決の問題である。
深層強化学習と対実シミュレーションに基づくマルチ動物行動のためのデータ駆動シミュレータを提案する。
RLフレームワーク内の動作として不完全遷移モデルの運動変数を推定することにより、移動の自由度の高さに起因する問題の性質に対処する。
我々はまた、サイバー空間と物理空間の状態を調整し比較するために、距離ベースの擬似逆流を用いる。
提案手法は, 人工エージェント, ハエ, ニワトリ, シルクモスで検証され, 種別行動の再現性が向上し, 標準模倣法やRL法と比較して報酬獲得が向上する。
さらに、新しい実験環境での反事実行動予測を可能にし、フレキシブルなWhat-ifトラジェクトリ生成のための多個人モデリングをサポートし、複雑なマルチアニマルな振る舞いをシミュレートし、解明する可能性を示唆している。
関連論文リスト
- The Sound of Simulation: Learning Multimodal Sim-to-Real Robot Policies with Generative Audio [138.07247714782412]
MultiGenは、大規模な生成モデルを従来の物理シミュレータに統合するフレームワークである。
容器や液体を注ぐ現実世界への効果的なゼロショット転送を実証する。
論文 参考訳(メタデータ) (2025-07-03T17:59:58Z) - Pre-Trained Video Generative Models as World Simulators [59.546627730477454]
本研究では,事前学習した映像生成モデルを制御可能な世界シミュレータに変換するための動的世界シミュレーション(DWS)を提案する。
条件付き動作と生成した視覚的変化の正確なアライメントを実現するために,軽量で普遍的な動作条件付きモジュールを導入する。
実験により、DWSは拡散モデルと自己回帰変換モデルの両方に汎用的に適用可能であることが示された。
論文 参考訳(メタデータ) (2025-02-10T14:49:09Z) - LASIL: Learner-Aware Supervised Imitation Learning For Long-term Microscopic Traffic Simulation [30.500368103677097]
微視的交通シミュレーションは、個々の車両の挙動や交通の流れに関する洞察を提供することによって、輸送工学において重要な役割を担っている。
モデルに依存する従来のシミュレータは、現実の交通環境の複雑さのために正確なシミュレーションを行うことができないことが多い。
本稿では,学習者認識による模倣学習という新しい手法を提案する。
論文 参考訳(メタデータ) (2024-03-26T11:13:35Z) - Learning Quadruped Locomotion Using Differentiable Simulation [31.80380408663424]
微分可能シミュレーションは、高速収束と安定した訓練を約束する。
本研究はこれらの課題を克服するための新しい微分可能シミュレーションフレームワークを提案する。
我々のフレームワークは並列化なしで数分で四足歩行を学習できる。
論文 参考訳(メタデータ) (2024-03-21T22:18:59Z) - Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous
Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。
TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。
我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-10-12T20:49:15Z) - Real-World Humanoid Locomotion with Reinforcement Learning [92.85934954371099]
実世界におけるヒューマノイド移動に対する完全学習型アプローチを提案する。
コントローラーは様々な屋外の地形の上を歩けるし、外乱に対して頑丈で、状況に応じて適応できる。
論文 参考訳(メタデータ) (2023-03-06T18:59:09Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。