論文の概要: Controlling Fish Schools via Reinforcement Learning of Virtual Fish Movement
- arxiv url: http://arxiv.org/abs/2603.16384v1
- Date: Tue, 17 Mar 2026 11:12:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.238793
- Title: Controlling Fish Schools via Reinforcement Learning of Virtual Fish Movement
- Title(参考訳): 仮想魚運動の強化学習による魚学校制御
- Authors: Yusuke Nishii, Hiroaki Kawashima,
- Abstract要約: 本研究では,強化学習で訓練した仮想魚を用いて,魚学校を指導し,管理する方法について検討した。
画面上に表示される2D仮想魚を用いて、物理的ロボットエージェントに固有の耐久性や運動制限といった技術的課題を克服する。
- 参考スコア(独自算出の注目度): 2.5782420501870296
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study investigates a method to guide and control fish schools using virtual fish trained with reinforcement learning. We utilize 2D virtual fish displayed on a screen to overcome technical challenges such as durability and movement constraints inherent in physical robotic agents. To address the lack of detailed behavioral models for real fish, we adopt a model-free reinforcement learning approach. First, simulation results show that reinforcement learning can acquire effective movement policies even when simulated real fish frequently ignore the virtual stimulus. Second, real-world experiments with live fish confirm that the learned policy successfully guides fish schools toward specified target directions. Statistical analysis reveals that the proposed method significantly outperforms baseline conditions, including the absence of stimulus and a heuristic "stay-at-edge" strategy. This study provides an early demonstration of how reinforcement learning can be used to influence collective animal behavior through artificial agents.
- Abstract(参考訳): 本研究では,強化学習で訓練した仮想魚を用いて,魚学校を指導し,管理する方法について検討した。
画面上に表示される2D仮想魚を用いて、物理的ロボットエージェントに固有の耐久性や運動制限といった技術的課題を克服する。
実魚の詳細な行動モデルが欠如していることに対処するため,モデルフリー強化学習アプローチを採用する。
まず, シミュレーションの結果から, 実魚の仮想刺激を頻繁に無視しても, 強化学習は効果的な運動方針を得られることが示された。
第2に,実生魚を用いた実環境実験により,学習方針が魚学校を特定の目標方向に導くことに成功していることを確認した。
統計的分析の結果,提案手法は刺激の欠如やヒューリスティックな「ステイ・アット・エッジ」戦略など,ベースライン条件を著しく上回ることがわかった。
本研究は, 強化学習が人工エージェントによる集団動物行動に与える影響を, 早期に示すものである。
関連論文リスト
- Rethinking Camera Choice: An Empirical Study on Fisheye Camera Properties in Robotic Manipulation [53.27191803311681]
我々は,手首に装着した魚眼カメラの特性を模倣学習のために厳密に分析した。
魚眼で訓練された政策は、十分な環境多様性で訓練された場合、優れた場面の一般化を解放する。
本研究は,ロボット学習における魚眼データセットの大規模収集と有効活用のための具体的かつ実用的なガイダンスを提供する。
論文 参考訳(メタデータ) (2026-03-02T18:00:37Z) - From Seeing to Experiencing: Scaling Navigation Foundation Models with Reinforcement Learning [59.88543114325153]
本稿では,航法基礎モデルの強化学習能力を高めるためのSeeing-to-Experiencingフレームワークを提案する。
S2Eは、ビデオの事前トレーニングとRLによるポストトレーニングの長所を組み合わせたものだ。
実世界のシーンを3DGSで再現した3D画像に基づく総合的なエンドツーエンド評価ベンチマークであるNavBench-GSを構築した。
論文 参考訳(メタデータ) (2025-07-29T17:26:10Z) - CBIL: Collective Behavior Imitation Learning for Fish from Real Videos [58.81930297206828]
魚の学習行動を直接ビデオから学習するためのスケーラブルなアプローチCBIL(Collective Behavior Imitation Learning)を提案する。
MVAEは2次元の観察を、模倣学習段階に従うためにコンパクトで表現力のある暗黙の状態に効果的にマッピングする。
CBILは、学習された集合的な動きの前の様々なアニメーションタスクに使用することができる。
論文 参考訳(メタデータ) (2025-03-31T21:15:00Z) - Modular Neural Network Policies for Learning In-Flight Object Catching
with a Robot Hand-Arm System [55.94648383147838]
本稿では,ロボットハンドアームシステムによる飛行物体の捕獲方法の学習を可能にするモジュラーフレームワークを提案する。
本フレームワークは,物体の軌跡予測を学習するオブジェクト状態推定器,(ii)捕捉対象のポーズのスコアとランク付けを学ぶキャッチポーズ品質ネットワーク,(iii)ロボットハンドをキャッチ前ポーズに移動させるように訓練されたリーチ制御ポリシ,(iv)ソフトキャッチ動作を行うように訓練された把握制御ポリシの5つのコアモジュールから構成される。
各モジュールと統合システムのシミュレーションにおいて、我々のフレームワークを広範囲に評価し、飛行における高い成功率を示す。
論文 参考訳(メタデータ) (2023-12-21T16:20:12Z) - How to Track and Segment Fish without Human Annotations: A Self-Supervised Deep Learning Approach [3.0516727053033392]
魚の追跡とセグメンテーションのためのディープニューラルネットワーク(DNN)のトレーニングには、高品質なラベルが必要である。
本研究では,映像データの空間的・時間的変動に依存する教師なしの手法を提案する。
本フレームワークは,(1) フレーム間の空間的・時間的整合性を利用して擬似ラベルを生成する光学フローモデル,(2) 擬似ラベルを漸進的に洗練する自己教師型モデル,(3) 分割ネットワークの3段階からなる。
論文 参考訳(メタデータ) (2022-08-23T01:01:27Z) - Applications of Deep Learning in Fish Habitat Monitoring: A Tutorial and
Survey [1.9249287163937976]
ディープラーニング(DL)は最先端のAI技術であり、ビジュアルデータを分析する上で前例のないパフォーマンスを示している。
本稿では,DLの重要な概念を網羅するチュートリアルを紹介し,DLの動作に関する高レベルな理解を支援する。
チュートリアルではまた、水中魚のモニタリングのような挑戦的な応用のために、DLアルゴリズムをどのように開発すべきかをステップバイステップで説明する。
論文 参考訳(メタデータ) (2022-06-11T01:59:54Z) - A Survey of Fish Tracking Techniques Based on Computer Vision [11.994865945394139]
本稿では,過去7年間の魚類追跡技術の進歩を概観する。
基本的位置決めと追跡方法に重点を置き、多様な魚の追跡手法を探求する。
また、オープンソースのデータセット、評価指標、課題、魚の追跡研究への応用についても要約している。
論文 参考訳(メタデータ) (2021-10-06T07:46:35Z) - Visual Adversarial Imitation Learning using Variational Models [60.69745540036375]
逆関数仕様は、深い強化学習を通しての学習行動にとって大きな障害であり続けている。
望ましい行動の視覚的なデモンストレーションは、エージェントを教えるためのより簡単で自然な方法を示すことが多い。
変動モデルに基づく対向的模倣学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-07-16T00:15:18Z) - Movement Tracks for the Automatic Detection of Fish Behavior in Videos [63.85815474157357]
水中ビデオでサブルフィッシュ(Anoplopoma fimbria)の発芽行動のデータセットを提供し,その上での深層学習(DL)法による行動検出について検討した。
提案する検出システムは,Long Short-Term Memory(LSTM)ネットワークを用いて,サブルフィッシュの起動動作を識別する。
論文 参考訳(メタデータ) (2020-11-28T05:51:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。