論文の概要: Deep reinforcement learning for tracking a moving target in jellyfish-like swimming
- arxiv url: http://arxiv.org/abs/2409.08815v1
- Date: Fri, 13 Sep 2024 13:29:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-16 16:29:18.266553
- Title: Deep reinforcement learning for tracking a moving target in jellyfish-like swimming
- Title(参考訳): クラゲのような水泳における移動目標追跡のための深部強化学習
- Authors: Yihao Chen, Yue Yang,
- Abstract要約: 本研究では,ゼリーフィッシュのようなスイマーを訓練し,運動目標を二次元の流れで追跡する深層強化学習法を開発した。
深層Qネットワーク(DQN)を用いて,スイマーの幾何と動的パラメータを入力とし,スイマーに適用される力である動作を出力する。
- 参考スコア(独自算出の注目度): 16.727471388063893
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We develop a deep reinforcement learning method for training a jellyfish-like swimmer to effectively track a moving target in a two-dimensional flow. This swimmer is a flexible object equipped with a muscle model based on torsional springs. We employ a deep Q-network (DQN) that takes the swimmer's geometry and dynamic parameters as inputs, and outputs actions which are the forces applied to the swimmer. In particular, we introduce an action regulation to mitigate the interference from complex fluid-structure interactions. The goal of these actions is to navigate the swimmer to a target point in the shortest possible time. In the DQN training, the data on the swimmer's motions are obtained from simulations conducted using the immersed boundary method. During tracking a moving target, there is an inherent delay between the application of forces and the corresponding response of the swimmer's body due to hydrodynamic interactions between the shedding vortices and the swimmer's own locomotion. Our tests demonstrate that the swimmer, with the DQN agent and action regulation, is able to dynamically adjust its course based on its instantaneous state. This work extends the application scope of machine learning in controlling flexible objects within fluid environments.
- Abstract(参考訳): 本研究では,2次元流れにおける移動目標を効果的に追跡するために,クラゲのようなスイマーを訓練するための深層強化学習法を開発した。
このスイマーは、ねじりばねに基づく筋肉モデルを備えた柔軟な物体である。
深層Qネットワーク(DQN)を用いて,スイマーの幾何と動的パラメータを入力とし,スイマーに適用される力である動作を出力する。
特に,複雑な流体構造相互作用からの干渉を軽減するための作用規制を導入する。
これらの行動の目標は、スイマーを可能な限り短い時間で目標地点まで移動させることである。
DQNトレーニングでは, 没入境界法を用いて行うシミュレーションにより, スイマーの動きに関するデータを得る。
移動目標を追跡する際には,スイマーの体に対する力の作用とそれに対応する反応の間には,スイマーの自走とスイマーの浮動との流体力学的相互作用により,固有の遅延が生じる。
本試験では, DQN エージェントとアクション・レギュレーションを併用したスイマーが, その即時状態に基づいて動的にコースを調整できることを実証した。
この作業は、流体環境内の柔軟なオブジェクトを制御する機械学習の適用範囲を拡張します。
関連論文リスト
- Optimal-state Dynamics Estimation for Physics-based Human Motion Capture from Videos [6.093379844890164]
オンライン環境での運動学観測に物理モデルを選択的に組み込む新しい手法を提案する。
リカレントニューラルネットワークを導入し、キネマティックス入力とシミュレートされた動作を熱心にバランスするカルマンフィルタを実現する。
提案手法は,物理に基づく人間のポーズ推定作業に優れ,予測力学の物理的妥当性を示す。
論文 参考訳(メタデータ) (2024-10-10T10:24:59Z) - FAFA: Frequency-Aware Flow-Aided Self-Supervision for Underwater Object Pose Estimation [65.01601309903971]
無人水中車両(UUV)の6次元ポーズ推定のための周波数認識フロー支援フレームワークであるFAFAを紹介する。
我々のフレームワークは、3DモデルとRGB画像のみに依存しており、実際のポーズアノテーションや奥行きのような非モダリティデータの必要性を軽減しています。
本研究では,一般的な水中オブジェクトポーズベンチマークにおけるFAFAの有効性を評価し,最先端手法と比較して顕著な性能向上を示した。
論文 参考訳(メタデータ) (2024-09-25T03:54:01Z) - Modular Neural Network Policies for Learning In-Flight Object Catching
with a Robot Hand-Arm System [55.94648383147838]
本稿では,ロボットハンドアームシステムによる飛行物体の捕獲方法の学習を可能にするモジュラーフレームワークを提案する。
本フレームワークは,物体の軌跡予測を学習するオブジェクト状態推定器,(ii)捕捉対象のポーズのスコアとランク付けを学ぶキャッチポーズ品質ネットワーク,(iii)ロボットハンドをキャッチ前ポーズに移動させるように訓練されたリーチ制御ポリシ,(iv)ソフトキャッチ動作を行うように訓練された把握制御ポリシの5つのコアモジュールから構成される。
各モジュールと統合システムのシミュレーションにおいて、我々のフレームワークを広範囲に評価し、飛行における高い成功率を示す。
論文 参考訳(メタデータ) (2023-12-21T16:20:12Z) - Learning to swim efficiently in a nonuniform flow field [0.0]
マイクロスウィマーは、機械的キューを感知することで、周囲の流体に関する情報を取得することができる。
本研究では,スイマーを訓練して特定の水泳課題を遂行するために,局所的および非局所的情報をいかに活用できるかを検討する。
論文 参考訳(メタデータ) (2022-12-22T04:51:47Z) - Fast Aquatic Swimmer Optimization with Differentiable Projective
Dynamics and Neural Network Hydrodynamic Models [23.480913364381664]
水面移動(Aquatic locomotion)は、生物学者や技術者が関心を持つ古典的な流体構造相互作用(FSI)問題である。
本研究では, 変形可能なスイマーの固体構造に対する2次元数値シミュレーションを組み合わせた, FSI に完全微分可能な新しいハイブリッド手法を提案する。
2次元キャランギフォームスイマーにおけるハイブリッドシミュレータの計算効率と微分性を示す。
論文 参考訳(メタデータ) (2022-03-30T15:21:44Z) - Benchmarking Safe Deep Reinforcement Learning in Aquatic Navigation [78.17108227614928]
本研究では,水文ナビゲーションに着目した安全強化学習のためのベンチマーク環境を提案する。
価値に基づく政策段階の深層強化学習(DRL)について考察する。
また,学習したモデルの振る舞いを所望の特性の集合上で検証する検証戦略を提案する。
論文 参考訳(メタデータ) (2021-12-16T16:53:56Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - Learning swimming escape patterns under energy constraints [6.014777261874645]
流れシミュレーションは、天然の幼生スイマーで観察されたものと一致する脱出パターンを特定した。
エネルギー制約下でスイマー脱出パターンを発見するために強化学習を展開する。
論文 参考訳(メタデータ) (2021-05-03T11:58:37Z) - Movement Tracks for the Automatic Detection of Fish Behavior in Videos [63.85815474157357]
水中ビデオでサブルフィッシュ(Anoplopoma fimbria)の発芽行動のデータセットを提供し,その上での深層学習(DL)法による行動検出について検討した。
提案する検出システムは,Long Short-Term Memory(LSTM)ネットワークを用いて,サブルフィッシュの起動動作を識別する。
論文 参考訳(メタデータ) (2020-11-28T05:51:19Z) - Learning to swim in potential flow [17.146927368452598]
本研究では,潜在的流れ環境下での3リンク魚泳の簡単なモデルを提案する。
2つの水泳課題に対して最適な形状変化が得られます。
魚は漂流そのものを直接制御していないが、適度な漂流の存在を生かして目標に達する。
論文 参考訳(メタデータ) (2020-09-30T06:31:27Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。