論文の概要: Visualizing Latent Phase Structures in Locomotion Policies: A Multi-Environment Study with Temporal Feature Extension
- arxiv url: http://arxiv.org/abs/2605.28186v1
- Date: Wed, 27 May 2026 09:09:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.919577
- Title: Visualizing Latent Phase Structures in Locomotion Policies: A Multi-Environment Study with Temporal Feature Extension
- Title(参考訳): 移動政策の潜在位相構造を可視化する:時間的特徴拡張を用いたマルチ環境研究
- Authors: Daisuke Yasui, Toshitaka Matuki, Hiroshi Sato,
- Abstract要約: 移動制御ポリシによって生成された軌道から潜在運動位相構造を明らかにするためのフレームワークを提案する。
提案手法を3つの環境に適用し,より明確で規則的な遷移規則を持つ相構造を同定した。
- 参考スコア(独自算出の注目度): 7.647276696906605
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep reinforcement learning (DRL) has been shown to achieve high performance on locomotion control tasks in MuJoCo benchmarks such as HalfCheetah, Ant, and Walker2D. However, visualizing the motion structures internally obtained by a trained policy function implemented as a deep neural network remains challenging. It is known from biomechanics and related fields that locomotion control is realized through the repetition of motion phases such as the stance phase and swing phase. In this study, we propose a framework for uncovering latent motion phase structures from trajectories generated by locomotion control policies through interaction with the environment. The proposed method extends the clustering features from state observations alone to augmented features including actions, next states, and next actions, and introduces a method for determining the number of clusters that suppresses self-transitions. Applying the proposed method to three environments -- Ant-v5, HalfCheetah-v5, and Walker2D-v5 -- we successfully identified phase structures with clearer and more regular transition rules than those obtained by the existing method.
- Abstract(参考訳): 深部強化学習(DRL)は、HalfCheetah、Ant、Walker2DといったMuJoCoベンチマークにおいて、移動制御タスクにおいて高い性能を達成することが示されている。
しかし、深層ニューラルネットワークとして実装された訓練されたポリシー関数によって内部的に得られる運動構造を可視化することは依然として困難である。
生体力学や関連分野から、運動制御は姿勢相や揺動相などの運動相の繰り返しを通じて実現されることが知られている。
本研究では,環境との相互作用を通じて移動制御ポリシによって生成された軌道から潜時運動位相構造を明らかにするための枠組みを提案する。
提案手法は, クラスタリングの特徴を, 状態観察のみから, 行動, 次状態, 次動作を含む拡張特徴へと拡張し, 自己遷移を抑制するクラスタ数を決定する手法を提案する。
提案手法をAnt-v5,HalfCheetah-v5,Walker2D-v5の3つの環境に適用し,既存の手法よりも明瞭で規則的な遷移規則を持つ相構造を同定した。
関連論文リスト
- SpaAct: Spatially-Activated Transition Learning with Curriculum Adaptation for Vision-Language Navigation [40.318940817058746]
Vision-and-Language Navigation (VLN)は、インボディードエージェントが自然言語の指示に従い、目に見えない3D環境のターゲット場所へナビゲートできるようにすることを目的としている。
我々は、VLMをVLNに適応させるには、そのような認識を得るための2つの補完的な能力を与える必要があると論じている。
本稿では,VLMにおける動的空間認識を活性化するトレーニングフレームワークであるSpaActを提案する。
論文 参考訳(メタデータ) (2026-04-30T09:09:40Z) - Uncovering Latent Phase Structures and Branching Logic in Locomotion Policies: A Case Study on HalfCheetah [7.647276696906605]
移動制御タスクでは、Deep Reinforcement Learningは高いパフォーマンスを示した。
しかし、学習方針の決定過程は依然としてブラックボックスであり、人間が理解することが困難である。
この研究は、移動制御のために訓練されたポリシーは、人間によって解釈される相構造を表わすかもしれないという仮説を立てた。
論文 参考訳(メタデータ) (2026-03-18T08:12:40Z) - FLD: Fourier Latent Dynamics for Structured Motion Representation and
Learning [19.491968038335944]
本研究では,周期的・準周期的な動きの時空間関係を抽出する自己教師付き構造表現生成手法を提案する。
我々の研究は、一般的な動き表現と学習アルゴリズムの今後の進歩への新たな可能性を開く。
論文 参考訳(メタデータ) (2024-02-21T13:59:21Z) - Motion In-Betweening with Phase Manifolds [29.673541655825332]
本稿では,周期的オートエンコーダによって学習された位相変数を利用して,文字のターゲットポーズに到達するための,新たなデータ駆動型動作制御システムを提案する。
提案手法では,経験的ニューラルネットワークモデルを用いて,空間と時間の両方のクラスタの動きを,異なる専門家の重みで解析する。
論文 参考訳(メタデータ) (2023-08-24T12:56:39Z) - Interactive Character Control with Auto-Regressive Motion Diffusion Models [18.727066177880708]
リアルタイム動作合成のためのA-MDM(Auto-Regressive Motion Diffusion Model)を提案する。
我々の条件拡散モデルは初期ポーズを入力とし、前者のフレームに条件付けられた連続した動きフレームを自動回帰的に生成する。
本稿では,タスク指向サンプリング,インペインティング,階層的強化学習など,対話型制御をA-MDMに組み込む一連の手法を紹介する。
論文 参考訳(メタデータ) (2023-06-01T07:48:34Z) - Modeling Continuous Motion for 3D Point Cloud Object Tracking [54.48716096286417]
本稿では,各トラックレットを連続ストリームとみなす新しいアプローチを提案する。
各タイムスタンプでは、現在のフレームだけがネットワークに送られ、メモリバンクに格納された複数フレームの履歴機能と相互作用する。
頑健な追跡のためのマルチフレーム機能の利用性を高めるために,コントラッシブシーケンス強化戦略を提案する。
論文 参考訳(メタデータ) (2023-03-14T02:58:27Z) - Weakly-supervised Action Transition Learning for Stochastic Human Motion
Prediction [81.94175022575966]
動作駆動型人間の動作予測の課題について紹介する。
一連の動作ラベルと短い動作履歴から、複数の可算な将来の動作を予測することを目的としている。
論文 参考訳(メタデータ) (2022-05-31T08:38:07Z) - VAE-Loco: Versatile Quadruped Locomotion by Learning a Disentangled Gait
Representation [78.92147339883137]
本研究では,特定の歩行を構成する主要姿勢位相を捕捉する潜在空間を学習することにより,制御器のロバスト性を高めることが重要であることを示す。
本研究では,ドライブ信号マップの特定の特性が,歩幅,歩幅,立位などの歩行パラメータに直接関係していることを示す。
生成モデルを使用することで、障害の検出と緩和が容易になり、汎用的で堅牢な計画フレームワークを提供する。
論文 参考訳(メタデータ) (2022-05-02T19:49:53Z) - Decentralized Motion Planning for Multi-Robot Navigation using Deep
Reinforcement Learning [0.41998444721319217]
本研究は、深層強化学習を用いたマルチロボットナビゲーションの課題に対処するための分散型モーションプランニングフレームワークを提案する。
共通かつ共有的な政策学習による分散的な行動計画の概念が採用され、このアプローチの堅牢なトレーニングとテストが可能となった。
論文 参考訳(メタデータ) (2020-11-11T07:35:21Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。