論文の概要: Hierarchical Reinforcement Learning Framework for Adaptive Walking Control Using General Value Functions of Lower-Limb Sensor Signals
- arxiv url: http://arxiv.org/abs/2507.16983v1
- Date: Tue, 22 Jul 2025 19:47:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-24 22:33:14.753767
- Title: Hierarchical Reinforcement Learning Framework for Adaptive Walking Control Using General Value Functions of Lower-Limb Sensor Signals
- Title(参考訳): 下肢センサ信号の一般値関数を用いた適応歩行制御のための階層的強化学習フレームワーク
- Authors: Sonny T. Jones, Grange M. Simpson, Patrick M. Pilarski, Ashley N. Dalrymple,
- Abstract要約: 階層強化学習を用いて,低域外骨格に対する適応制御戦略を開発する。
提案手法は,エクソスケルトン制御適応の複雑なタスクを,地形戦略適応のための高レベルフレームワークと予測情報を提供する低レベルフレームワークに分解する。
本研究では,実際のセンサ信号と予測センサ信号を政策ネットワークに組み込むことにより,制御システムの意思決定能力を向上させることを目的とした2つの手法について検討した。
- 参考スコア(独自算出の注目度): 0.40498500266986387
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rehabilitation technology is a natural setting to study the shared learning and decision-making of human and machine agents. In this work, we explore the use of Hierarchical Reinforcement Learning (HRL) to develop adaptive control strategies for lower-limb exoskeletons, aiming to enhance mobility and autonomy for individuals with motor impairments. Inspired by prominent models of biological sensorimotor processing, our investigated HRL approach breaks down the complex task of exoskeleton control adaptation into a higher-level framework for terrain strategy adaptation and a lower-level framework for providing predictive information; this latter element is implemented via the continual learning of general value functions (GVFs). GVFs generated temporal abstractions of future signal values from multiple wearable lower-limb sensors, including electromyography, pressure insoles, and goniometers. We investigated two methods for incorporating actual and predicted sensor signals into a policy network with the intent to improve the decision-making capacity of the control system of a lower-limb exoskeleton during ambulation across varied terrains. As a key result, we found that the addition of predictions made from GVFs increased overall network accuracy. Terrain-specific performance increases were seen while walking on even ground, uneven ground, up and down ramps, and turns, terrains that are often misclassified without predictive information. This suggests that predictive information can aid decision-making during uncertainty, e.g., on terrains that have a high chance of being misclassified. This work, therefore, contributes new insights into the nuances of HRL and the future development of exoskeletons to facilitate safe transitioning and traversing across different walking environments.
- Abstract(参考訳): リハビリテーション技術は、人間と機械エージェントの共有学習と意思決定を研究するための自然な環境である。
本研究では、階層強化学習(HRL)を用いて下肢外骨格の適応制御戦略を開発し、運動障害のある個人に対するモビリティと自律性を高めることを目的とした。
生体感覚運動処理の顕著なモデルから着想を得たHRL法では,外骨格制御適応の複雑なタスクを,地形戦略適応のための高レベルフレームワークと予測情報提供のための低レベルフレームワークに分解し,一般値関数(GVF)の連続学習を通じて実装した。
GVFは、筋電図、圧力インソール、ゴニメーターを含む複数のウェアラブル下肢センサーから、将来的な信号値の時間的抽象化を生成した。
各種地形におけるアンブレーションにおける下肢外骨格の制御系の決定能力を向上させることを目的として,実際のセンサ信号と予測センサ信号を政策ネットワークに組み込む2つの方法を検討した。
その結果,GVFによる予測の追加によりネットワーク全体の精度が向上することが判明した。
地形固有の性能は、たとえ地面、不均一な地面、上下の斜面を歩いたとしても増加しており、予測情報なしでしばしば分類されていない地形も見られる。
これは、予測情報が不確実性中の意思決定に役立つことを示唆している。
この研究は、HRLのニュアンスに対する新たな洞察と、様々な歩行環境の安全な移動と移動を促進するための外骨格の開発に寄与する。
関連論文リスト
- Detection Transformers Under the Knife: A Neuroscience-Inspired Approach to Ablations [5.5967570276373655]
我々は3つの最先端検出トランスモデルにおけるキーコンポーネントの破壊の影響を系統的に分析する。
我々は,これらの改善がパフォーマンス指標gIoUとF1スコアに与える影響を評価する。
本研究は, モデル性能に対する内部成分の寄与を明らかにすることにより, DETRのXAIを推し進める。
論文 参考訳(メタデータ) (2025-07-29T12:00:08Z) - Deep Learning for Motion Classification in Ankle Exoskeletons Using Surface EMG and IMU Signals [0.8388591755871735]
足関節外骨格は、移動性を高め、転倒リスクを減らす可能性に対してかなりの関心を集めている。
本稿では、3つの慣性計測ユニット(IMU)と8つの表面筋電図センサ(sEMG)を統合する新しい動き予測フレームワークを提案する。
その結果、畳み込みニューラルネットワーク(CNN)は5つの動作タスクのデータセット上でLSTM(Long Short-Term Memory)ネットワークをわずかに上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-25T10:51:40Z) - Freezing of Gait Detection Using Gramian Angular Fields and Federated Learning from Wearable Sensors [6.369424231505372]
歩行凍結(英: Freezing of Gait、FOG)はパーキンソン病の症状である。
本稿では,単一センサのみを用いた実世界展開型FOG検出システムFOGSenseを提案する。
論文 参考訳(メタデータ) (2024-11-18T17:43:43Z) - Generative Principal Component Regression via Variational Inference [2.4415762506639944]
適切な操作を設計するための1つのアプローチは、予測モデルの重要な特徴をターゲットとすることである。
我々は,そのような情報を潜在空間で表現する,教師付き変分オートエンコーダ(SVAE)に基づく新しい目的を開発する。
シミュレーションでは,gPCRは通常のPCRやSVAEと比較して,操作時のターゲット選択を劇的に改善することを示した。
論文 参考訳(メタデータ) (2024-09-03T22:38:55Z) - Variable-Agnostic Causal Exploration for Reinforcement Learning [56.52768265734155]
強化学習のための新しいフレームワークVACERL(Variable-Agnostic Causal Exploration for Reinforcement Learning)を導入する。
本手法は,注目機構を用いて,重要変数に関連する重要な観測行動ステップを自動的に同定する。
これらのステップを接続する因果グラフを構築し、エージェントをタスク完了に対する因果的影響の大きい観察-作用ペアへと導く。
論文 参考訳(メタデータ) (2024-07-17T09:45:27Z) - DRED: Zero-Shot Transfer in Reinforcement Learning via Data-Regularised Environment Design [11.922951794283168]
本研究では,RLエージェントのゼロショット一般化能力(ZSG)に,個々の環境インスタンスやレベルのサンプリングがどう影響するかを検討する。
基本層を共有する深いアクター・クリティカルなアーキテクチャでは, エージェントの内部表現と, 生成したトレーニングデータのトレーニングレベルとの相互情報を最小限に抑える。
既存のUED手法は,ZSG性能の低いトレーニング分布を著しくシフトできることがわかった。
オーバーフィッティングと分散シフトの両面を防止するため,データ正規化環境設計(D)を導入する。
論文 参考訳(メタデータ) (2024-02-05T19:47:45Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - A Neural Active Inference Model of Perceptual-Motor Learning [62.39667564455059]
アクティブ推論フレームワーク(英: active inference framework、AIF)は、現代の神経科学を基盤とした、有望な新しい計算フレームワークである。
本研究では,ヒトの視覚行動指導において,AIFが期待する役割を捉える能力をテストする。
本稿では,多次元世界状態から自由エネルギーの一次元分布にマッピングする先行関数の新たな定式化について述べる。
論文 参考訳(メタデータ) (2022-11-16T20:00:38Z) - DMAP: a Distributed Morphological Attention Policy for Learning to
Locomote with a Changing Body [126.52031472297413]
本稿では,生物学的に着想を得たポリシーネットワークアーキテクチャであるDMAPを紹介する。
主観的状態に基づく制御ポリシは,高度に可変な身体構成では不十分であることを示す。
DMAPは、すべての考慮された環境において、全体的な一致またはオラクルエージェントのパフォーマンスを超越して、エンドツーエンドで訓練することができる。
論文 参考訳(メタデータ) (2022-09-28T16:45:35Z) - Adaptation through prediction: multisensory active inference torque
control [0.0]
本稿では,産業用アームのための多感能動型トルクコントローラを提案する。
私たちのコントローラは、予測的脳仮説にインスパイアされ、現在のアクティブな推論アプローチの能力を向上します。
論文 参考訳(メタデータ) (2021-12-13T16:03:18Z) - Cycle and Semantic Consistent Adversarial Domain Adaptation for Reducing
Simulation-to-Real Domain Shift in LiDAR Bird's Eye View [110.83289076967895]
ドメイン適応プロセス中に関心のある小さなオブジェクトの情報を保存するために,事前の意味分類を用いたサイクガンに基づくbevドメイン適応法を提案する。
生成したBEVの品質は,KITTI 3D Object Detection Benchmarkの最先端3Dオブジェクト検出フレームワークを用いて評価されている。
論文 参考訳(メタデータ) (2021-04-22T12:47:37Z) - Guided Variational Autoencoder for Disentanglement Learning [79.02010588207416]
本稿では,潜在表現非絡み合い学習を行うことで,制御可能な生成モデルを学習できるアルゴリズム,Guided-VAEを提案する。
我々は、ガイド-VAEにおける教師なし戦略と教師なし戦略を設計し、バニラVAE上でのモデリングと制御能力の強化を観察する。
論文 参考訳(メタデータ) (2020-04-02T20:49:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。