論文の概要: Characterization of Human Balance through a Reinforcement Learning-based
Muscle Controller
- arxiv url: http://arxiv.org/abs/2308.04462v1
- Date: Tue, 8 Aug 2023 01:53:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-10 16:39:02.525763
- Title: Characterization of Human Balance through a Reinforcement Learning-based
Muscle Controller
- Title(参考訳): 強化学習型筋制御器による人的バランスのキャラクタリゼーション
- Authors: K\"ubra Akba\c{s}, Carlotta Mummolo, Xianlian Zhou
- Abstract要約: 身体リハビリテーション中のバランスアセスメントは、しばしば患者の身体能力を評価するためにルーリック指向のバッテリーテストに依存し、主観性につながる。
本研究は, 重心状態空間(COM)の利用について検討し, ヒトのバランス能力を監視するための有望な道を示す。
- 参考スコア(独自算出の注目度): 1.5469452301122177
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Balance assessment during physical rehabilitation often relies on
rubric-oriented battery tests to score a patient's physical capabilities,
leading to subjectivity. While some objective balance assessments exist, they
are often limited to tracking the center of pressure (COP), which does not
fully capture the whole-body postural stability. This study explores the use of
the center of mass (COM) state space and presents a promising avenue for
monitoring the balance capabilities in humans. We employ a musculoskeletal
model integrated with a balance controller, trained through reinforcement
learning (RL), to investigate balancing capabilities. The RL framework consists
of two interconnected neural networks governing balance recovery and muscle
coordination respectively, trained using Proximal Policy Optimization (PPO)
with reference state initialization, early termination, and multiple training
strategies. By exploring recovery from random initial COM states (position and
velocity) space for a trained controller, we obtain the final BR enclosing
successful balance recovery trajectories. Comparing the BRs with analytical
postural stability limits from a linear inverted pendulum model, we observe a
similar trend in successful COM states but more limited ranges in the
recoverable areas. We further investigate the effect of muscle weakness and
neural excitation delay on the BRs, revealing reduced balancing capability in
different regions. Overall, our approach of learning muscular balance
controllers presents a promising new method for establishing balance recovery
limits and objectively assessing balance capability in bipedal systems,
particularly in humans.
- Abstract(参考訳): 身体リハビリテーション中のバランスアセスメントは、しばしば患者の身体能力を評価するためにルーリック指向のバッテリーテストに依存し、主観性につながる。
いくつかの客観的バランス評価は存在するが、身体全体の姿勢安定性を完全に把握しない圧力中心(COP)の追跡に限られることが多い。
本研究は, 重心状態空間(COM)の利用について検討し, ヒトのバランス能力を監視するための有望な道を示す。
我々は、バランスコントローラと統合された筋骨格モデルを用いて、強化学習(RL)を通して訓練し、バランス機能を調べる。
RLフレームワークは、それぞれバランス回復と筋肉調整を管理する2つの相互接続ニューラルネットワークで構成され、PPO(Proximal Policy Optimization)を使用してトレーニングされ、参照状態の初期化、早期終了、複数のトレーニング戦略が提供されている。
トレーニングされたコントローラに対するランダムな初期COM状態(位置と速度)空間からの回復を探索することにより、バランス回復軌道を囲む最終BRを得る。
線形逆振り子モデルによる解析的姿勢安定性限界と比較すると, COM状態は同様の傾向を示すが, 回復可能な領域はより限定的である。
さらに,brsに対する筋力低下と神経興奮遅延の影響について検討し,異なる領域におけるバランス能力の低下を明らかにした。
全体として, 筋力バランス制御系を学習するアプローチは, バランス回復限界の確立と2足歩行系, 特にヒトにおけるバランス能力の客観的評価に有望な新しい方法を提案する。
関連論文リスト
- Learning Control Policies of Hodgkin-Huxley Neuronal Dynamics [1.629803445577911]
ニューラルネットワークを用いてオフラインで値関数を近似し、フィードバックフォームを介してリアルタイムで制御(刺激)を生成する。
数値実験では, 分布外サンプルに対するアプローチの精度と, 系の緩やかな衝撃や乱れに対する頑健さが示されている。
論文 参考訳(メタデータ) (2023-11-13T18:53:50Z) - Scalable kernel balancing weights in a nationwide observational study of
hospital profit status and heart attack outcomes [1.9950682531209158]
我々は、再現されたカーネルヒルベルト空間の基底展開と最先端凸最適化技術を統合する重み付けへのスケーラブルで柔軟なアプローチについて述べる。
具体的には、ランク制限されたNystr"om法を用いて、ほぼ線形時間と空間のバランスをとるためのカーネル基底を効率的に計算し、乗算器の特殊一階交互方向法を用いて最適な重みを求める。
我々はまた、この重み付け手法を用いて、127万人の患者の総合的データセットにおいて、病院の利益状況と心臓発作結果との関係を全国的に調査する。
論文 参考訳(メタデータ) (2023-11-01T15:08:52Z) - Balance, Imbalance, and Rebalance: Understanding Robust Overfitting from
a Minimax Game Perspective [80.51463286812314]
敵対的訓練(AT)はおそらく、頑健な特徴を抽出するための最先端のアルゴリズムである。
ATは、特に学習率(LR)が崩壊した後、深刻な強固な過適合問題に悩まされる。
我々は, LR崩壊が, より強い記憶能力でトレーナーに力を与えることにより, ミニマックスゲーム間のバランスを損なうことを示す。
論文 参考訳(メタデータ) (2023-10-30T09:00:11Z) - A Population-Level Analysis of Neural Dynamics in Robust Legged Robots [6.107812768939554]
頑健なロボット移動制御器の集団レベル活動について検討する。
脆弱な制御器は不安定な方向の固定点の数が多いため,立位を指示した場合のバランスが低下することがわかった。
再帰状態のダイナミクスが歩行中に構造され、低次元であることの証拠は、霊長類の研究と一致している。
論文 参考訳(メタデータ) (2023-06-27T20:41:59Z) - Towards AI-controlled FES-restoration of arm movements: Controlling for
progressive muscular fatigue with Gaussian state-space models [6.320141734801679]
強化学習(Reinforcement Learning, RL)は、異なる設定でカスタマイズされた制御ルールを管理するための有望なアプローチである。
しかし、FES系をRLに制御する上で残る課題は、保存不能な筋肉疲労である。
本稿では, 筋疲労問題に対処し, RLコントローラの制御性能を向上する手法を提案する。
論文 参考訳(メタデータ) (2023-01-10T14:51:55Z) - Automated Fidelity Assessment for Strategy Training in Inpatient
Rehabilitation using Natural Language Processing [53.096237570992294]
戦略トレーニング (Strategy Training) とは、脳卒中後の認知障害患者に障害を減らすためのスキルを教える、リハビリテーションのアプローチである。
標準化された忠実度評価は治療原則の遵守度を測定するために用いられる。
本研究では,ルールベースNLPアルゴリズム,長短項メモリ(LSTM)モデル,および変換器(BERT)モデルからの双方向エンコーダ表現を開発した。
論文 参考訳(メタデータ) (2022-09-14T15:33:30Z) - Minimizing Control for Credit Assignment with Strong Feedback [65.59995261310529]
ディープニューラルネットワークにおける勾配に基づくクレジット割り当ての現在の手法は、無限小のフィードバック信号を必要とする。
我々は、神経活動に対する強いフィードバックと勾配に基づく学習を組み合わせることで、ニューラルネットワークの最適化に関する新たな視点を自然に導き出すことを示す。
DFCにおける強いフィードバックを用いることで、空間と時間において完全に局所的な学習規則を用いることで、前向きとフィードバックの接続を同時に学習できることを示す。
論文 参考訳(メタデータ) (2022-04-14T22:06:21Z) - Towards Balanced Learning for Instance Recognition [149.76724446376977]
本稿では,インスタンス認識のためのバランス学習のためのフレームワークであるLibra R-CNNを提案する。
IoUバランスのサンプリング、バランスの取れた特徴ピラミッド、客観的再重み付けをそれぞれ統合し、サンプル、特徴、客観的レベルの不均衡を低減します。
論文 参考訳(メタデータ) (2021-08-23T13:40:45Z) - Persistent Reinforcement Learning via Subgoal Curricula [114.83989499740193]
VaPRL(Value-accelerated Persistent Reinforcement Learning)は、初期状態のカリキュラムを生成する。
VaPRLは、エピソード強化学習と比較して、3桁の精度で必要な介入を減らす。
論文 参考訳(メタデータ) (2021-07-27T16:39:45Z) - Equilibrium Propagation with Continual Weight Updates [69.87491240509485]
時間によるバックプロパゲーション(BPTT)と密接に一致する勾配を計算し、機械学習と神経科学を橋渡しする学習アルゴリズムを提案する。
理論的には、学習速度が十分に小さい場合、第2相の各段階において、BPTTが与える損失の勾配に従ってニューロンとシナプスのダイナミクスが従うことを証明している。
これらの結果からEPは,後方伝播との親密な関係を維持しつつ,ハードウェアの制約に順応し,生物学に一歩近づいた。
論文 参考訳(メタデータ) (2020-04-29T14:54:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。