論文の概要: Reinforcement learning in large, structured action spaces: A simulation
study of decision support for spinal cord injury rehabilitation
- arxiv url: http://arxiv.org/abs/2310.14976v1
- Date: Mon, 23 Oct 2023 14:25:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 19:38:15.650807
- Title: Reinforcement learning in large, structured action spaces: A simulation
study of decision support for spinal cord injury rehabilitation
- Title(参考訳): 大規模構造化行動空間における強化学習:脊髄損傷リハビリテーションにおける意思決定支援のシミュレーション的研究
- Authors: Nathan Phelps, Stephanie Marrocco, Stephanie Cornell, Dalton L. Wolfe,
and Daniel J. Lizotte
- Abstract要約: 強化学習(RL)は、脊髄損傷者(SCI)のリハビリテーションなど、いくつかの応用において意思決定の改善に役立っている。
本稿では、RLエージェントが限られたデータから効果的に学習できるように、グループ化処理の2つのアプローチを提案する。
1つはSCIリハビリテーションのドメイン知識に依存し、もう1つは埋め込み技術を用いて治療の類似性を学ぶ。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Reinforcement learning (RL) has helped improve decision-making in several
applications. However, applying traditional RL is challenging in some
applications, such as rehabilitation of people with a spinal cord injury (SCI).
Among other factors, using RL in this domain is difficult because there are
many possible treatments (i.e., large action space) and few patients (i.e.,
limited training data). Treatments for SCIs have natural groupings, so we
propose two approaches to grouping treatments so that an RL agent can learn
effectively from limited data. One relies on domain knowledge of SCI
rehabilitation and the other learns similarities among treatments using an
embedding technique. We then use Fitted Q Iteration to train an agent that
learns optimal treatments. Through a simulation study designed to reflect the
properties of SCI rehabilitation, we find that both methods can help improve
the treatment decisions of physiotherapists, but the approach based on domain
knowledge offers better performance. Our findings provide a "proof of concept"
that RL can be used to help improve the treatment of those with an SCI and
indicates that continued efforts to gather data and apply RL to this domain are
worthwhile.
- Abstract(参考訳): 強化学習(RL)は、いくつかのアプリケーションにおける意思決定の改善に役立っている。
しかし、伝統的なrlの適用は、脊髄損傷者(sci)のリハビリテーションなど、いくつかの応用において困難である。
その他の要因として、この領域でRLを使用することは、多くの治療(大きな活動空間)と少ない患者(限られた訓練データ)があるため困難である。
SCIに対する治療には自然なグルーピングがあるので、RLエージェントが限られたデータから効果的に学習できるように2つのグルーピング手法を提案する。
1つはSCIリハビリテーションのドメイン知識に依存し、もう1つは埋め込み技術を用いて治療の類似性を学ぶ。
次に、最適治療を学ぶエージェントをトレーニングするためにFitted Q Iterationを使用します。
SCIリハビリテーションの特性を反映したシミュレーション研究を通じて、両手法が理学療法士の治療決定を改善するのに有効であるが、ドメイン知識に基づくアプローチはより良いパフォーマンスをもたらす。
今回の知見は,sci患者に対する治療改善に rl が有効であること,データ収集と rl 適用への継続的な努力が有益であることを示すこと,の「概念の証明」を提供する。
関連論文リスト
- OMG-RL:Offline Model-based Guided Reward Learning for Heparin Treatment [0.4998632546280975]
本研究は,臨床医の意図を反映した報酬関数の開発に焦点をあてる。
限られたデータから専門家の意図を含むパラメータ化された報酬関数を学習する。
このアプローチはヘパリン服薬問題だけでなく、一般のRLベースの薬物服薬タスクにも広く利用することができる。
論文 参考訳(メタデータ) (2024-09-20T07:51:37Z) - Replay across Experiments: A Natural Extension of Off-Policy RL [18.545939667810565]
複数の実験にまたがってリプレイを効果的に拡張するフレームワークを提案する。
コアとなるReplay Across Experiments (RaE)は、以前の実験からの経験を再利用して、探索とブートストラップ学習を改善する。
我々は、多数のRLアルゴリズムにまたがる利点を実証的に示し、移動と操作の両方にまたがる制御領域に挑戦する。
論文 参考訳(メタデータ) (2023-11-27T15:57:11Z) - Deep Offline Reinforcement Learning for Real-world Treatment
Optimization Applications [3.770564448216192]
オフラインRLトレーニングにおける動作不均衡に対処するための,実践的かつ理論的に基礎的な遷移サンプリング手法を提案する。
糖尿病と敗血症治療最適化のための2つの現実的課題について広範な実験を行った。
本提案手法は, 様々な原則および臨床関連指標を用いて, 期待される健康影響を大幅に改善できることを示す。
論文 参考訳(メタデータ) (2023-02-15T09:30:57Z) - Automated Fidelity Assessment for Strategy Training in Inpatient
Rehabilitation using Natural Language Processing [53.096237570992294]
戦略トレーニング (Strategy Training) とは、脳卒中後の認知障害患者に障害を減らすためのスキルを教える、リハビリテーションのアプローチである。
標準化された忠実度評価は治療原則の遵守度を測定するために用いられる。
本研究では,ルールベースNLPアルゴリズム,長短項メモリ(LSTM)モデル,および変換器(BERT)モデルからの双方向エンコーダ表現を開発した。
論文 参考訳(メタデータ) (2022-09-14T15:33:30Z) - Reward Uncertainty for Exploration in Preference-based Reinforcement
Learning [88.34958680436552]
好みに基づく強化学習アルゴリズムを対象とした探索手法を提案する。
我々の基本的な考え方は、学習した報酬に基づいて、斬新さを測定することによって、本質的な報酬を設計することである。
実験により、学習報酬の不確実性からの探索ボーナスは、好みに基づくRLアルゴリズムのフィードバック効率とサンプル効率の両方を改善することが示された。
論文 参考訳(メタデータ) (2022-05-24T23:22:10Z) - A Conservative Q-Learning approach for handling distribution shift in
sepsis treatment strategies [0.0]
どんな介入が最善かについては合意が得られず、異なる患者が同じ治療に対して非常に異なる反応を示す。
深層強化学習法は、医師の行動を反映した治療戦略のための最適なポリシーを考案するために用いられる。
この方針は、集中治療室の診療医が敗血症患者を治療し、生存率を向上させる上でより良い判断を下すのに役立つ可能性がある。
論文 参考訳(メタデータ) (2022-03-25T19:50:18Z) - Auto-FedRL: Federated Hyperparameter Optimization for
Multi-institutional Medical Image Segmentation [48.821062916381685]
Federated Learning(FL)は、明示的なデータ共有を避けながら協調的なモデルトレーニングを可能にする分散機械学習技術である。
本稿では,Auto-FedRLと呼ばれる,効率的な強化学習(RL)に基づくフェデレーションハイパーパラメータ最適化アルゴリズムを提案する。
提案手法の有効性は,CIFAR-10データセットと2つの実世界の医用画像セグメンテーションデータセットの不均一なデータ分割に対して検証される。
論文 参考訳(メタデータ) (2022-03-12T04:11:42Z) - SurRoL: An Open-source Reinforcement Learning Centered and dVRK
Compatible Platform for Surgical Robot Learning [78.76052604441519]
SurRoLは、ダ・ヴィンチ・リサーチキット(dVRK)と互換性のある外科ロボット学習のためのRL中心のシミュレーションプラットフォームである。
プラットフォームには10の学習ベースの外科的タスクが構築されており、実際の自律的な外科的実行に共通している。
シミュレーションにおいてRLアルゴリズムを用いてSurRoLの評価を行い、奥行き分析を行い、実際のdVRKにトレーニングされたポリシーをデプロイし、実世界でより優れた転送性を実現することを示す。
論文 参考訳(メタデータ) (2021-08-30T07:43:47Z) - Sample-Efficient Reinforcement Learning via Counterfactual-Based Data
Augmentation [15.451690870640295]
医療などのいくつかのシナリオでは、通常、各患者に利用可能なレコードはごくわずかであり、現在の強化学習アルゴリズムの適用を妨げる。
構造因果モデル(SCM)を利用して状態ダイナミクスをモデル化する,データ効率の高いRLアルゴリズムを提案する。
本研究は, 軽度条件下では反実結果が識別可能であり, 反実に基づく拡張データセット上のq学習が最適値関数に収束することを示す。
論文 参考訳(メタデータ) (2020-12-16T17:21:13Z) - Review of Machine Learning Algorithms for Brain Stroke Diagnosis and
Prognosis by EEG Analysis [50.591267188664666]
ストローク(Strokes)は、アメリカ合衆国の成人障害の主要な原因である。
脳-コンピュータインタフェース(Brain-Computer Interfaces、BCI)は、患者の神経経路の回復または電子補綴器との効果的なコミュニケーションを支援する。
さまざまな機械学習技術とアルゴリズムをBCI技術と組み合わせることで、脳卒中治療にBCIを使うことは、有望で急速に拡大する分野であることを示している。
論文 参考訳(メタデータ) (2020-08-06T19:50:29Z) - Deep Reinforcement Learning using Cyclical Learning Rates [62.19441737665902]
勾配降下(SGD)に基づく最適化手順における最も影響力のあるパラメータの1つは、学習率である。
循環学習について検討し,様々なDRL問題に対する一般循環学習率の定義法を提案する。
本実験により, 循環学習は, 高度に調整された固定学習率よりも, 類似あるいは良好な結果が得られることがわかった。
論文 参考訳(メタデータ) (2020-07-31T10:06:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。