Fugu-MT 論文翻訳(概要): Reward Design For An Online Reinforcement Learning Algorithm Supporting Oral Self-Care

論文の概要: Reward Design For An Online Reinforcement Learning Algorithm Supporting Oral Self-Care

arxiv url: http://arxiv.org/abs/2208.07406v1
Date: Mon, 15 Aug 2022 18:47:09 GMT
ステータス: 翻訳完了
システム内更新日: 2022-08-17 12:06:04.255425
Title: Reward Design For An Online Reinforcement Learning Algorithm Supporting Oral Self-Care
Title（参考訳）: 口腔セルフケアを支援するオンライン強化学習アルゴリズムに対する報酬設計
Authors: Anna L. Trella, Kelly W. Zhang, Inbal Nahum-Shani, Vivek Shetty, Finale Doshi-Velez, Susan A. Murphy
Abstract要約: 歯科疾患は、主に予防可能であるにもかかわらず、最も一般的な慢性疾患の1つである。我々は,移動型プロンプトの配信を最適化し,口腔衛生行動を促進するために,オンライン強化学習(RL)アルゴリズムを開発した。この論文で論じられたRLアルゴリズムは、口腔衛生実践における患者のエンゲージメントを高める行動戦略を提供する口腔セルフケアアプリであるOralyticsにデプロイされる。
参考スコア（独自算出の注目度）: 24.283342018185028
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Dental disease is one of the most common chronic diseases despite being largely preventable. However, professional advice on optimal oral hygiene practices is often forgotten or abandoned by patients. Therefore patients may benefit from timely and personalized encouragement to engage in oral self-care behaviors. In this paper, we develop an online reinforcement learning (RL) algorithm for use in optimizing the delivery of mobile-based prompts to encourage oral hygiene behaviors. One of the main challenges in developing such an algorithm is ensuring that the algorithm considers the impact of the current action on the effectiveness of future actions (i.e., delayed effects), especially when the algorithm has been made simple in order to run stably and autonomously in a constrained, real-world setting (i.e., highly noisy, sparse data). We address this challenge by designing a quality reward which maximizes the desired health outcome (i.e., high-quality brushing) while minimizing user burden. We also highlight a procedure for optimizing the hyperparameters of the reward by building a simulation environment test bed and evaluating candidates using the test bed. The RL algorithm discussed in this paper will be deployed in Oralytics, an oral self-care app that provides behavioral strategies to boost patient engagement in oral hygiene practices.
Abstract（参考訳）: 歯科疾患は、主に予防可能であるにもかかわらず、最も一般的な慢性疾患の1つである。しかし、最適な口腔衛生に関する専門的なアドバイスはしばしば患者によって忘れられるか放棄される。したがって、患者は、タイムリーでパーソナライズされたセルフケア行動への奨励の恩恵を受けることができる。本稿では,移動型プロンプトの配信を最適化し,口腔衛生行動を促進するためのオンライン強化学習(RL)アルゴリズムを開発する。このようなアルゴリズムを開発する上での大きな課題の1つは、アルゴリズムが将来のアクション(すなわち遅延効果)の有効性に対する現在のアクションの影響を考慮することを保証することである。ユーザの負担を最小限に抑えつつ、所望の健康効果(すなわち、高品質なブラッシング)を最大化する品質報酬を設計することで、この問題に対処する。また,シミュレーション環境テストベッドの構築と,テストベッドを用いた候補評価により,報酬の過度パラメータを最適化する手法を強調した。この論文で論じられたRLアルゴリズムは、口腔衛生実践における患者のエンゲージメントを高める行動戦略を提供する口腔セルフケアアプリであるOralyticsにデプロイされる。

関連論文リスト

Random-Key Algorithms for Optimizing Integrated Operating Room Scheduling [0.16385815610837165]
本研究では,RKO(Random-Key)の概念を紹介する。文献最適化問題には、マルチルームスケジューリング、機器スケジューリング、複雑な可用性制約が組み込まれている。 RKOアプローチは、連続空間の点として解を表し、デコーダとして知られる決定論的関数を介して問題解空間に写像される。
論文参考訳（メタデータ） (2025-01-17T15:11:30Z)
A Deployed Online Reinforcement Learning Algorithm In An Oral Health Clinical Trial [20.944037982124037]
歯科疾患は、実質的な財政的負担、個人的苦痛、全身疾患のリスクの増加を伴う慢性疾患である。毎日2回歯磨きを推奨しているにもかかわらず、忘れやすさや解離などの要因により、推奨された口腔セルフケア行動への固執は依然として最適ではない。歯科疾患のリスクを負う医療従事者の予防ケアを補完する医療介入システムOralyticsを開発した。
論文参考訳（メタデータ） (2024-09-03T17:16:01Z)
Oralytics Reinforcement Learning Algorithm [5.54328512723076]
歯科疾患はアメリカ合衆国で最も一般的な慢性疾患の1つである。パーソナライズされた介入プロンプトのデリバリを最適化し,口腔セルフケア(OSCB)を改善するオンライン強化学習(RL)アルゴリズムであるOralyticsを開発した。最終RLアルゴリズムは、2023年秋から2024年夏にかけて行われたOralytics臨床試験で展開された。
論文参考訳（メタデータ） (2024-06-19T00:44:11Z)
Monitoring Fidelity of Online Reinforcement Learning Algorithms in Clinical Trials [20.944037982124037]
本稿では,オンラインRLアルゴリズムを臨床試験に導入するための重要な要件として,アルゴリズムの忠実性を提案する。我々は,アルゴリズム開発者や臨床研究者がアルゴリズムの忠実性を確保するのに役立つ,事前デプロイ計画とリアルタイムモニタリングのためのフレームワークを提案する。
論文参考訳（メタデータ） (2024-02-26T20:19:14Z)
REBEL: Reward Regularization-Based Approach for Robotic Reinforcement Learning from Human Feedback [61.54791065013767]
報酬関数と人間の嗜好の相違は、現実世界で破滅的な結果をもたらす可能性がある。近年の手法は、人間の嗜好から報酬関数を学習することで、不適応を緩和することを目的としている。本稿では,ロボットRLHFフレームワークにおける報酬正規化の新たな概念を提案する。
論文参考訳（メタデータ） (2023-12-22T04:56:37Z)
Policy Optimization for Personalized Interventions in Behavioral Health [8.10897203067601]
デジタルプラットフォームを通じて提供される行動的健康介入は、健康結果を大幅に改善する可能性がある。患者に対するパーソナライズされた介入を最適化して長期的効果を最大化する問題について検討した。患者システムの状態空間を個別のレベルに分解するDecompPIをダブする新しい手法を提案する。
論文参考訳（メタデータ） (2023-03-21T21:42:03Z)
Automated Fidelity Assessment for Strategy Training in Inpatient Rehabilitation using Natural Language Processing [53.096237570992294]
戦略トレーニング (Strategy Training) とは、脳卒中後の認知障害患者に障害を減らすためのスキルを教える、リハビリテーションのアプローチである。標準化された忠実度評価は治療原則の遵守度を測定するために用いられる。本研究では,ルールベースNLPアルゴリズム,長短項メモリ(LSTM)モデル,および変換器(BERT)モデルからの双方向エンコーダ表現を開発した。
論文参考訳（メタデータ） (2022-09-14T15:33:30Z)
Adaptive Identification of Populations with Treatment Benefit in Clinical Trials: Machine Learning Challenges and Solutions [78.31410227443102]
確定的臨床試験において,特定の治療の恩恵を受ける患者サブポピュレーションを適応的に同定する問題について検討した。サブポピュレーション構築のためのメタアルゴリズムであるAdaGGIとAdaGCPIを提案する。
論文参考訳（メタデータ） (2022-08-11T14:27:49Z)
Adherence Forecasting for Guided Internet-Delivered Cognitive Behavioral Therapy: A Minimally Data-Sensitive Approach [59.535699822923]
インターネット提供型心理的治療(IDPT)は、メンタルヘルスのアクセシビリティを向上させるための効果的でスケーラブルな経路であると考えられている。本研究は,最小限の敏感なログイン/ログアウトデータに依存しながら,自動アドバンス予測を行うディープラーニングアプローチを提案する。提案されたセルフアテンションネットワークは、治療期間の1/3が経過した時点で、平均的バランスの正確さを70%以上達成した。
論文参考訳（メタデータ） (2022-01-11T13:55:57Z)
Personalized Rehabilitation Robotics based on Online Learning Control [62.6606062732021]
本稿では,各ユーザに対して実行時の制御力をパーソナライズ可能な,新しいオンライン学習制御アーキテクチャを提案する。提案手法を,学習コントローラがパーソナライズされた制御を提供するとともに,安全な相互作用力も得られる実験ユーザスタディで評価した。
論文参考訳（メタデータ） (2021-10-01T15:28:44Z)
Persistent Reinforcement Learning via Subgoal Curricula [114.83989499740193]
VaPRL(Value-accelerated Persistent Reinforcement Learning)は、初期状態のカリキュラムを生成する。 VaPRLは、エピソード強化学習と比較して、3桁の精度で必要な介入を減らす。
論文参考訳（メタデータ） (2021-07-27T16:39:45Z)
Resource Planning for Hospitals Under Special Consideration of the COVID-19 Pandemic: Optimization and Sensitivity Analysis [87.31348761201716]
新型コロナウイルス(covid-19)パンデミックのような危機は、医療機関にとって深刻な課題となる。 BaBSim.Hospitalは離散イベントシミュレーションに基づく容量計画ツールである。 BaBSim.Hospitalを改善するためにこれらのパラメータを調査し最適化することを目指しています。
論文参考訳（メタデータ） (2021-05-16T12:38:35Z)
Streamlined Empirical Bayes Fitting of Linear Mixed Models in Mobile Health [3.8974425658660596]
身体活動を増加させるために設計されたモバイルヘルス(mHealth)アプリケーションは、ユーザのモチベーションを高めるためにコンテキスト的に関連性のある提案をする必要がある。そこで本稿では,ユーザに対して,コンテキスト化された,パーソナライズされた身体活動提案を提供するアルゴリズムを提案する。技術アプローチの精度は, それぞれ99%, 56%に向上した。
論文参考訳（メタデータ） (2020-03-28T19:57:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。