論文の概要: A Personalized Exercise Assistant using Reinforcement Learning (PEARL): Results from a four-arm Randomized-controlled Trial
- arxiv url: http://arxiv.org/abs/2508.10060v1
- Date: Tue, 12 Aug 2025 22:44:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-15 22:24:48.061295
- Title: A Personalized Exercise Assistant using Reinforcement Learning (PEARL): Results from a four-arm Randomized-controlled Trial
- Title(参考訳): 強化学習(PEARL)を用いたパーソナライズされた運動支援:4腕ランダム化制御試験の結果
- Authors: Amy Armento Lee, Narayan Hegde, Nina Deliu, Emily Rosenzweig, Arun Suggala, Sriram Lakshminarasimhan, Qian He, John Hernandez, Martin Seneviratne, Rahul Singh, Pradnesh Kalkar, Karthikeyan Shanmugam, Aravindan Raghuveer, Abhimanyu Singh, My Nguyen, James Taylor, Jatin Alla, Sofia S. Villar, Hulya Emir-Farinas,
- Abstract要約: 一貫性のある身体的不活性は、世界的な健康問題を引き起こす。
モバイルの健康介入は、スケーラブルでパーソナライズされた身体活動の促進に有望な道を提供する。
PEARLの研究は、Fitbitアプリを通じてコンテンツとタイミングPAをパーソナライズする強化学習(RL)アルゴリズムを評価するための、最初の大規模で4本腕のランダム化試験だった。
- 参考スコア(独自算出の注目度): 16.56538000607739
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Consistent physical inactivity poses a major global health challenge. Mobile health (mHealth) interventions, particularly Just-in-Time Adaptive Interventions (JITAIs), offer a promising avenue for scalable, personalized physical activity (PA) promotion. However, developing and evaluating such interventions at scale, while integrating robust behavioral science, presents methodological hurdles. The PEARL study was the first large-scale, four-arm randomized controlled trial to assess a reinforcement learning (RL) algorithm, informed by health behavior change theory, to personalize the content and timing of PA nudges via a Fitbit app. We enrolled and randomized 13,463 Fitbit users into four study arms: control, random, fixed, and RL. The control arm received no nudges. The other three arms received nudges from a bank of 155 nudges based on behavioral science principles. The random arm received nudges selected at random. The fixed arm received nudges based on a pre-set logic from survey responses about PA barriers. The RL group received nudges selected by an adaptive RL algorithm. We included 7,711 participants in primary analyses (mean age 42.1, 86.3% female, baseline steps 5,618.2). We observed an increase in PA for the RL group compared to all other groups from baseline to 1 and 2 months. The RL group had significantly increased average daily step count at 1 month compared to all other groups: control (+296 steps, p=0.0002), random (+218 steps, p=0.005), and fixed (+238 steps, p=0.002). At 2 months, the RL group sustained a significant increase compared to the control group (+210 steps, p=0.0122). Generalized estimating equation models also revealed a sustained increase in daily steps in the RL group vs. control (+208 steps, p=0.002). These findings demonstrate the potential of a scalable, behaviorally-informed RL approach to personalize digital health interventions for PA.
- Abstract(参考訳): 一貫性のある身体的不活性は、世界的な健康問題を引き起こす。
モバイルヘルス(mHealth)の介入、特にJust-in-Time Adaptive Interventions(JITAIs)は、スケーラブルでパーソナライズされた身体活動(PA)促進のための有望な道を提供する。
しかしながら、このような介入を大規模に開発・評価する一方で、堅牢な行動科学を統合することで、方法論的なハードルが提示される。
PEARL研究は、健康行動変化理論によって伝達される強化学習(RL)アルゴリズムを評価し、Fitbitアプリを通じてPANudgeの内容とタイミングをパーソナライズする、最初の大規模、4本腕ランダム化試験である。
私たちは13,463人のFitbitユーザーを、コントロール、ランダム、固定、およびRLという4つの研究アームに登録した。
コントロールアームはナッジを受け取らなかった。
残りの3つの武器は行動科学の原則に基づく155個のナッジの銀行からナッジを受け取っていた。
ランダムアームはランダムに選択されたナッジを受け取りました。
固定アームは、PAバリアに関するサーベイ応答から事前に設定されたロジックに基づいてヌッジを受け取りました。
RL群は適応RLアルゴリズムにより選択されたヌッジを受信した。
主分析対象は7,711名(平均年齢42.1,女性86.3%,ベースラインステップ5,618.2)であった。
RL群のPAは, ベースラインから1, 2カ月までの他のすべての群と比較して増加した。
RL群は,コントロール群(+296ステップ,p=0.0002),ランダム群(+218ステップ,p=0.005),固定群(+238ステップ,p=0.002)と比較して,平均日歩数1カ月で有意に増加した。
2カ月間, RL群は対照群(+210段, p=0.0122)に比べて有意に増加した。
また,RL群とコントロール群(+208段,p=0.002)では,日歩の持続的な増加が認められた。
これらの結果は、PAのためのデジタルヘルス介入をパーソナライズするためのスケーラブルで行動インフォームドなRLアプローチの可能性を示している。
関連論文リスト
- A novel language model for predicting serious adverse event results in clinical trials from their prospective registrations [8.134674449860668]
臨床治験における重症事象 (SAE) の予測法について, 登録情報のみを用いて検討した。
臨床Trials.govの2腕平行介入臨床試験を22,107回行った。
論文 参考訳(メタデータ) (2025-07-21T07:56:06Z) - When Imitation Learning Outperforms Reinforcement Learning in Surgical Action Planning [38.040478801450774]
今回,CholecT50の手術行動計画において,ILとRLの総合的な比較を行った。
DARILベースラインは、34.6%のアクショントリプレット認識mAPと33.6%の次フレーム予測mAPを達成し、10秒水平線で29.2%のスムーズな計画劣化を実現した。
分析の結果,有意なRLポリシーよりも,専門家アノテートされたテストセット上での分布マッチングがILを体系的に好んでいることが明らかとなった。
論文 参考訳(メタデータ) (2025-07-07T13:49:57Z) - Iterative Nash Policy Optimization: Aligning LLMs with General Preferences via No-Regret Learning [55.65738319966385]
我々は、新しいオンラインアルゴリズム、反復的ナッシュポリシー最適化(INPO)を提案する。
従来の方法とは異なり、INPOは個々の応答に対する期待される勝利率を推定する必要性を回避している。
LLaMA-3-8BベースのSFTモデルで、INPOはAlpacaEval 2.0で42.6%、Arena-Hardで37.8%の勝利率を達成した。
論文 参考訳(メタデータ) (2024-06-30T08:00:34Z) - Nurse-in-the-Loop Artificial Intelligence for Precision Management of
Type 2 Diabetes in a Clinical Trial Utilizing Transfer-Learned Predictive
Digital Twin [5.521385406191426]
本研究は, 予測ディジタルツイン(PDT)を利用したオンラインナース・イン・ザ・ループ予測制御(ONLC)モデルを開発した。
PDTは、最初の3ヶ月から参加者の自己モニタリングデータ(体重、食物ログ、身体活動、グルコース)をトレーニングした。
ONLCは介入グループに個別のフィードバックとテキストメッセージによるレコメンデーションを提供した。
論文 参考訳(メタデータ) (2024-01-05T06:38:50Z) - Automatically measuring speech fluency in people with aphasia: first
achievements using read-speech data [55.84746218227712]
本研究の目的は,言語習得の分野で開発された信号処理algorithmの関連性を評価することである。
論文 参考訳(メタデータ) (2023-08-09T07:51:40Z) - Learnable Behavior Control: Breaking Atari Human World Records via
Sample-Efficient Behavior Selection [56.87650511573298]
本稿では,LBC(Learable Behavioral Control)と呼ばれるフレームワークを提案する。
我々のエージェントは10077.52%の平均正規化スコアを達成し、1Bのトレーニングフレーム内で24人の世界記録を突破した。
論文 参考訳(メタデータ) (2023-05-09T08:00:23Z) - Predicting Individualized Effects of Internet-Based Treatment for
Genito-Pelvic Pain/Penetration Disorder: Development and Internal Validation
of a Multivariable Decision Tree Model [0.0]
Genito-Pelvic Pain/Penetration-Disorderは一般的な疾患であるが、日常治療ではほとんど治療されない。
非応答性は、すべての最先端治療に共通である。
インターネットによる介入により、どの患者グループが最も恩恵を受けると期待されているかは不明だ。
論文 参考訳(メタデータ) (2023-03-15T16:16:16Z) - Statistical and Computational Phase Transitions in Group Testing [73.55361918807883]
本研究の目的は、希少な疾患を患っているk人の集団を同定することである。
個々人のテストを割り当てるための2つの異なる単純なランダムな手順を考える。
論文 参考訳(メタデータ) (2022-06-15T16:38:50Z) - Noisy Adaptive Group Testing using Bayesian Sequential Experimental
Design [63.48989885374238]
病気の感染頻度が低い場合、Dorfman氏は80年前に、人のテストグループは個人でテストするよりも効率が良いことを示した。
本研究の目的は,ノイズの多い環境で動作可能な新しいグループテストアルゴリズムを提案することである。
論文 参考訳(メタデータ) (2020-04-26T23:41:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。