論文の概要: Dyadic Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2308.07843v2
- Date: Sun, 27 Aug 2023 02:13:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-29 20:57:44.633688
- Title: Dyadic Reinforcement Learning
- Title(参考訳): dyadic 強化学習
- Authors: Shuangning Li, Lluis Salvat Niell, Sung Won Choi, Inbal Nahum-Shani,
Guy Shani, Susan Murphy
- Abstract要約: モバイルヘルスは、日々の生活について個人に介入を提供することによって、健康効果を高めることを目的としている。
Dyadic RLは、コンテキスト要因と過去の応答に基づいて介入配信をパーソナライズするために設計されたオンライン強化学習アルゴリズムである。
本研究は,モバイル健康調査で収集したデータから構築した,おもちゃのシナリオと現実的なテストベッドの両方に関するシミュレーション研究を通じて,ダイアディッドRLの実証性能を実証する。
- 参考スコア(独自算出の注目度): 7.528761100894881
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mobile health aims to enhance health outcomes by delivering interventions to
individuals as they go about their daily life. The involvement of care partners
and social support networks often proves crucial in helping individuals
managing burdensome medical conditions. This presents opportunities in mobile
health to design interventions that target the dyadic relationship -- the
relationship between a target person and their care partner -- with the aim of
enhancing social support. In this paper, we develop dyadic RL, an online
reinforcement learning algorithm designed to personalize intervention delivery
based on contextual factors and past responses of a target person and their
care partner. Here, multiple sets of interventions impact the dyad across
multiple time intervals. The developed dyadic RL is Bayesian and hierarchical.
We formally introduce the problem setup, develop dyadic RL and establish a
regret bound. We demonstrate dyadic RL's empirical performance through
simulation studies on both toy scenarios and on a realistic test bed
constructed from data collected in a mobile health study.
- Abstract(参考訳): モバイルヘルスは、個人の日常生活に介入することで、健康上の成果を高めることを目的としている。
ケアパートナーやソーシャルサポートネットワークの関与は、個人が負担の多い医療状況を管理するのに不可欠である。
これは、社会的支援を強化することを目的として、ダイアド関係(対象者とケアパートナーの関係)をターゲットにした介入をデザインする機会を提供する。
本稿では,対象者とその介護パートナーの状況的要因と過去の対応に基づいて,介入配信をパーソナライズするオンライン強化学習アルゴリズムであるdyadic rlを開発した。
ここで、複数の介入セットは、複数の時間間隔にわたってdyadに影響を与える。
開発されたダイド RL はベイズ的かつ階層的である。
問題設定を正式に導入し, Dyadic RLを開発し, 後悔の束縛を確立する。
本研究は,モバイル健康調査で収集したデータから構築した,おもちゃのシナリオと現実的なテストベッドのシミュレーション研究を通じて,ダイアディッドRLの実証性能を実証する。
関連論文リスト
- Graph-Augmented LLMs for Personalized Health Insights: A Case Study in Sleep Analysis [2.303486126296845]
大規模言語モデル(LLM)は、インタラクティブなヘルスアドバイスを提供する上で、有望であることを示している。
Retrieval-Augmented Generation (RAG) やファインチューニングのような従来の手法は、複雑で多次元で時間的に関係のあるデータを完全に活用できないことが多い。
本稿では,健康意識のパーソナライズと明確性を高めるために,グラフ拡張LDMフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-24T01:22:54Z) - A Toolbox for Surfacing Health Equity Harms and Biases in Large Language Models [20.11590976578911]
大規模言語モデル(LLM)は、複雑な健康情報のニーズを満たすことを約束すると同時に、健康格差を悪化させる可能性がある。
エクイティ関連モデル失敗の信頼性評価は、ヘルスエクイティを促進するシステムを開発するための重要なステップである。
医学的問題に対するLLMによる長期的回答において、株式関連害を生じさせる可能性のあるバイアスを克服するためのリソースと方法論を提示する。
論文 参考訳(メタデータ) (2024-03-18T17:56:37Z) - Defining Effective Engagement For Enhancing Cancer Patients' Well-being with Mobile Digital Behavior Change Interventions [0.25296764467138544]
デジタル行動変化介入(DBCI)は、新しい健康行動の開発を支援している。
本研究は, がん患者の生活の質を高めるために, がん患者に対するDBCIの効果的な関与を定義することを目的とする。
論文 参考訳(メタデータ) (2024-03-18T17:43:40Z) - Large Language Model-based Human-Agent Collaboration for Complex Task
Solving [94.3914058341565]
複雑なタスク解決のためのLarge Language Models(LLM)に基づくヒューマンエージェントコラボレーションの問題を紹介する。
Reinforcement Learning-based Human-Agent Collaboration method, ReHACを提案する。
このアプローチには、タスク解決プロセスにおける人間の介入の最も急進的な段階を決定するために設計されたポリシーモデルが含まれている。
論文 参考訳(メタデータ) (2024-02-20T11:03:36Z) - Agent-Based Model: Simulating a Virus Expansion Based on the Acceptance
of Containment Measures [65.62256987706128]
比較疫学モデルは、疾患の状態に基づいて個人を分類する。
我々は、適応されたSEIRDモデルと市民のための意思決定モデルを組み合わせたABMアーキテクチャを提案する。
スペイン・ア・コルナにおけるSARS-CoV-2感染症の進行状況について検討した。
論文 参考訳(メタデータ) (2023-07-28T08:01:05Z) - A Self-supervised Framework for Improved Data-Driven Monitoring of
Stress via Multi-modal Passive Sensing [7.084068935028644]
ストレス応答の生理的前駆体を追跡するための多モード半教師付きフレームワークを提案する。
本手法は,ウェアラブルデバイスと異なる領域と解像度のマルチモーダルデータの利用を可能にする。
実世界のデータのコーパスを用いて、知覚的ストレスに関するトレーニング実験を行う。
論文 参考訳(メタデータ) (2023-03-24T20:34:46Z) - pH-RL: A personalization architecture to bring reinforcement learning to
health practice [6.587485396428361]
本論文では、RLを健康に導くためのパーソナライゼーションのための一般的なRLアーキテクチャであるpH-RLを提案する。
オープンソースのRLアーキテクチャを実装し、メンタルヘルスのためのMoodBusterモバイルアプリケーションに統合します。
実験結果から, 開発方針は, わずか数日のデータを連続的に利用して適切な行動を選択できることが示唆された。
論文 参考訳(メタデータ) (2021-03-29T19:38:04Z) - FLOP: Federated Learning on Medical Datasets using Partial Networks [84.54663831520853]
新型コロナウイルスの感染拡大で医療資源が不足している。
新型コロナウイルスの診断を緩和するために、さまざまなデータ駆動型ディープラーニングモデルが開発されている。
患者のプライバシー上の懸念から、データそのものはまだ乏しい。
我々は、textbfPartial Networks (FLOP) を用いた、シンプルで効果的な textbfFederated textbfL textbfon Medical データセットを提案する。
論文 参考訳(メタデータ) (2021-02-10T01:56:58Z) - MET: Multimodal Perception of Engagement for Telehealth [52.54282887530756]
ビデオから人間のエンゲージメントレベルを知覚する学習ベースアルゴリズムMETを提案する。
我々はメンタルヘルス患者のエンゲージメント検出のための新しいデータセットMEDICAをリリースした。
論文 参考訳(メタデータ) (2020-11-17T15:18:38Z) - BiteNet: Bidirectional Temporal Encoder Network to Predict Medical
Outcomes [53.163089893876645]
本稿では,患者の医療旅行におけるコンテキスト依存と時間的関係を捉える,新たな自己注意機構を提案する。
エンド・ツー・エンドの双方向時間エンコーダネットワーク(BiteNet)が患者の旅路の表現を学習する。
実世界のEHRデータセットを用いた2つの教師付き予測と2つの教師なしクラスタリングタスクにおける手法の有効性を評価した。
論文 参考訳(メタデータ) (2020-09-24T00:42:36Z) - Effectiveness and Compliance to Social Distancing During COVID-19 [72.94965109944707]
われわれは、米国内での新型コロナウイルスの感染拡大に対する在宅勤務注文の影響を評価するために、詳細なモビリティデータを用いている。
一方向性グランガー因果性(一方向性グランガー因果性)は、家庭で毎日過ごす時間の割合の中央値から、2週間の遅れを伴うCOVID-19関連死亡件数の日数までである。
論文 参考訳(メタデータ) (2020-06-23T03:36:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。