Fugu-MT 論文翻訳(概要): Reinforcement Learning in Modern Biostatistics: Constructing Optimal Adaptive Interventions

論文の概要: Reinforcement Learning in Modern Biostatistics: Constructing Optimal Adaptive Interventions

arxiv url: http://arxiv.org/abs/2203.02605v1
Date: Fri, 4 Mar 2022 23:14:02 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-10 09:31:52.811849
Title: Reinforcement Learning in Modern Biostatistics: Constructing Optimal Adaptive Interventions
Title（参考訳）: 現代統計学における強化学習 : 最適適応的介入の構築
Authors: Nina Deliu, Joseph Jay Williams and Bibhas Chakraborty
Abstract要約: 我々は、RL、因果推論、AIの領域を横断するユニークなフレームワークの下で、RLに寄与し、利益をもたらす可能性のあるさまざまなドメインを橋渡しすることを目指している。モバイルヘルス(mHealth)における動的治療体制(DTR)とジャスト・イン・タイム適応的介入(mHealth)の両方を包含する、AI構築のためのRL手法に関する初の統一的な指導的調査を行った。
参考スコア（独自算出の注目度）: 7.94548720704463
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Reinforcement learning (RL) is acquiring a key role in the space of adaptive interventions (AIs), attracting a substantial interest within methodological and theoretical literature and becoming increasingly popular within health sciences. Despite potential benefits, its application in real life is still limited due to several operational and statistical challenges--in addition to ethical and cost issues among others--that remain open in part due to poor communication and synergy between methodological and applied scientists. In this work, we aim to bridge the different domains that contribute to and may benefit from RL, under a unique framework that intersects the areas of RL, causal inference, and AIs, among others. We provide the first unified instructive survey on RL methods for building AIs, encompassing both dynamic treatment regimes (DTRs) and just-in-time adaptive interventions in mobile health (mHealth). We outline similarities and differences between the two areas, and discuss their implications for using RL. We combine our relevant methodological knowledge with motivating studies in both DTRs and mHealth to illustrate the tremendous collaboration opportunities between statistical, RL, and healthcare researchers in the space of AIs.
Abstract（参考訳）: 強化学習 (Reinforcement Learning, RL) は適応的介入 (Adaptive interventions, AIs) の分野において重要な役割を担い、方法論的・理論的文献にかなりの関心を惹きつけ、健康科学で人気を増している。潜在的な利益にもかかわらず、実生活におけるその応用は、倫理的、コスト的な問題に加えて、いくつかの運用上の課題と統計上の課題により、依然として制限されている。本研究では、RL、因果推論、AIといった分野を横断するユニークなフレームワークの下で、RLに寄与し、利益をもたらす可能性のあるさまざまなドメインを橋渡しすることを目的とする。モバイルヘルス(mHealth)における動的治療体制(DTR)とジャスト・イン・タイム適応的介入(mHealth)の両方を包含する、AI構築のためのRL手法に関する初の統一的な指導的調査を行った。両領域の類似点と相違点を概説し,RLの意義について論じる。我々は、関連する方法論知識と、DTRとmHealthの両方でのモチベーション研究を組み合わせることで、AIの分野における統計学、RL、医療研究者の膨大な協力機会を説明する。

関連論文リスト

NEARL-CLIP: Interacted Query Adaptation with Orthogonal Regularization for Medical Vision-Language Understanding [51.63264715941068]
textbfNEARL-CLIP (iunderlineNteracted quunderlineEry underlineAdaptation with ounderlineRthogonaunderlineL regularization)は、VLMベースの新しい相互モダリティ相互作用フレームワークである。
論文参考訳（メタデータ） (2025-08-06T05:44:01Z)
Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.721265428780946]
医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。本稿は、この新興分野に関する最初の体系的なレビューを提供する。本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文参考訳（メタデータ） (2025-08-01T14:41:31Z)
Enhancing Adaptive Behavioral Interventions with LLM Inference from Participant-Described States [9.395236804312496]
我々は、潜在状態変数を条件としたテキストベースの状態記述を生成する、新しい身体活動介入シミュレーション環境を開発する。提案手法は,オンライン政策学習手法の性能を大幅に向上させる可能性が示唆された。
論文参考訳（メタデータ） (2025-07-05T02:52:51Z)
Towards Next-Generation Medical Agent: How o1 is Reshaping Decision-Making in Medical Scenarios [46.729092855387165]
本稿では,医療用AIエージェントのバックボーンLSMの選択について検討する。我々の研究結果は、o1の診断精度と一貫性を高める能力を示し、よりスマートでより応答性の高いAIツールへの道を開いた。
論文参考訳（メタデータ） (2024-11-16T18:19:53Z)
Artificial intelligence techniques in inherited retinal diseases: A review [19.107474958408847]
遺伝性網膜疾患(英: InheritedRetinal disease、IRD)は、進行性視力低下を引き起こす多様な遺伝性疾患群であり、労働年齢層の視覚障害の主要な原因である。人工知能(AI)の最近の進歩は、これらの課題に対する有望な解決策を提供する。このレビューは既存の研究を統合し、ギャップを特定し、IRDの診断と管理におけるAIの可能性の概要を提供する。
論文参考訳（メタデータ） (2024-10-10T03:14:51Z)
Generative AI for Deep Reinforcement Learning: Framework, Analysis, and Use Cases [60.30995339585003]
深部強化学習(DRL)は様々な分野に広く適用されており、優れた成果を上げている。 DRLは、サンプル効率の低下や一般化の低さなど、いくつかの制限に直面している。本稿では、これらの問題に対処し、DRLアルゴリズムの性能を向上させるために、生成AI(GAI)を活用する方法について述べる。
論文参考訳（メタデータ） (2024-05-31T01:25:40Z)
Taxonomy Adaptive Cross-Domain Adaptation in Medical Imaging via Optimization Trajectory Distillation [73.83178465971552]
自動医用画像解析の成功は、大規模かつ専門家による注釈付きトレーニングセットに依存する。非教師なしドメイン適応(UDA)はラベル付きデータ収集の負担を軽減するための有望なアプローチである。本稿では,2つの技術的課題に新しい視点から対処する統一的手法である最適化トラジェクトリ蒸留を提案する。
論文参考訳（メタデータ） (2023-07-27T08:58:05Z)
A Meta-Learning Method for Estimation of Causal Excursion Effects to Assess Time-Varying Moderation [0.0]
本稿では,メタ・ラーナーの観点からの因果抽出効果の推定について再検討する。提案する推定器の特性を理論的および広範囲なシミュレーションにより比較する。その結果, 相対効率が向上し, 既存手法の2倍頑健な代替案が提案された。
論文参考訳（メタデータ） (2023-06-28T15:19:33Z)
Who Goes First? Influences of Human-AI Workflow on Decision Making in Clinical Imaging [24.911186503082465]
本研究は, 放射線医学における診断セッション開始時と, 放射線科医の仮決定後のAI支援の効果について検討した。その結果、AI推論をレビューする前に仮回答を登録するよう求められている参加者は、アドバイスが正確かどうかに関わらず、AIに同意する確率が低く、AIと意見の相違がある場合には、同僚の第二の意見を求める確率が低いことがわかった。
論文参考訳（メタデータ） (2022-05-19T16:59:25Z)
SurvITE: Learning Heterogeneous Treatment Effects from Time-to-Event Data [83.50281440043241]
時系列データから不均一な処理効果を推定する問題について検討する。本稿では,バランス表現に基づく治療特異的ハザード推定のための新しいディープラーニング手法を提案する。
論文参考訳（メタデータ） (2021-10-26T20:13:17Z)
Artificial Intelligence for IT Operations (AIOPS) Workshop White Paper [50.25428141435537]
AIOps(Artificial Intelligence for IT Operations)は、マシンラーニング、ビッグデータ、ストリーミング分析、IT運用管理の交差点で発生する、新たな学際分野である。 AIOPSワークショップの主な目的は、アカデミアと産業界の両方の研究者が集まり、この分野での経験、成果、作業について発表することです。
論文参考訳（メタデータ） (2021-01-15T10:43:10Z)
Adversarial Sample Enhanced Domain Adaptation: A Case Study on Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。逆生成したサンプルはドメイン適応時に使用される。その結果,本手法の有効性とタスクの一般性が確認された。
論文参考訳（メタデータ） (2021-01-13T03:20:20Z)
Sample-Efficient Reinforcement Learning via Counterfactual-Based Data Augmentation [15.451690870640295]
医療などのいくつかのシナリオでは、通常、各患者に利用可能なレコードはごくわずかであり、現在の強化学習アルゴリズムの適用を妨げる。構造因果モデル(SCM)を利用して状態ダイナミクスをモデル化する,データ効率の高いRLアルゴリズムを提案する。本研究は, 軽度条件下では反実結果が識別可能であり, 反実に基づく拡張データセット上のq学習が最適値関数に収束することを示す。
論文参考訳（メタデータ） (2020-12-16T17:21:13Z)
A unified survey of treatment effect heterogeneity modeling and uplift modeling [24.803992990503186]
近年,個々人の異なる特徴に基づいて不均一な治療効果を推定する必要性が高まっている。ニーズを満たすため、異なるコミュニティの研究者や実践者がアルゴリズムを開発した。我々は、潜在的な結果フレームワークの下で、これら2つの非連結であるように見えるが、密接に関連するアプローチを統一的に調査する。
論文参考訳（メタデータ） (2020-07-14T02:16:02Z)
A Survey on Causal Inference [64.45536158710014]
因果推論は統計学、コンピュータ科学、教育、公共政策、経済学など、多くの分野において重要な研究トピックである。観測データに対する様々な因果効果推定法が誕生した。
論文参考訳（メタデータ） (2020-02-05T21:35:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。