論文の概要: Off-Policy Selection for Initiating Human-Centric Experimental Design
- arxiv url: http://arxiv.org/abs/2410.20017v1
- Date: Sat, 26 Oct 2024 00:17:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:15:34.567802
- Title: Off-Policy Selection for Initiating Human-Centric Experimental Design
- Title(参考訳): 人中心実験設計開始のためのオフポリティ選択
- Authors: Ge Gao, Xi Yang, Qitong Gao, Song Ju, Miroslav Pajic, Min Chi,
- Abstract要約: オフライン選択(OPS)は、オフラインで評価し、オンラインインタラクションなしでポリシーを選択することで、ループを閉じるための重要な手段である。
我々の研究は、人間中心のシステムにおいて重要な課題を解決することに集中している。
そこで我々はFPS(First-Glance Off-Policy Selection)を提案する。
- 参考スコア(独自算出の注目度): 26.71458673646448
- License:
- Abstract: In human-centric tasks such as healthcare and education, the heterogeneity among patients and students necessitates personalized treatments and instructional interventions. While reinforcement learning (RL) has been utilized in those tasks, off-policy selection (OPS) is pivotal to close the loop by offline evaluating and selecting policies without online interactions, yet current OPS methods often overlook the heterogeneity among participants. Our work is centered on resolving a pivotal challenge in human-centric systems (HCSs): how to select a policy to deploy when a new participant joining the cohort, without having access to any prior offline data collected over the participant? We introduce First-Glance Off-Policy Selection (FPS), a novel approach that systematically addresses participant heterogeneity through sub-group segmentation and tailored OPS criteria to each sub-group. By grouping individuals with similar traits, FPS facilitates personalized policy selection aligned with unique characteristics of each participant or group of participants. FPS is evaluated via two important but challenging applications, intelligent tutoring systems and a healthcare application for sepsis treatment and intervention. FPS presents significant advancement in enhancing learning outcomes of students and in-hospital care outcomes.
- Abstract(参考訳): 医療や教育のような人間中心のタスクでは、患者と学生の不均一性はパーソナライズされた治療と教育介入を必要とする。
強化学習(RL)がこれらの課題に活用されている一方で、オフポリシー選択(OPS)はオフラインでオンラインインタラクションなしでポリシーを評価・選択することでループを閉じるのに欠かせないが、現在のOPS手法は参加者間の不均一性を見落としていることが多い。
私たちの仕事は、人間中心システム(HCS)における重要な課題を解決することに集中しています。
サブグループセグメンテーション(サブグループセグメンテーション)と、各サブグループに調整されたOPS基準を通じて、包摂的不均一性に体系的に対処する新しいアプローチであるFPS(First-Glance Off-Policy Selection)を導入する。
類似した特徴を持つ個人をグループ化することにより、FPSは、各参加者または参加者のグループ特有の特徴に合わせたパーソナライズされたポリシー選択を促進する。
FPSは、知的学習システムと、敗血症治療と介入のための医療アプリケーションという、2つの重要かつ困難なアプリケーションを通じて評価される。
FPSは,学生の学習成果と院内ケア成果の増大に大きく貢献している。
関連論文リスト
- Federated Learning for Estimating Heterogeneous Treatment Effects [7.967701699385625]
ヘテロジニアス処理効果(HTE)を推定するための現在の機械学習アプローチでは、処理毎にかなりの量のデータにアクセスする必要がある。
フェデレートラーニング(Federated Learning)を通じて,組織間におけるHTE推定者の協調学習のための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2024-02-27T17:33:23Z) - Multi-task Explainable Skin Lesion Classification [54.76511683427566]
少ないラベル付きデータでよく一般化する皮膚病変に対する数発のショットベースアプローチを提案する。
提案手法は,アテンションモジュールや分類ネットワークとして機能するセグメンテーションネットワークの融合を含む。
論文 参考訳(メタデータ) (2023-10-11T05:49:47Z) - A Reinforcement Learning-assisted Genetic Programming Algorithm for Team
Formation Problem Considering Person-Job Matching [70.28786574064694]
解の質を高めるために強化学習支援遺伝的プログラミングアルゴリズム(RL-GP)を提案する。
効率的な学習を通じて得られる超ヒューリスティックなルールは、プロジェクトチームを形成する際の意思決定支援として利用することができる。
論文 参考訳(メタデータ) (2023-04-08T14:32:12Z) - Psychotherapy AI Companion with Reinforcement Learning Recommendations
and Interpretable Policy Dynamics [27.80555922579736]
本稿では、患者反応に基づくセラピストのためのトピックレコメンデーションを生成する強化学習心理療法AIコンパニオンを紹介する。
このシステムは、Deep Reinforcement Learning (DRL)を使用して、4つの異なる精神状態に対する多目的ポリシーを生成する。
論文 参考訳(メタデータ) (2023-03-16T19:01:29Z) - HOPE: Human-Centric Off-Policy Evaluation for E-Learning and Healthcare [15.57203496240758]
オフ政治評価は、人間中心環境における効果的な政策の誘導に不可欠である。
部分的可観測性とアグリゲート報酬を扱うための人中心型OPEを提案する。
我々のアプローチは、異なるポリシーのリターンを確実に予測し、最先端のベンチマークを上回っます。
論文 参考訳(メタデータ) (2023-02-18T02:33:30Z) - Adaptive Identification of Populations with Treatment Benefit in
Clinical Trials: Machine Learning Challenges and Solutions [78.31410227443102]
確定的臨床試験において,特定の治療の恩恵を受ける患者サブポピュレーションを適応的に同定する問題について検討した。
サブポピュレーション構築のためのメタアルゴリズムであるAdaGGIとAdaGCPIを提案する。
論文 参考訳(メタデータ) (2022-08-11T14:27:49Z) - Federated Offline Reinforcement Learning [55.326673977320574]
マルチサイトマルコフ決定プロセスモデルを提案する。
我々は,オフラインRLを対象とした最初のフェデレーション最適化アルゴリズムを設計する。
提案アルゴリズムでは,学習ポリシーの準最適性は,データが分散していないような速度に匹敵する,理論的保証を与える。
論文 参考訳(メタデータ) (2022-06-11T18:03:26Z) - Machine learning-based patient selection in an emergency department [0.0]
本稿では機械学習(ML)に基づく患者選択手法の可能性について検討する。
システムの包括的な状態表現と、複雑な非線形選択関数が組み込まれている。
その結果,提案手法は評価条件の大部分においてAPQ法よりも有意に優れていた。
論文 参考訳(メタデータ) (2022-06-08T08:56:52Z) - Clinical trial site matching with improved diversity using fair policy
learning [56.01170456417214]
我々は,臨床治験記述を潜在的な試験現場のランクリストにマッピングするモデルを学習する。
既存のフェアネスフレームワークとは異なり、各トライアルサイトのグループメンバーシップは非バイナリである。
このようなマルチグループメンバーシップシナリオに対処するために、人口統計学的妥当性に基づく公平性基準を提案する。
論文 参考訳(メタデータ) (2022-04-13T16:35:28Z) - CAPITAL: Optimal Subgroup Identification via Constrained Policy Tree
Search [10.961093227672398]
臨床的に有意義なサブグループ学習アプローチでは、より良い治療の恩恵を受けることができる患者の最大数を特定する必要がある。
選択した患者数を最大化する最適サブグループ選択規則(SSR)を提案する。
解析可能な決定木クラスの中で最適なSSRを求めるために,ConstrAined PolIcy Tree seArch aLgorithmを提案する。
論文 参考訳(メタデータ) (2021-10-11T22:41:07Z) - CPAS: the UK's National Machine Learning-based Hospital Capacity
Planning System for COVID-19 [111.69190108272133]
新型コロナウイルス(COVID-19)の2019年は、集中治療リソースに対する前例のない需要を伴う圧倒的な医療システムの脅威となる。
病院資源計画のための機械学習システムであるCPAS(COVID-19 Capacity Planning and Analysis System)を開発した。
CPASは、新型コロナウイルス(COVID-19)のパンデミックに対処するため、全国規模で病院に配備された最初の機械学習ベースのシステムの一つだ。
論文 参考訳(メタデータ) (2020-07-27T19:39:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。