論文の概要: Learning to search efficiently for causally near-optimal treatments
- arxiv url: http://arxiv.org/abs/2007.00973v2
- Date: Wed, 17 Feb 2021 08:38:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 13:15:37.047640
- Title: Learning to search efficiently for causally near-optimal treatments
- Title(参考訳): 因果的近位治療を効率的に探索する学習
- Authors: Samuel H{\aa}kansson, Viktor Lindblom, Omer Gottesman, Fredrik D.
Johansson
- Abstract要約: 我々は、この問題を、因果推論フレームワークを用いて最小限の試行において、準最適治療を見つけるためのポリシーを学習するものとして定式化する。
本研究では,観測データから学習するモデルに基づく動的プログラミングアルゴリズムを提案する。
提案手法は,検索時間と治療効果のより透明なトレードオフを提供しながら,モデルフリーのベースラインと良好に比較できることがわかった。
- 参考スコア(独自算出の注目度): 11.617543268083551
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Finding an effective medical treatment often requires a search by trial and
error. Making this search more efficient by minimizing the number of
unnecessary trials could lower both costs and patient suffering. We formalize
this problem as learning a policy for finding a near-optimal treatment in a
minimum number of trials using a causal inference framework. We give a
model-based dynamic programming algorithm which learns from observational data
while being robust to unmeasured confounding. To reduce time complexity, we
suggest a greedy algorithm which bounds the near-optimality constraint. The
methods are evaluated on synthetic and real-world healthcare data and compared
to model-free reinforcement learning. We find that our methods compare
favorably to the model-free baseline while offering a more transparent
trade-off between search time and treatment efficacy.
- Abstract(参考訳): 効果的な治療を見つけるには、しばしば試行錯誤による検索が必要である。
不要な臨床試験の数を最小化することで、この検索をより効率的にすることで、コストと患者の苦痛を軽減できる。
我々は, 因果推論フレームワークを用いて, 最小限の試行で最適に近い治療法を見つけるための方針を学ぶことで, この問題を定式化する。
本研究では,観測データから学習するモデルに基づく動的プログラミングアルゴリズムを提案する。
時間の複雑さを軽減するため、近最適制約を拘束する欲望アルゴリズムを提案する。
これらの手法は, 人工的および実世界の医療データに基づいて評価し, モデルレス強化学習と比較した。
提案手法は,検索時間と治療効果のより透明なトレードオフを提供しながら,モデルフリーのベースラインと良好に比較できる。
関連論文リスト
- Efficient Line Search Method Based on Regression and Uncertainty Quantification [7.724860428430271]
制約のない最適化問題は、通常、最適なステップ長を決定するために反復法を用いて解決される。
本稿では,ベイズ最適化を用いた新しい線探索手法を提案する。
既存の最先端手法と比較して優れた性能を示し、同等のリソース使用量で最適性に多くの問題を解決している。
論文 参考訳(メタデータ) (2024-05-17T16:35:20Z) - Ranking with Confidence for Large Scale Comparison Data [1.2183405753834562]
本研究では、比較ノイズを考慮した生成データモデルを用いて、ペア比較から高速で正確で情報的なランク付けを行う。
実データでは、PD-Rankは、アクティブな学習方法よりも同じKendallアルゴリズムを達成するのに、計算時間が少ない。
論文 参考訳(メタデータ) (2022-02-03T16:36:37Z) - Sample Selection for Fair and Robust Training [28.94276265328868]
公平でロバストなトレーニングのためのサンプル選択に基づくアルゴリズムを提案する。
提案アルゴリズムは,最先端技術に匹敵する公平性と堅牢性が得られることを示す。
論文 参考訳(メタデータ) (2021-10-27T07:17:29Z) - Multilevel Stochastic Optimization for Imputation in Massive Medical Data Records [6.711824170437793]
我々は最近開発された多段階計算最適化手法を医療記録の計算問題に適用した。
その結果, マルチレベル手法は現在の手法よりも大幅に優れ, 数値的に堅牢であることがわかった。
論文 参考訳(メタデータ) (2021-10-19T01:14:08Z) - Machine Learning for Online Algorithm Selection under Censored Feedback [71.6879432974126]
オンラインアルゴリズム選択(OAS)では、アルゴリズム問題クラスのインスタンスがエージェントに次々に提示され、エージェントは、固定された候補アルゴリズムセットから、おそらく最高のアルゴリズムを迅速に選択する必要がある。
SAT(Satisfiability)のような決定問題に対して、品質は一般的にアルゴリズムのランタイムを指す。
本研究では,OASのマルチアームバンディットアルゴリズムを再検討し,この問題に対処する能力について議論する。
ランタイム指向の損失に適応し、時間的地平線に依存しない空間的・時間的複雑さを維持しながら、部分的に検閲されたデータを可能にする。
論文 参考訳(メタデータ) (2021-09-13T18:10:52Z) - Local policy search with Bayesian optimization [73.0364959221845]
強化学習は、環境との相互作用によって最適な政策を見つけることを目的としている。
局所探索のための政策勾配は、しばしばランダムな摂動から得られる。
目的関数の確率モデルとその勾配を用いたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-06-22T16:07:02Z) - Towards Optimally Efficient Tree Search with Deep Learning [76.64632985696237]
本稿では,線形モデルから信号整数を推定する古典整数最小二乗問題について検討する。
問題はNPハードであり、信号処理、バイオインフォマティクス、通信、機械学習といった様々な応用でしばしば発生する。
本稿では, 深いニューラルネットワークを用いて, 単純化されたメモリバウンドA*アルゴリズムの最適推定を推定し, HATSアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-01-07T08:00:02Z) - Online Model Selection for Reinforcement Learning with Function
Approximation [50.008542459050155]
我々は、$tildeO(L5/6 T2/3)$ regretで最適な複雑性に適応するメタアルゴリズムを提案する。
また、メタアルゴリズムは、インスタンス依存の後悔境界を著しく改善することを示す。
論文 参考訳(メタデータ) (2020-11-19T10:00:54Z) - Bloom Origami Assays: Practical Group Testing [90.2899558237778]
グループテストは、いくつかの魅力的なソリューションでよく研究されている問題である。
近年の生物学的研究は、従来の方法と相容れない新型コロナウイルスの実践的な制約を課している。
我々は,Bloomフィルタと信条伝搬を組み合わせた新しい手法を開発し,n(100以上)の大きい値に拡張し,良好な経験的結果を得る。
論文 参考訳(メタデータ) (2020-07-21T19:31:41Z) - Improving a State-of-the-Art Heuristic for the Minimum Latency Problem
with Data Mining [69.00394670035747]
ハイブリッドメタヒューリスティックスは、オペレーション研究のトレンドとなっている。
成功例は、Greedy Randomized Adaptive Search Procedures (GRASP)とデータマイニング技術を組み合わせたものだ。
論文 参考訳(メタデータ) (2019-08-28T13:12:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。