論文の概要: Decision-Making Algorithms for Learning and Adaptation with Application
to COVID-19 Data
- arxiv url: http://arxiv.org/abs/2012.07844v1
- Date: Mon, 14 Dec 2020 18:24:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-08 14:35:42.319916
- Title: Decision-Making Algorithms for Learning and Adaptation with Application
to COVID-19 Data
- Title(参考訳): 新型コロナウイルスデータを用いた学習・適応のための意思決定アルゴリズム
- Authors: Stefano Marano and Ali H. Sayed
- Abstract要約: 本研究は適応と学習のための新しい意思決定アルゴリズムの開発に焦点を当てている。
重要な観察は、推定と決定の問題は構造的に異なるため、前者で成功したアルゴリズムは決定の問題を調整してもうまく機能しないということである。
- 参考スコア(独自算出の注目度): 46.71828464689144
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work focuses on the development of a new family of decision-making
algorithms for adaptation and learning, which are specifically tailored to
decision problems and are constructed by building up on first principles from
decision theory. A key observation is that estimation and decision problems are
structurally different and, therefore, algorithms that have proven successful
for the former need not perform well when adjusted for decision problems. We
propose a new scheme, referred to as BLLR (barrier log-likelihood ratio
algorithm) and demonstrate its applicability to real-data from the COVID-19
pandemic in Italy. The results illustrate the ability of the design tool to
track the different phases of the outbreak.
- Abstract(参考訳): 本研究は、適応と学習のための新しい意思決定アルゴリズムの開発に焦点を当て、決定問題に特化しており、決定理論から第一原理を構築することによって構築される。
重要な観察は、推定と決定問題は構造的に異なるため、前者で成功したアルゴリズムは決定問題に対して調整してもうまく機能しないということである。
本稿では, BLLR (barrier log-likelihood ratio algorithm) と呼ばれる新しい手法を提案し, イタリアにおけるCOVID-19パンデミックのリアルタイムデータに適用可能であることを示す。
結果は、アウトブレイクの異なるフェーズを追跡する設計ツールの能力を示している。
関連論文リスト
- Designing Algorithmic Recommendations to Achieve Human-AI Complementarity [2.4247752614854203]
人間の意思決定を支援するレコメンデーションアルゴリズムの設計を形式化する。
我々は、潜在的なアウトカムフレームワークを使用して、ヒトの意思決定者による二元的治療選択に対するレコメンデーションの効果をモデル化する。
機械学習で実装可能な最小限の推奨アルゴリズムを導出する。
論文 参考訳(メタデータ) (2024-05-02T17:15:30Z) - Anomaly Detection via Learning-Based Sequential Controlled Sensing [25.282033825977827]
本稿では,学習に基づく制御センシングによるバイナリプロセス間の異常検出の問題に対処する。
異常を識別するために、意思決定エージェントは、各時点でプロセスのサブセットを観察することができる。
我々の目標は、どの過程を観察するかを動的に決定するシーケンシャルな選択ポリシーを設計することである。
論文 参考訳(メタデータ) (2023-11-30T07:49:33Z) - Explainable Data-Driven Optimization: From Context to Decision and Back
Again [76.84947521482631]
データ駆動最適化では、コンテキスト情報と機械学習アルゴリズムを使用して、不確実なパラメータによる決定問題の解決策を見つける。
本稿では,データ駆動型問題に対する解法を説明するために,対実的説明手法を提案する。
在庫管理やルーティングといった運用管理における重要な問題を説明することで,我々のアプローチを実証する。
論文 参考訳(メタデータ) (2023-01-24T15:25:16Z) - Tight Guarantees for Interactive Decision Making with the
Decision-Estimation Coefficient [51.37720227675476]
我々は、決定推定係数の新たな変種を導入し、それを用いて、3つの面における事前の作業を改善する新しい下界を導出する。
我々は同じ量でスケールした後悔について上界を与え、フォスター等における上界と下界の間のギャップの1つを除いて全てを閉じる。
この結果は、後悔のフレームワークとPACフレームワークの両方に適用され、我々が期待するいくつかの新しい分析とアルゴリズム設計技術を利用して、より広範な利用が期待できる。
論文 参考訳(メタデータ) (2023-01-19T18:24:08Z) - The Statistical Complexity of Interactive Decision Making [126.04974881555094]
複雑度尺度であるDecision-Estimation Coefficientは,サンプル効率のインタラクティブ学習に必要かつ十分であることが証明された。
統合アルゴリズム設計原則であるE2Dは、教師付き推定のための任意のアルゴリズムを、意思決定のためのオンラインアルゴリズムに変換する。
論文 参考訳(メタデータ) (2021-12-27T02:53:44Z) - Modularity in Reinforcement Learning via Algorithmic Independence in
Credit Assignment [79.5678820246642]
提案手法は, 事前決定の順序に対して, スパース変化のみを必要とする伝達問題に対して, 政策段階の手法よりも, より標本効率が高いことを示す。
我々は最近提案された社会的意思決定の枠組みをマルコフ決定プロセスよりもよりきめ細かい形式主義として一般化する。
論文 参考訳(メタデータ) (2021-06-28T21:29:13Z) - A Unifying Framework for Reinforcement Learning and Planning [2.564530030795554]
本稿では、強化学習計画(FRAP)のための統一的アルゴリズムフレームワークを提案する。
論文の最後には、これらの次元に沿って、よく知られたプランニング、モデルフリー、モデルベースRLアルゴリズムを比較した。
論文 参考訳(メタデータ) (2020-06-26T14:30:41Z) - Towards Minimax Optimal Reinforcement Learning in Factored Markov
Decision Processes [53.72166325215299]
エピソード因子化マルコフ決定過程(FMDP)における最小強化学習について検討する。
第一に、分解された構造のリッチなクラスに対する最小限の後悔の保証を達成する。
2つ目は、少し悪い後悔をしながら、より良い計算複雑性を楽しみます。
論文 参考訳(メタデータ) (2020-06-24T00:50:17Z) - Automatic Discovery of Interpretable Planning Strategies [9.410583483182657]
我々は、慣用的ポリシーを単純かつ解釈可能な記述に変換する方法であるAI-Interpretを紹介する。
フローチャートとしてAI-Interpretが生み出す決定ルールを守れば、人々の計画戦略や意思決定は大幅に改善される。
論文 参考訳(メタデータ) (2020-05-24T12:24:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。