論文の概要: Evaluation of machine learning algorithms for Health and Wellness
applications: a tutorial
- arxiv url: http://arxiv.org/abs/2008.13690v2
- Date: Wed, 24 Mar 2021 16:40:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-23 06:43:15.741538
- Title: Evaluation of machine learning algorithms for Health and Wellness
applications: a tutorial
- Title(参考訳): 健康・健康応用のための機械学習アルゴリズムの評価:チュートリアル
- Authors: Jussi Tohka and Mark van Gils
- Abstract要約: このチュートリアルは、これらのDoの背後にあるより良い理解を構築しようと試み、最も関連するパフォーマンス評価基準とそれらを計算する方法の両方を示しない。
- 参考スコア(独自算出の注目度): 0.456877715768796
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Research on decision support applications in healthcare, such as those
related to diagnosis, prediction, treatment planning, etc., have seen
enormously increased interest recently. This development is thanks to the
increase in data availability as well as advances in artificial intelligence
and machine learning research. Highly promising research examples are published
daily. However, at the same time, there are some unrealistic expectations with
regards to the requirements for reliable development and objective validation
that is needed in healthcare settings. These expectations may lead to unmet
schedules and disappointments (or non-uptake) at the end-user side. It is the
aim of this tutorial to provide practical guidance on how to assess performance
reliably and efficiently and avoid common traps. Instead of giving a list of
do's and don't s, this tutorial tries to build a better understanding behind
these do's and don't s and presents both the most relevant performance
evaluation criteria as well as how to compute them. Along the way, we will
indicate common mistakes and provide references discussing various topics more
in-depth.
- Abstract(参考訳): 近年, 診断, 予測, 治療計画など医療における意思決定支援の応用に関する研究が注目されている。
この開発は、データ可用性の向上と、人工知能と機械学習の研究の進歩のおかげでいる。
有望な研究例が毎日出版されている。
しかし同時に、医療現場で必要とされる信頼性の高い開発と客観的検証の要件に関して、非現実的な期待もある。
これらの期待は、エンドユーザ側でのスケジュールや失望(あるいは不満)につながる可能性がある。
このチュートリアルの目的は、パフォーマンスを安定かつ効率的に評価し、共通のトラップを避けるための実践的なガイダンスを提供することである。
do's and don't sのリストを提供する代わりに、このチュートリアルでは、これらのdo'sと don't sの背後にある理解を深め、最も関連するパフォーマンス評価基準とそれらを計算する方法の両方を提示します。
その過程で、共通の間違いを示し、様々なトピックについてより深く議論する参照を提供する。
関連論文リスト
- A Survey of Models for Cognitive Diagnosis: New Developments and Future Directions [66.40362209055023]
本研究の目的は,認知診断の現在のモデルについて,機械学習を用いた新たな展開に注目した調査を行うことである。
モデル構造,パラメータ推定アルゴリズム,モデル評価方法,適用例を比較して,認知診断モデルの最近の傾向を概観する。
論文 参考訳(メタデータ) (2024-07-07T18:02:00Z) - Uncertainty of Thoughts: Uncertainty-Aware Planning Enhances Information Seeking in Large Language Models [73.79091519226026]
Uncertainty of Thoughts (UoT) は、大きな言語モデルを拡張するアルゴリズムであり、効果的な質問をすることで積極的に情報を求めることができる。
医療診断、トラブルシューティング、および20の質問ゲームに関する実験において、UoTは、タスク完了の成功率において平均38.1%のパフォーマンス向上を達成した。
論文 参考訳(メタデータ) (2024-02-05T18:28:44Z) - A Study of Acquisition Functions for Medical Imaging Deep Active
Learning [2.4654745083407175]
データ不足の状況において,アクティブな学習がいかに効果的かを示す。
我々はISIC 2016データセットにおけるいくつかの選択基準(BALD, MeanSTD, MaxEntropy)を比較した。
その結果,メラノーマ検出には不確実性が有用であることが示唆された。
論文 参考訳(メタデータ) (2024-01-28T18:09:02Z) - Evaluating the Fairness of the MIMIC-IV Dataset and a Baseline
Algorithm: Application to the ICU Length of Stay Prediction [65.268245109828]
本稿では、MIMIC-IVデータセットを用いて、滞在時間を予測するXGBoostバイナリ分類モデルにおける公平性とバイアスについて検討する。
この研究は、人口統計属性にわたるデータセットのクラス不均衡を明らかにし、データ前処理と特徴抽出を採用する。
この論文は、偏見を緩和するための公正な機械学習技術と、医療専門家とデータサイエンティストの協力的な努力の必要性について結論付けている。
論文 参考訳(メタデータ) (2023-12-31T16:01:48Z) - Clairvoyance: A Pipeline Toolkit for Medical Time Series [95.22483029602921]
時系列学習は、データ駆動の*クリニカルな意思決定支援のパンとバターである*
Clairvoyanceは、ソフトウェアツールキットとして機能する、統合されたエンドツーエンドのオートMLフレンドリなパイプラインを提案する。
Clairvoyanceは、臨床時系列MLのための包括的で自動化可能なパイプラインの生存可能性を示す最初のものである。
論文 参考訳(メタデータ) (2023-10-28T12:08:03Z) - Recommendations on test datasets for evaluating AI solutions in
pathology [2.001521933638504]
デジタル組織像から自動的に情報を抽出するAIソリューションは、病理診断を改善するための大きな可能性を示している。
日常使用の前には, 予測性能を評価し, 規制承認を得ることが重要である。
商用AI開発者、病理学者、研究者を含む様々な利害関係者からなる委員会は、重要な側面について議論し、病理学におけるテストデータセットに関する広範な文献レビューを行った。
論文 参考訳(メタデータ) (2022-04-21T14:52:47Z) - Explainable Deep Learning in Healthcare: A Methodological Survey from an
Attribution View [36.025217954247125]
本稿では,今後の研究者や臨床医の方法論として,深部・包括的に解釈可能性の方法を紹介した。
我々は、これらの方法が医療問題にどのように適応し、適用されたか、また、医師がこれらのデータ駆動技術をよりよく理解するのにどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2021-12-05T17:12:53Z) - Key Technology Considerations in Developing and Deploying Machine
Learning Models in Clinical Radiology Practice [0.0]
機械学習研究者は、モデルが正確で、堅牢で、実際に利用できるようにするために、認識し、対処しなければならない重要な考慮事項のリストを提案する。
すなわち、不十分なトレーニングデータ、分散データセット、高コストのアノテーション、曖昧な基底真理、クラス表現の不均衡、非対称な誤分類コスト、関連するパフォーマンス指標、モデルから未確認データセットへの一般化、モデル崩壊、逆行攻撃、説明可能性、公正さとバイアス、臨床検証について論じる。
論文 参考訳(メタデータ) (2021-02-03T09:53:43Z) - DOME: Recommendations for supervised machine learning validation in
biology [0.3372751145910977]
現代の生物学は、しばしば予測を提供し、意思決定プロセスを改善するために機械学習に依存している。
最近、機械学習のパフォーマンスと潜在的な制限について、より精査を求める声が上がっている。
ここでは,生物学における教師付き機械学習検証の標準を確立することを目的とした,コミュニティ全体の勧告について紹介する。
論文 参考訳(メタデータ) (2020-06-25T12:01:39Z) - Confident Coreset for Active Learning in Medical Image Analysis [57.436224561482966]
本稿では,情報的サンプルを効果的に選択するための,不確実性と分散性を考慮した新しい能動的学習手法である信頼コアセットを提案する。
2つの医用画像解析タスクの比較実験により,本手法が他の活動的学習方法より優れていることを示す。
論文 参考訳(メタデータ) (2020-04-05T13:46:16Z) - DisCor: Corrective Feedback in Reinforcement Learning via Distribution
Correction [96.90215318875859]
ブートストラップに基づくQ-ラーニングアルゴリズムは必ずしも修正フィードバックの恩恵を受けないことを示す。
本稿では,この最適分布に対する近似を計算し,トレーニングに使用する遷移の重み付けに使用する新しいアルゴリズムであるDisCorを提案する。
論文 参考訳(メタデータ) (2020-03-16T16:18:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。