論文の概要: AutoML-Med: A Framework for Automated Machine Learning in Medical Tabular Data
- arxiv url: http://arxiv.org/abs/2508.02625v1
- Date: Mon, 04 Aug 2025 17:13:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.450107
- Title: AutoML-Med: A Framework for Automated Machine Learning in Medical Tabular Data
- Title(参考訳): AutoML-Med: 医療用タブラリデータにおける機械学習自動化フレームワーク
- Authors: Riccardo Francia, Maurizio Leone, Giorgio Leonardi, Stefania Montani, Marzio Pennisi, Manuel Striani, Sandra D'Alfonso,
- Abstract要約: 本稿では,これらの課題に対処するための自動機械学習ツールであるAutoML-Medを紹介する。
AutoML-Medのアーキテクチャは、前処理方法の探索にラテンハイパーキューブサンプリング(LHS)、選択されたメトリクスを使用したモデル訓練、微調整最適化に部分ランク相関係数(PRCC)を使用する。
2つの異なる臨床環境でのAutoML-Medの有効性を示す実験結果が得られた。
- 参考スコア(独自算出の注目度): 1.1202352020347177
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Medical datasets are typically affected by issues such as missing values, class imbalance, a heterogeneous feature types, and a high number of features versus a relatively small number of samples, preventing machine learning models from obtaining proper results in classification and regression tasks. This paper introduces AutoML-Med, an Automated Machine Learning tool specifically designed to address these challenges, minimizing user intervention and identifying the optimal combination of preprocessing techniques and predictive models. AutoML-Med's architecture incorporates Latin Hypercube Sampling (LHS) for exploring preprocessing methods, trains models using selected metrics, and utilizes Partial Rank Correlation Coefficient (PRCC) for fine-tuned optimization of the most influential preprocessing steps. Experimental results demonstrate AutoML-Med's effectiveness in two different clinical settings, achieving higher balanced accuracy and sensitivity, which are crucial for identifying at-risk patients, compared to other state-of-the-art tools. AutoML-Med's ability to improve prediction results, especially in medical datasets with sparse data and class imbalance, highlights its potential to streamline Machine Learning applications in healthcare.
- Abstract(参考訳): 医療データセットは、典型的には、欠落値、クラス不均衡、不均一な特徴タイプ、比較的少数のサンプルに対して多数の機能の影響を受け、マシンラーニングモデルが分類と回帰タスクにおいて適切な結果を得るのを防ぐ。
本稿では,これらの課題に対処するための自動機械学習ツールであるAutoML-Medを紹介し,ユーザの介入を最小限に抑え,事前処理技術と予測モデルの最適な組み合わせを特定する。
AutoML-Medのアーキテクチャは、前処理方法の探索にラテンハイパーキューブサンプリング(LHS)、選択されたメトリクスを使用したモデル訓練、最も影響力のある前処理ステップの微調整に部分ランク相関係数(PRCC)を利用する。
2つの異なる臨床環境でのAutoML-Medの有効性を実証し、他の最先端のツールと比較して、リスクのある患者を特定するのに欠かせないバランスの取れた精度と感度を実現した。
AutoML-Medが予測結果を改善する能力、特にスパースデータとクラス不均衡を持つ医療データセットは、医療における機械学習アプリケーションの合理化の可能性を強調している。
関連論文リスト
- Clinical NLP with Attention-Based Deep Learning for Multi-Disease Prediction [44.0876796031468]
本稿では,電子健康記録テキストの非構造的性質と高次元意味論的複雑さがもたらす課題について論じる。
情報抽出と多ラベル病予測のための統合モデリングを実現するために,注意機構に基づく深層学習手法を提案する。
論文 参考訳(メタデータ) (2025-07-02T07:45:22Z) - AUTOCT: Automating Interpretable Clinical Trial Prediction with LLM Agents [47.640779069547534]
AutoCTは、大規模言語モデルの推論能力と古典的な機械学習の説明可能性を組み合わせた、新しいフレームワークである。
臨床治験予測タスクにおいて, AutoCT は SOTA 法と同等以上の性能を示した。
論文 参考訳(メタデータ) (2025-06-04T11:50:55Z) - Improving Clinical Decision Support through Interpretable Machine Learning and Error Handling in Electronic Health Records [6.594072648536156]
Trust-MAPSは、臨床領域の知識を高次元の混合整数プログラミングモデルに変換する。
信頼スコアは、臨床決定支援タスクの予測性能を高めるだけでなく、MLモデルに解釈可能性を与える臨床的に有意義な特徴として出現する。
論文 参考訳(メタデータ) (2023-08-21T15:14:49Z) - Study on the effectiveness of AutoML in detecting cardiovascular disease [0.0]
本稿では、機械学習(ML)が心血管疾患の予測を可能にする有望な技術である患者指向システムの開発と応用との関連について述べる。
心血管疾患を検出するためのAutoMLモデルの構造は、使用する基本モデルの効率と精度だけでなく、初期データを前処理するシナリオにも依存する。
論文 参考訳(メタデータ) (2023-08-19T08:46:27Z) - The Devil is in the Errors: Leveraging Large Language Models for
Fine-grained Machine Translation Evaluation [93.01964988474755]
AutoMQMは,大規模な言語モデルに対して,翻訳におけるエラーの識別と分類を求めるプロンプト技術である。
テキスト内学習と微調整によるラベル付きデータの影響について検討する。
次に, PaLM-2モデルを用いてAutoMQMを評価し, スコアのプロンプトよりも性能が向上することがわかった。
論文 参考訳(メタデータ) (2023-08-14T17:17:21Z) - Automated Medical Coding on MIMIC-III and MIMIC-IV: A Critical Review
and Replicability Study [60.56194508762205]
我々は、最先端の医療自動化機械学習モデルを再現し、比較し、分析する。
その結果, 弱い構成, サンプル化の不十分さ, 評価の不十分さなどにより, いくつかのモデルの性能が低下していることが判明した。
再生モデルを用いたMIMIC-IVデータセットの総合評価を行った。
論文 参考訳(メタデータ) (2023-04-21T11:54:44Z) - Time Associated Meta Learning for Clinical Prediction [78.99422473394029]
本稿では,時間関連メタラーニング(TAML)手法を提案する。
タスク分割後のスパーシリティ問題に対処するため、TAMLは時間情報共有戦略を採用し、正のサンプル数を増やす。
複数の臨床データセットに対するTAMLの有効性を示す。
論文 参考訳(メタデータ) (2023-03-05T03:54:54Z) - Benchmarking AutoML Frameworks for Disease Prediction Using Medical
Claims [7.219529711278771]
我々は、人口統計情報や病気コード用のフラグなど、歴史的行政的主張を用いた大規模なデータセットを作成した。
このデータセット上で3つのAutoMLツールをトレーニングし、2019年の6つの異なる疾患結果を予測するとともに、いくつかのメトリクスでモデルパフォーマンスを評価しました。
全てのモデルでは、精度・リコール曲線の下で低面積を記録し、正の正の予測に失敗し、正の負の速度を高く保った。
論文 参考訳(メタデータ) (2021-07-22T07:34:48Z) - Empirical Analysis of Machine Learning Configurations for Prediction of
Multiple Organ Failure in Trauma Patients [7.122236250657051]
多臓器不全(MOF)は生命を脅かす状態である。
包括的機械学習(ML)構成を用いた初期MOF予測の定量的解析を行う。
論文 参考訳(メタデータ) (2021-03-19T17:49:22Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。