論文の概要: The Power Of Simplicity: Why Simple Linear Models Outperform Complex
Machine Learning Techniques -- Case Of Breast Cancer Diagnosis
- arxiv url: http://arxiv.org/abs/2306.02449v1
- Date: Sun, 4 Jun 2023 19:43:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-06 17:48:52.673413
- Title: The Power Of Simplicity: Why Simple Linear Models Outperform Complex
Machine Learning Techniques -- Case Of Breast Cancer Diagnosis
- Title(参考訳): シンプルさの力:なぜ単純な線形モデルは複雑な機械学習技術を上回るのか -- 乳がん診断の事例
- Authors: Muhammad Arbab Arshad, Sakib Shahriar, Khizar Anjum
- Abstract要約: 本研究では,乳がん診断における単純な線形モデルと複雑な機械学習技術の有効性について検討した。
UCI Machine Learning Repositoryデータセットを用いて,ロジスティック回帰(LR),決定木(DT),サポートベクトルマシン(SVM)のパフォーマンスを最適化する。
より単純な線形モデルであるLRは、テストスコア平均97.28%、標準偏差1.62%、計算時間35.56msにおいて、より複雑なDTおよびSVM技術よりも優れていることを示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This research paper investigates the effectiveness of simple linear models
versus complex machine learning techniques in breast cancer diagnosis,
emphasizing the importance of interpretability and computational efficiency in
the medical domain. We focus on Logistic Regression (LR), Decision Trees (DT),
and Support Vector Machines (SVM) and optimize their performance using the UCI
Machine Learning Repository dataset. Our findings demonstrate that the simpler
linear model, LR, outperforms the more complex DT and SVM techniques, with a
test score mean of 97.28%, a standard deviation of 1.62%, and a computation
time of 35.56 ms. In comparison, DT achieved a test score mean of 93.73%, and
SVM had a test score mean of 96.44%. The superior performance of LR can be
attributed to its simplicity and interpretability, which provide a clear
understanding of the relationship between input features and the outcome. This
is particularly valuable in the medical domain, where interpretability is
crucial for decision-making. Moreover, the computational efficiency of LR
offers advantages in terms of scalability and real-world applicability. The
results of this study highlight the power of simplicity in the context of
breast cancer diagnosis and suggest that simpler linear models like LR can be
more effective, interpretable, and computationally efficient than their complex
counterparts, making them a more suitable choice for medical applications.
- Abstract(参考訳): 本稿では,乳がん診断における単純な線形モデルと複雑な機械学習手法の有効性について検討し,医療領域における解釈可能性と計算効率の重要性を強調した。
我々はロジスティック回帰(lr)、決定木(dt)、サポートベクターマシン(svm)に焦点を当て、uci機械学習リポジトリデータセットを使用してパフォーマンスを最適化する。
その結果、より単純な線形モデルであるlrは、97.28%、標準偏差1.62%、計算時間は35.56ms、より複雑なdtおよびsvm技術よりも優れており、dtは93.73%、svmは96.44%であった。
LRの優れた性能は、その単純さと解釈可能性に起因しており、入力特徴と結果の関係を明確に理解することができる。
これは、意思決定に解釈性が不可欠である医療分野において特に有用である。
さらに、LRの計算効率は、スケーラビリティと実世界の応用性の観点から利点がある。
本研究は, 乳がん診断の文脈における単純さの力を強調し, LRのような単純な線形モデルの方が, 複雑なモデルよりも効果的で, 解釈可能で, 計算的に効率的であることが示唆された。
関連論文リスト
- Electroencephalogram Emotion Recognition via AUC Maximization [0.0]
不均衡データセットは神経科学、認知科学、医学診断などの分野で大きな課題を提起する。
本研究は,DEAPデータセットにおけるライキングラベルを例として,イシュークラスの不均衡に対処する。
論文 参考訳(メタデータ) (2024-08-16T19:08:27Z) - XAI4LLM. Let Machine Learning Models and LLMs Collaborate for Enhanced In-Context Learning in Healthcare [16.79952669254101]
多層構造プロンプトを用いたゼロショット/ファウショットインコンテキスト学習(ICL)のための新しい手法を開発した。
また、ユーザと大規模言語モデル(LLM)間の2つのコミュニケーションスタイルの有効性についても検討する。
本研究は,性別バイアスや偽陰性率などの診断精度とリスク要因を系統的に評価する。
論文 参考訳(メタデータ) (2024-05-10T06:52:44Z) - Towards a clinically accessible radiology foundation model: open-access and lightweight, with automated evaluation [113.5002649181103]
オープンソースの小型マルチモーダルモデル(SMM)を訓練し、放射線学における未測定臨床ニーズに対する能力ギャップを埋める。
トレーニングのために,697万以上の画像テキストペアからなる大規模なデータセットを組み立てる。
評価のために,GPT-4に基づく実測値CheXpromptを提案する。
LlaVA-Radの推論は高速で、単一のV100 GPU上でプライベート設定で実行できる。
論文 参考訳(メタデータ) (2024-03-12T18:12:02Z) - Explainable AI in Diagnosing and Anticipating Leukemia Using Transfer
Learning Method [0.0]
本研究は,小児および10代に流行する急性リンパ芽球性白血病(ALL)に焦点をあてる。
ディープラーニング技術を活用したコンピュータ支援診断(CAD)モデルを用いた自動検出手法を提案する。
提案手法は98.38%の精度を達成し、他の試験モデルよりも優れていた。
論文 参考訳(メタデータ) (2023-12-01T10:37:02Z) - Comparative Analysis of Epileptic Seizure Prediction: Exploring Diverse
Pre-Processing Techniques and Machine Learning Models [0.0]
脳波データを用いたてんかん発作予測のための5つの機械学習モデルの比較分析を行った。
本分析の結果は,各モデルの性能を精度で示すものである。
ETモデルは99.29%の精度で最高の性能を示した。
論文 参考訳(メタデータ) (2023-08-06T08:50:08Z) - Detecting Shortcut Learning for Fair Medical AI using Shortcut Testing [62.9062883851246]
機械学習は医療の改善に大いに貢献するが、その利用が健康格差を広めたり増幅したりしないことを確実にすることは重要である。
アルゴリズムの不公平性の潜在的な要因の1つ、ショートカット学習は、トレーニングデータにおける不適切な相関に基づいてMLモデルが予測した時に発生する。
マルチタスク学習を用いて,臨床MLシステムの公平性評価の一環として,ショートカット学習の評価と緩和を行う手法を提案する。
論文 参考訳(メタデータ) (2022-07-21T09:35:38Z) - Interpretability methods of machine learning algorithms with
applications in breast cancer diagnosis [1.1470070927586016]
我々は,グローバルサロゲート(GS)法,個人期待(ICE)プロット,条件シェープ値(SV)などの解釈可能性技術を用いた。
乳がん診断における最良の成績は,提案したERN(精度96.6%,ROC曲線0.96)により得られた。
論文 参考訳(メタデータ) (2022-02-04T13:41:30Z) - EMT-NET: Efficient multitask network for computer-aided diagnosis of
breast cancer [58.720142291102135]
乳腺腫瘍の分類と分別を同時に行うための,効率的で軽量な学習アーキテクチャを提案する。
腫瘍分類ネットワークにセグメンテーションタスクを組み込むことにより,腫瘍領域に着目したバックボーンネットワークで表現を学習する。
腫瘍分類の精度、感度、特異性はそれぞれ88.6%、94.1%、85.3%である。
論文 参考訳(メタデータ) (2022-01-13T05:24:40Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。