論文の概要: Cohort-attention Evaluation Metric against Tied Data: Studying Performance of Classification Models in Cancer Detection
- arxiv url: http://arxiv.org/abs/2503.12755v1
- Date: Mon, 17 Mar 2025 02:50:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-18 14:56:58.074051
- Title: Cohort-attention Evaluation Metric against Tied Data: Studying Performance of Classification Models in Cancer Detection
- Title(参考訳): Cohort-attention Evaluation Metric against Tied Data: : 癌検出における分類モデルの性能の検討
- Authors: Longfei Wei, Fang Sheng, Jianfei Zhang,
- Abstract要約: 本稿では,これらの課題に対処するコホート・アテンション評価指標(CAT)フレームワークを提案する。
CATは患者レベルの評価、エントロピーに基づく分布重み付け、コホート重み付けの感度と特異性を導入している。
このアプローチは予測信頼性、公正性、解釈可能性を高め、AI駆動型医療スクリーニングモデルの堅牢な評価方法を提供する。
- 参考スコア(独自算出の注目度): 1.3767986497772466
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Artificial intelligence (AI) has significantly improved medical screening accuracy, particularly in cancer detection and risk assessment. However, traditional classification metrics often fail to account for imbalanced data, varying performance across cohorts, and patient-level inconsistencies, leading to biased evaluations. We propose the Cohort-Attention Evaluation Metrics (CAT) framework to address these challenges. CAT introduces patient-level assessment, entropy-based distribution weighting, and cohort-weighted sensitivity and specificity. Key metrics like CATSensitivity (CATSen), CATSpecificity (CATSpe), and CATMean ensure balanced and fair evaluation across diverse populations. This approach enhances predictive reliability, fairness, and interpretability, providing a robust evaluation method for AI-driven medical screening models.
- Abstract(参考訳): 人工知能(AI)は、特にがんの検出とリスクアセスメントにおいて、医療スクリーニングの精度を大幅に改善した。
しかしながら、従来の分類基準は、不均衡なデータ、コホート間でのパフォーマンスの変化、患者レベルの不整合を考慮せず、バイアスのある評価に繋がることが多い。
本稿では,これらの課題に対処するコホート・アテンション評価指標(CAT)フレームワークを提案する。
CATは患者レベルの評価、エントロピーに基づく分布重み付け、コホート重み付けの感度と特異性を導入している。
CATSensitivity (CATSen)、CATSpecificity (CATSpe)、CATMeanといった主要な指標は、多様な人口のバランスと公平な評価を保証する。
このアプローチは予測信頼性、公正性、解釈可能性を高め、AI駆動型医療スクリーニングモデルの堅牢な評価方法を提供する。
関連論文リスト
- An Empirical Analysis of Calibration and Selective Prediction in Multimodal Clinical Condition Classification [11.640422721732756]
マルチラベル臨床条件分類における不確実性に基づく選択予測の信頼性を実証的に評価した。
高い標準評価基準にもかかわらず、選択的予測は性能を著しく低下させる可能性がある。
この失敗は、厳密なクラス依存の誤校正によって引き起こされ、モデルが正しい予測に高い不確実性を割り当て、誤った予測に低い不確実性を割り当てる。
論文 参考訳(メタデータ) (2026-03-03T08:16:44Z) - Beyond Traditional Diagnostics: Transforming Patient-Side Information into Predictive Insights with Knowledge Graphs and Prototypes [55.310195121276074]
本稿では,病気を予測するための知識グラフ,プロトタイプ認識,解釈可能なフレームワークを提案する。
構造化された信頼された医療知識を統合された疾患知識グラフに統合し、臨床的に意味のある疾患のプロトタイプを構築し、予測精度を高めるために対照的な学習を利用する。
臨床的に有効な説明を提供し、患者の物語と密接に一致し、患者中心のヘルスケアデリバリーの実践的価値を強調している。
論文 参考訳(メタデータ) (2025-12-09T05:37:54Z) - CCE: Confidence-Consistency Evaluation for Time Series Anomaly Detection [56.302586730134806]
本稿では,新しい評価指標である信頼性・一貫性評価(CCE)を紹介する。
CCEは同時に、予測の信頼性と不確実性を測定する。
RankEvalは、さまざまなメトリクスのランキング機能を比較するためのベンチマークです。
論文 参考訳(メタデータ) (2025-09-01T03:38:38Z) - Honest and Reliable Evaluation and Expert Equivalence Testing of Automated Neonatal Seizure Detection [1.4624458429745086]
現在のプラクティスは、一貫性のない、バイアスのあるメトリクスに依存します。
AIパフォーマンスに関するエキスパートレベルの主張は、厳格な検証なしに頻繁に行われる。
本研究は、新生児発作検出の具体的な課題に合わせたベストプラクティスを提案する。
論文 参考訳(メタデータ) (2025-08-06T21:55:28Z) - Advancements In Heart Disease Prediction: A Machine Learning Approach For Early Detection And Risk Assessment [0.0]
本稿では,臨床データを用いた心疾患のリスク予測における機械学習モデルの役割,関連性,効率性を理解し,評価し,分析する。
Support Vector Machine (SVM) は91.51%の精度を示し、予測能力の観点から評価されたモデル間にその優位性を確認している。
論文 参考訳(メタデータ) (2024-10-16T22:32:19Z) - From Static Benchmarks to Adaptive Testing: Psychometrics in AI Evaluation [60.14902811624433]
本稿では,静的評価手法から適応テストへのパラダイムシフトについて論じる。
これには、ベンチマークで各テスト項目の特性と価値を推定し、リアルタイムでアイテムを動的に調整することが含まれる。
我々は、AI評価にサイコメトリックを採用する現在のアプローチ、アドバンテージ、そして根底にある理由を分析します。
論文 参考訳(メタデータ) (2023-06-18T09:54:33Z) - Explainable AI for Malnutrition Risk Prediction from m-Health and
Clinical Data [3.093890460224435]
異種m-healthデータに基づく早期かつ説明可能な栄養失調リスク検出のための新しいAIフレームワークを提案する。
対象非依存および個人化予測を含む広範囲なモデル評価を行った。
また,グローバルモデル記述を抽出するベンチマークXAI法についても検討した。
論文 参考訳(メタデータ) (2023-05-31T08:07:35Z) - Auditing ICU Readmission Rates in an Clinical Database: An Analysis of
Risk Factors and Clinical Outcomes [0.0]
本研究では,30日間の読解問題における臨床データ分類のための機械学習パイプラインを提案する。
公正監査は、平等機会、予測パリティ、偽陽性率パリティ、偽陰性率パリティ基準の格差を明らかにする。
この研究は、人工知能(AI)システムのバイアスと公平性に対処するために、研究者、政策立案者、実践者の協力的努力の必要性を示唆している。
論文 参考訳(メタデータ) (2023-04-12T17:09:38Z) - Evaluating Probabilistic Classifiers: The Triptych [62.997667081978825]
本稿では,予測性能の異なる相補的な側面に焦点をあてた診断グラフィックのトリチチを提案し,研究する。
信頼性図は校正に対処し、受信動作特性(ROC)曲線は識別能力を診断し、マーフィー図は全体的な予測性能と価値を視覚化する。
論文 参考訳(メタデータ) (2023-01-25T19:35:23Z) - Towards Reliable Medical Image Segmentation by utilizing Evidential Calibrated Uncertainty [52.03490691733464]
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を利用して、医用画像分割の問題に対する確率と不確実性を明示的にモデル化する。
DeviSには不確実性を考慮したフィルタリングモジュールが組み込まれている。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z) - Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach [55.41644538483948]
本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
論文 参考訳(メタデータ) (2020-05-07T16:13:12Z) - Uncertainty estimation for classification and risk prediction on medical
tabular data [0.0]
本研究は,医療データの分類とリスク予測のための不確実性推定の理解を深めるものである。
医療などのデータ共有分野において、モデルの予測の不確実性を測定する能力は、意思決定支援ツールの改善につながる可能性がある。
論文 参考訳(メタデータ) (2020-04-13T08:46:41Z) - Interpretable Off-Policy Evaluation in Reinforcement Learning by
Highlighting Influential Transitions [48.91284724066349]
強化学習におけるオフ政治評価は、医療や教育などの領域における将来の成果を改善するために観察データを使用する機会を提供する。
信頼区間のような従来の尺度は、ノイズ、限られたデータ、不確実性のために不十分である可能性がある。
我々は,人間専門家が政策評価評価評価の妥当性を分析できるように,ハイブリッドAIシステムとして機能する手法を開発した。
論文 参考訳(メタデータ) (2020-02-10T00:26:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。