論文の概要: Hyperparameter Optimization and Reproducibility in Deep Learning Model Training
- arxiv url: http://arxiv.org/abs/2510.15164v1
- Date: Thu, 16 Oct 2025 21:57:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-20 20:17:34.40266
- Title: Hyperparameter Optimization and Reproducibility in Deep Learning Model Training
- Title(参考訳): ディープラーニングモデル学習におけるハイパーパラメータ最適化と再現性
- Authors: Usman Afzaal, Ziyu Su, Usama Sajjad, Hao Lu, Mostafa Rezapour, Metin Nafi Gurcan, Muhammad Khalid Khan Niazi,
- Abstract要約: 再生性は、病理学の基礎モデルトレーニングにおいて重要な課題である。
QUILT-1Mデータセットを用いてCLIPモデルを訓練した。
RandomResizedCropの値は0.7-0.8で、より攻撃的である(0.6)か保守的である(0.9)。
- 参考スコア(独自算出の注目度): 5.851295230237131
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reproducibility remains a critical challenge in foundation model training for histopathology, often hindered by software randomness, hardware non-determinism, and inconsistent hyperparameter reporting. To investigate these issues, we trained a CLIP model on the QUILT-1M dataset and systematically evaluated the impact of different hyperparameter settings and augmentation strategies across three downstream histopathology datasets (PatchCamelyon, LC25000-Lung, and LC25000-Colon). Despite variability across runs, we identified clear trends: RandomResizedCrop values of 0.7-0.8 outperformed more aggressive (0.6) or conservative (0.9) settings, distributed training without local loss improved stability, and learning rates below 5.0e-5 consistently degraded performance across all datasets. The LC25000 (Colon) dataset consistently provided the most reproducible benchmark. These findings highlight that reproducibility in computational pathology depends not only on transparent documentation but also on carefully chosen experimental configurations, and we provide practical rules to guide future efforts in developing reproducible foundation models for digital pathology.
- Abstract(参考訳): 再現性は、ソフトウェアランダム性、ハードウェア非決定性、一貫性のないハイパーパラメータレポートによってしばしば妨げられる、組織学の基礎モデルトレーニングにおいて重要な課題である。
これらの問題を調査するために,QUILT-1Mデータセット上でCLIPモデルを訓練し,下流の3つの病理組織データセット(PatchCamelyon, LC25000-Lung, LC25000-Colon)における異なるハイパーパラメータ設定と拡張戦略の影響を体系的に評価した。
RandomResizedCropの0.7-0.8の値は、よりアグレッシブな(0.6)または保守的な(0.9)設定、局所的な損失のない分散トレーニングによる安定性の向上、および5.0e-5以下の学習速度がすべてのデータセットで一貫してパフォーマンスを低下させた。
LC25000(Colon)データセットは、常に最も再現可能なベンチマークを提供する。
これらの結果から, 計算病理学における再現性は, 透過的な文書化だけでなく, 慎重に選択された実験構成にも依存することが明らかとなった。
関連論文リスト
- Automated Multi-label Classification of Eleven Retinal Diseases: A Benchmark of Modern Architectures and a Meta-Ensemble on a Large Synthetic Dataset [1.996975578218265]
我々は、11の網膜疾患を分類するエンドツーエンドのディープラーニングパイプラインを開発した。
合成データのみに訓練されたモデルは,複数の病態を正確に分類し,実際の臨床画像に効果的に一般化できることを示す。
論文 参考訳(メタデータ) (2025-08-21T22:09:53Z) - PySeizure: A single machine learning classifier framework to detect seizures in diverse datasets [0.0]
我々は、様々な臨床データセット間で堅牢な発作検出を可能にする、革新的なオープンソースの機械学習フレームワークを導入する。
堅牢性を高めるため、このフレームワークは自動前処理パイプラインを組み込んで、データの標準化と過半数の投票機構を備えている。
データセット内のモデルをトレーニングし、チューニングし、評価し、データセット間の転送可能性を評価します。
論文 参考訳(メタデータ) (2025-08-10T09:12:29Z) - A Lightweight and Robust Framework for Real-Time Colorectal Polyp Detection Using LOF-Based Preprocessing and YOLO-v11n [2.4896276458398785]
本研究では,ポリプ検出のための新しい,軽量で効率的なフレームワークを提案する。
ノイズの多いデータをフィルタリングするLocal Outlier Factorアルゴリズムと、YOLO-v11nディープラーニングモデルを組み合わせる。
従来のYOLO法と比較して精度と効率が向上した。
論文 参考訳(メタデータ) (2025-07-14T23:36:54Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - Advancing Tabular Stroke Modelling Through a Novel Hybrid Architecture and Feature-Selection Synergy [0.9999629695552196]
本研究は、ストロークを予測するように設計されたデータ駆動型、解釈可能な機械学習フレームワークを開発し、検証する。
定期的に収集された人口統計、生活習慣、臨床変数は4,981件の公的なコホートから得られた。
提案したモデルでは精度97.2%、F1スコア97.15%が達成され、先行する個人モデルと比較して大幅に向上した。
論文 参考訳(メタデータ) (2025-05-18T21:46:45Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Robust Learning with Progressive Data Expansion Against Spurious
Correlation [65.83104529677234]
本研究では,2層非線形畳み込みニューラルネットワークの学習過程について検討した。
分析の結果,不均衡なデータ群と学習容易なスプリアス特徴が学習過程におけるスプリアス特徴の優位性に繋がる可能性が示唆された。
本稿では,PDEと呼ばれる新たなトレーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-08T05:44:06Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。