論文の概要: Benchmarking Deep Learning-Based Reconstruction Methods for Photoacoustic Computed Tomography with Clinically Relevant Synthetic Datasets
- arxiv url: http://arxiv.org/abs/2601.17165v1
- Date: Fri, 23 Jan 2026 20:52:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:07.316065
- Title: Benchmarking Deep Learning-Based Reconstruction Methods for Photoacoustic Computed Tomography with Clinically Relevant Synthetic Datasets
- Title(参考訳): 臨床関連合成データセットを用いた光音響CTの深層学習に基づく再構成手法のベンチマーク
- Authors: Panpan Chen, Seonyeong Park, Gangwon Jeong, Refik Mert Cam, Umberto Villa, Mark A. Anastasio,
- Abstract要約: 近年,光音響CT(PACT)のための深層学習(DL)に基づく画像再構成法が急速に進歩している。
既存のほとんどの手法は標準化されたデータセットを使用しておらず、その評価は臨床関連性に欠ける可能性のある従来の画像品質(IQ)メトリクスに依存している。
PACTにおけるDLベースの音響インバージョン手法の評価手法として,オープンソースで解剖学的に妥当な合成データセットを提供するベンチマークフレームワークを提案する。
- 参考スコア(独自算出の注目度): 5.916152021724446
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning (DL)-based image reconstruction methods for photoacoustic computed tomography (PACT) have developed rapidly in recent years. However, most existing methods have not employed standardized datasets, and their evaluations rely on traditional image quality (IQ) metrics that may lack clinical relevance. The absence of a standardized framework for clinically meaningful IQ assessment hinders fair comparison and raises concerns about the reproducibility and reliability of reported advancements in PACT. A benchmarking framework is proposed that provides open-source, anatomically plausible synthetic datasets and evaluation strategies for DL-based acoustic inversion methods in PACT. The datasets each include over 11,000 two-dimensional (2D) stochastic breast objects with clinically relevant lesions and paired measurements at varying modeling complexity. The evaluation strategies incorporate both traditional and task-based IQ measures to assess fidelity and clinical utility. A preliminary benchmarking study is conducted to demonstrate the framework's utility by comparing DL-based and physics-based reconstruction methods. The benchmarking study demonstrated that the proposed framework enabled comprehensive, quantitative comparisons of reconstruction performance and revealed important limitations in certain DL-based methods. Although they performed well according to traditional IQ measures, they often failed to accurately recover lesions. This highlights the inadequacy of traditional metrics and motivates the need for task-based assessments. The proposed benchmarking framework enables systematic comparisons of DL-based acoustic inversion methods for 2D PACT. By integrating clinically relevant synthetic datasets with rigorous evaluation protocols, it enables reproducible, objective assessments and facilitates method development and system optimization in PACT.
- Abstract(参考訳): 近年,光音響CT(PACT)のための深層学習(DL)に基づく画像再構成法が急速に進歩している。
しかし、既存のほとんどの手法では標準化されたデータセットを使用しておらず、その評価は臨床関連性に欠けるような従来の画像品質(IQ)メトリクスに依存している。
臨床的に有意なIQ評価のための標準化された枠組みが存在しないことは、公正な比較を妨げ、PACTにおける報告された進歩の再現性と信頼性に関する懸念を提起する。
PACTにおけるDLベースの音響インバージョン手法の評価手法として,オープンソースで解剖学的に妥当な合成データセットを提供するベンチマークフレームワークを提案する。
それぞれのデータセットには、臨床的に関連のある病変を持つ11,000以上の2次元(2D)確率的乳腺オブジェクトと、様々なモデリング複雑性におけるペア計測が含まれている。
評価戦略は、従来型とタスクベースのIQ尺度の両方を取り入れて、忠実度と臨床的有用性を評価する。
DLベースと物理ベースの再構成手法を比較して,フレームワークの有用性を実証するために,予備的なベンチマーク研究を行った。
ベンチマークの結果,提案手法により,復元性能の包括的,定量的な比較が可能となり,特定のDL法において重要な限界が明らかとなった。
従来のIQ測定では正常に機能していたが、しばしば病変の正確な回復に失敗した。
これは従来のメトリクスの不十分さを強調し、タスクベースのアセスメントの必要性を動機付けます。
提案するベンチマークフレームワークは,2次元PACTのためのDLベース音響インバージョン手法の系統的比較を可能にする。
臨床的に関連する合成データセットを厳格な評価プロトコルと統合することにより、再現性、客観的評価を可能にし、PACTにおけるメソッド開発とシステム最適化を容易にする。
関連論文リスト
- Multidimensional Rubric-oriented Reward Model Learning via Geometric Projection Reference Constraints [4.79357178898034]
GPRC(Geometric Projection Reference Constraints)を用いたMR-RML(Multidimensional-oriented Reward Model Learning)を導入する。
提案手法は,(1)訓練パイプライン全体にドメイン固有のガイドラインを組み込んだ医療標準システム,(2)評価基準を分解する独立した多次元報酬モデル,(3)臨床認知論理を数学的正則化に変換する予測基準制約,の3つの重要なイノベーションを紹介する。
本手法はQwen-32Bモデルの性能を大幅に向上させ,完全部分集合では45%,ハード部分集合では85%向上させた。
論文 参考訳(メタデータ) (2025-11-20T08:26:16Z) - Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.721265428780946]
医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。
本稿は、この新興分野に関する最初の体系的なレビューを提供する。
本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文 参考訳(メタデータ) (2025-08-01T14:41:31Z) - Benchmarking of EEG Analysis Techniques for Parkinson's Disease Diagnosis: A Comparison between Traditional ML Methods and Foundation DL Methods [4.405656184346215]
パーキンソン病(英: Parkinson's Disease PD)は、運動機能と認知機能に影響を与える進行性神経変性疾患である。
従来の機械学習MLとディープラーニングDLモデルの体系的なベンチマークを行い、PDを分類する。
統合された7ステップ前処理パイプラインを実装し、一貫した主観的クロスバリデーションと評価基準を適用した。
論文 参考訳(メタデータ) (2025-07-18T07:59:17Z) - FACT: Foundation Model for Assessing Cancer Tissue Margins with Mass Spectrometry [1.0183055506531902]
FACTは、もともと3重項損失に基づく教師付きコントラストアプローチを用いて事前訓練されたテキスト音声アソシエーションのための基礎モデルの適応である。
結果: 提案モデルでは, AUROC が 82.4% pm 0.8$ で, 最先端性能を実現し, 分類性能を著しく向上させる。
論文 参考訳(メタデータ) (2025-04-15T16:36:03Z) - Scoring Verifiers: Evaluating Synthetic Verification for Code and Reasoning [59.25951947621526]
本稿では,既存の符号化ベンチマークをスコアとランキングデータセットに変換して,合成検証の有効性を評価する手法を提案する。
我々は4つの新しいベンチマーク(HE-R, HE-R+, MBPP-R, MBPP-R+)を公表し, 標準, 推論, 報酬に基づくLCMを用いて合成検証手法を解析した。
実験の結果, 推論はテストケースの生成を著しく改善し, テストケースのスケーリングによって検証精度が向上することがわかった。
論文 参考訳(メタデータ) (2025-02-19T15:32:11Z) - Benchmarks as Microscopes: A Call for Model Metrology [76.64402390208576]
現代の言語モデル(LM)は、能力評価において新たな課題を提起する。
メトリクスに自信を持つためには、モデルミアロジの新たな規律が必要です。
論文 参考訳(メタデータ) (2024-07-22T17:52:12Z) - Rethinking model prototyping through the MedMNIST+ dataset collection [0.11999555634662634]
この作業では、MedMNIST+データセットコレクションの包括的なベンチマークを導入する。
我々は、一般的なCNN(Convolutional Neural Networks)とViT(Vision Transformer)アーキテクチャを、異なる医療データセットにわたって再評価する。
この結果から,計算効率のよいトレーニングスキームと最新の基礎モデルが,エンドツーエンドのトレーニングに有効な代替手段を提供する可能性が示唆された。
論文 参考訳(メタデータ) (2024-04-24T10:19:25Z) - Ontology-aware Learning and Evaluation for Audio Tagging [56.59107110017436]
平均平均精度(mAP)は、異なる種類の音をそれらの関係を考慮せずに独立したクラスとして扱う。
オントロジー認識平均平均精度(OmAP)は、評価中にAudioSetオントロジー情報を利用することで、mAPの弱点に対処する。
我々は人間の評価を行い、OmAPはmAPよりも人間の知覚と一致していることを示した。
論文 参考訳(メタデータ) (2022-11-22T11:35:14Z) - ECG-DelNet: Delineation of Ambulatory Electrocardiograms with Mixed
Quality Labeling Using Neural Networks [69.25956542388653]
ディープラーニング(DL)アルゴリズムは、学術的、産業的にも重くなっている。
セグメンテーションフレームワークにECGの検出とデライン化を組み込むことにより、低解釈タスクにDLをうまく適用できることを実証する。
このモデルは、PhyloNetのQTデータベースを使用して、105個の増幅ECG記録から訓練された。
論文 参考訳(メタデータ) (2020-05-11T16:29:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。