論文の概要: Deep learning and abstractive summarisation for radiological reports: an empirical study for adapting the PEGASUS models' family with scarce data
- arxiv url: http://arxiv.org/abs/2509.15419v1
- Date: Thu, 18 Sep 2025 20:51:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-22 18:18:10.897525
- Title: Deep learning and abstractive summarisation for radiological reports: an empirical study for adapting the PEGASUS models' family with scarce data
- Title(参考訳): 放射線学報告における深層学習と抽象的要約--PEGASUSモデルファミリーを少ないデータで適応するための実証的研究
- Authors: Claudio Benzoni, Martina Langhals, Martin Boeker, Luise Modersohn, Máté E. Maros,
- Abstract要約: 医学のような繊細でデータ制限のある領域では、抽象的な要約は依然として難しい。
非ドメイン固有の抽象的要約エンコーダ-デコーダモデルファミリーの微調整過程について検討した。
- 参考スコア(独自算出の注目度): 0.1900612262939272
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Regardless of the rapid development of artificial intelligence, abstractive summarisation is still challenging for sensitive and data-restrictive domains like medicine. With the increasing number of imaging, the relevance of automated tools for complex medical text summarisation is expected to become highly relevant. In this paper, we investigated the adaptation via fine-tuning process of a non-domain-specific abstractive summarisation encoder-decoder model family, and gave insights to practitioners on how to avoid over- and underfitting. We used PEGASUS and PEGASUS-X, on a medium-sized radiological reports public dataset. For each model, we comprehensively evaluated two different checkpoints with varying sizes of the same training data. We monitored the models' performances with lexical and semantic metrics during the training history on the fixed-size validation set. PEGASUS exhibited different phases, which can be related to epoch-wise double-descent, or peak-drop-recovery behaviour. For PEGASUS-X, we found that using a larger checkpoint led to a performance detriment. This work highlights the challenges and risks of fine-tuning models with high expressivity when dealing with scarce training data, and lays the groundwork for future investigations into more robust fine-tuning strategies for summarisation models in specialised domains.
- Abstract(参考訳): 人工知能の急速な発展にもかかわらず、医学のような敏感でデータ制限のある領域では、抽象的な要約は依然として困難である。
画像の増大に伴い、複雑な医用テキスト要約のための自動化ツールの関連性が高くなることが期待されている。
本稿では,非ドメイン固有の抽象的要約エンコーダ-デコーダモデルファミリの微調整プロセスによる適応について検討し,オーバーフィットやアンダーフィッティングを回避する方法について,実践者に洞察を与えた。
PEGASUS と PEGASUS-X を中規模の放射線学的データとして用いた。
各モデルについて,同じトレーニングデータの大きさの異なる2つのチェックポイントを総合的に評価した。
固定サイズ検証セットのトレーニング履歴において,語彙的および意味的指標を用いてモデルの性能をモニタリングした。
PEGASUSは、エポックな二重発色、またはピーク・ドロップ・リカバリーの挙動に関連のある異なる相を示した。
PEGASUS-Xの場合、より大きなチェックポイントを使用するとパフォーマンスが低下することがわかった。
この研究は、不足するトレーニングデータを扱う際に、高い表現性を持つ微調整モデルの課題とリスクを強調し、専門領域における要約モデルのより堅牢な微調整戦略に関する今後の研究の基盤となる。
関連論文リスト
- Iterative Misclassification Error Training (IMET): An Optimized Neural Network Training Technique for Image Classification [0.5115559623386964]
カリキュラム学習とコアセット選択に触発された新しいフレームワークであるIMET(Iterative Misclassification Error Training)を紹介する。
IMETは、トレーニングプロセスの合理化を図りつつ、エッジケースに対するモデルの注意を先入観的かつ稀な結果に優先順位付けしながら、誤分類されたサンプルを特定することを目的としている。
本稿では,最新のResNetアーキテクチャに対するベンチマーク医用画像分類データセット上でのIMETの性能を評価する。
論文 参考訳(メタデータ) (2025-07-01T04:14:16Z) - Weakly supervised deep learning model with size constraint for prostate cancer detection in multiparametric MRI and generalization to unseen domains [0.90668179713299]
本モデルでは, 完全教師付きベースラインモデルにより, オンパー性能が向上することを示す。
また、未確認データドメインでテストした場合、完全に教師付きモデルと弱い教師付きモデルの両方のパフォーマンス低下も観察する。
論文 参考訳(メタデータ) (2024-11-04T12:24:33Z) - SuPerPM: A Surgical Perception Framework Based on Deep Point Matching Learned from Physical Constrained Simulation Data [28.314243346768112]
変形時の組織追跡誤差の主な原因は、観測されたセンサ測定と以前追跡されたシーンとの間違ったデータ関係にある。
この問題を軽減するために,データアソシエーションのための学習ベースの非剛点クラウドマッチングを利用した外科的知覚フレームワークSuPerPMを提案する。
提案手法は, 大規模な変形を特徴とする, 高度な手術シーン追跡アルゴリズムよりも優れた性能を有する, 難易度の高いいくつかの手術用データセット上で実証された。
論文 参考訳(メタデータ) (2023-09-25T04:27:06Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - EPICURE Ensemble Pretrained Models for Extracting Cancer Mutations from
Literature [12.620782629498814]
EPICUREは、条件付きランダムフィールドパターン層とスパン予測パターン層を備え、テキストからがんの突然変異を抽出するアンサンブル事前訓練モデルである。
3つのベンチマークデータセットの実験結果から,ベースラインモデルと比較して競争力のある結果が得られた。
論文 参考訳(メタデータ) (2021-06-11T09:08:15Z) - On the Efficacy of Adversarial Data Collection for Question Answering:
Results from a Large-Scale Randomized Study [65.17429512679695]
逆データ収集(ADC)では、人間の労働力がモデルとリアルタイムで対話し、誤った予測を誘発する例を作成しようとする。
ADCの直感的な魅力にも拘わらず、敵対的データセットのトレーニングがより堅牢なモデルを生成するかどうかは不明だ。
論文 参考訳(メタデータ) (2021-06-02T00:48:33Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-14T16:50:50Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Deep Mining External Imperfect Data for Chest X-ray Disease Screening [57.40329813850719]
我々は、外部のCXRデータセットを組み込むことで、不完全なトレーニングデータにつながると論じ、課題を提起する。
本研究は,多ラベル病分類問題を重み付き独立二分課題として分類する。
我々のフレームワークは、ドメインとラベルの相違を同時にモデル化し、対処し、優れた知識マイニング能力を実現する。
論文 参考訳(メタデータ) (2020-06-06T06:48:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。