論文の概要: Weighting What Matters: Boosting Sample Efficiency in Medical Report Generation via Token Reweighting
- arxiv url: http://arxiv.org/abs/2604.21082v1
- Date: Wed, 22 Apr 2026 20:51:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.175277
- Title: Weighting What Matters: Boosting Sample Efficiency in Medical Report Generation via Token Reweighting
- Title(参考訳): 重み付け:Token Reweightingによる医療レポート作成におけるサンプル効率の向上
- Authors: Alexander Weers, Daniel Rueckert, Martin J. Menten,
- Abstract要約: 本研究は、データ効率を向上させるために重み付き損失関数を用いることを評価する。
眼科報告生成実験において,本手法は複数のデータスケールでの効率向上を図っている。
- 参考スコア(独自算出の注目度): 63.45467968400172
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Training vision-language models (VLMs) for medical report generation is often hindered by the scarcity of high-quality annotated data. This work evaluates the use of a weighted loss function to improve data efficiency. Compared to standard cross-entropy loss, which treats all token prediction errors equally, the reweighted loss shifts the focus to semantically salient tokens with outsized clinical importance. In experiments on ophthalmological report generation, we show that this simple method improves efficiency across multiple data scales, achieving similar report quality with up to ten times less training data.
- Abstract(参考訳): 医療報告生成のための訓練用視覚言語モデル(VLM)は、高品質な注釈付きデータの不足によってしばしば妨げられる。
本研究は、データ効率を向上させるために重み付き損失関数を用いることを評価する。
すべてのトークン予測エラーを等しく扱う標準的なクロスエントロピー損失と比較すると、再重み付き損失は焦点を、より小さい臨床的重要性を持つ意味的に有意なトークンにシフトする。
眼科報告生成実験において、この単純な手法により複数のデータスケールにわたる効率が向上し、トレーニングデータの最大10倍の精度で同様の報告品質が得られることを示した。
関連論文リスト
- Z-Error Loss for Training Neural Networks [0.0]
異常勾配を伝播することで、モデル性能と一般化を低下させることができる。
本稿では,Z-Error Lossを提案する。Z-Error Lossは,各バッチにおけるアウト・オブ・ディストリビューション(out-of-distribution)として認識されるデータポイントの寄与を隠蔽することにより,トレーニング中のアウトラヤの影響を最小限に抑える,統計的に原理化されたアプローチである。
論文 参考訳(メタデータ) (2025-06-02T18:35:30Z) - Exploring Criteria of Loss Reweighting to Enhance LLM Unlearning [66.8042627609456]
損失再重み付けは、大きな言語モデル(LLM)を用いた機械学習において大きなメリットを示している。
本稿では,損失再重み付け,すなわち飽和と重要度という2つの異なる目標を同定する。
飽和度と重要度の両方の利点を組み合わせた簡易な再重み付け手法であるSatImpを提案する。
論文 参考訳(メタデータ) (2025-05-17T10:41:22Z) - Fine-Tuning LLMs on Small Medical Datasets: Text Classification and Normalization Effectiveness on Cardiology reports and Discharge records [0.07499722271664144]
テキスト分類と名前付きエンティティ認識タスクのための小さな医療データセットに対する細調整大言語モデル(LLM)の有効性について検討する。
実験の結果,微調整は両タスクのパフォーマンスを向上し,200-300のトレーニング例では顕著な改善が見られた。
論文 参考訳(メタデータ) (2025-03-27T10:35:56Z) - A Semi-supervised CART Model for Covariate Shift [0.0]
本稿では,重み付けを用いた半教師付き分類・回帰木(CART)を提案する。
本手法は,トレーニングサンプルに重みを割り当てることで,CARTモデルの予測性能を向上させる。
実世界の医療データに対するシミュレーション研究と応用を通して,予測精度の大幅な向上を示す。
論文 参考訳(メタデータ) (2024-10-28T12:53:23Z) - SoftDedup: an Efficient Data Reweighting Method for Speeding Up Language Model Pre-training [12.745160748376794]
本稿では,データセットの整合性を維持しつつ,データのサンプリング重量を高い共通度で選択的に削減するソフトデ重複手法を提案する。
このアプローチの中心にあるのは、重複の度合いを定量化する指標である"データ共通性"(data commonness)の概念です。
経験的分析により、この手法はトレーニング効率を著しく改善し、必要なトレーニングステップを少なくとも26%減らすことなく、同等のパープレキシティスコアを達成できることが示されている。
論文 参考訳(メタデータ) (2024-07-09T08:26:39Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - On the Robustness of Pretraining and Self-Supervision for a Deep
Learning-based Analysis of Diabetic Retinopathy [70.71457102672545]
糖尿病網膜症における訓練方法の違いによる影響を比較検討した。
本稿では,定量的性能,学習した特徴表現の統計,解釈可能性,画像歪みに対する頑健性など,さまざまな側面について検討する。
以上の結果から,ImageNet事前学習モデルでは,画像歪みに対する性能,一般化,堅牢性が著しく向上していることが示唆された。
論文 参考訳(メタデータ) (2021-06-25T08:32:45Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。