論文の概要: SemEnrich: Self-Supervised Semantic Enrichment of Radiology Reports for Vision-Language Learning
- arxiv url: http://arxiv.org/abs/2604.09887v1
- Date: Fri, 10 Apr 2026 20:30:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.730648
- Title: SemEnrich: Self-Supervised Semantic Enrichment of Radiology Reports for Vision-Language Learning
- Title(参考訳): SemEnrich: ビジョンランゲージ学習のための放射線学レポートの自己監督型セマンティックエンリッチ
- Authors: Halil Ibrahim Gulluk, Olivier Gevaert,
- Abstract要約: 医療用視覚言語データセットはサイズが制限され、ネガティブな結果に偏っていることが多い。
本稿では,レポート文のセマンティッククラスタリングを利用した自己教師付きデータ強化手法を提案する。
我々は,異なるクラスタからの正・中性観測を自己監督的に追加することにより,トレーニングセットにおける知見を充実させる。
- 参考スコア(独自算出の注目度): 2.7579377082303673
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical vision-language datasets are often limited in size and biased toward negative findings, as clinicians report abnormalities mostly but might omit some positive/neutral findings because they might be considered as irrelevant to the patient's condition. We propose a self-supervised data enrichment method that leverages semantic clustering of report sentences. Then we enrich the findings in the medical reports in the training set by adding positive/neutral observations from different clusters in a self-supervised manner. Our approach yields consistent gains in supervised fine-tuning (5.63%, 3.04%, 7.40%, 5.30%, 7.47% average gains on COMET score, Bert score, Sentence Bleu, CheXbert-F1 and RadGraph-F1 scores respectively). Ablation studies confirm that improvements stem from semantic clustering rather than random augmentation. Furthermore, we introduce a way to incorporate semantic cluster information into the reward design for GRPO training, which leads to further performance gains (2.78%, 3.14%, 12.80% average gains on COMET score, Bert score and Sentence Bleu scores respectively). We share our code at https://anonymous.4open.science/r/SemEnrich-75CF
- Abstract(参考訳): 医学的視覚言語データセットは、しばしばサイズに制限され、否定的な発見に偏っているが、臨床医は、主に異常を報告しているが、患者の状態に無関係であると考えられるため、いくつかの陽性/中性所見を省略する可能性がある。
本稿では,レポート文のセマンティッククラスタリングを利用した自己教師付きデータ強化手法を提案する。
次に,異なるクラスタからの正・中性観察を自己監督的に追加することにより,トレーニングセットにおける医療報告の知見を充実させる。
我々の手法は監督された微調整において一貫した利得をもたらす(COMETスコアでは5.63%,3.04%,7.40%,5.30%,7.47%,BertスコアではSentence Bleu,CheXbert-F1,RadGraph-F1スコアでは7.47%)。
アブレーション研究により、改善はランダムな拡張ではなくセマンティッククラスタリングに由来することが確認された。
さらに、セマンティッククラスタ情報をGRPOトレーニングの報酬設計に組み込む方法を導入し、さらなるパフォーマンス向上をもたらす(COMETスコアの2.78%、3.14%、12.80%、Bertスコア、Sentence Bleuスコア)。
私たちはコードをhttps://anonymous.4open.science/r/SemEnrich-75CFで共有しています。
関連論文リスト
- Evaluating Generative AI as an Educational Tool for Radiology Resident Report Drafting [1.5457333450799497]
本研究は,HIPAA 準拠の GPT-4o システムを用いて,実地臨床環境において住民が作成した乳房画像報告を自動的にフィードバックするシステムについて検討した。
1) キー発見の欠落または追加,(2) 技術的記述子の誤用または欠落,(3) 結果と一致しない最終評価の3つの一般的な誤り型が同定された。
GPT-4oは、90.5%、78.3%、90.4%のエラータイプで、コンセンサスに強く同意している。
論文 参考訳(メタデータ) (2025-09-22T20:51:09Z) - InfoNCE is a Free Lunch for Semantically guided Graph Contrastive Learning [60.61079931266331]
グラフコントラスト学習(GCL)は、グラフ基盤モデルやLLMの研究の急増において、グラフのエンハンサーとして重要な役割を担っている。
従来のGCLでは、自己監督タスクの定義に拡張を使用し、強化ペアを正のサンプルとして、その他のものを負のサンプルとして扱う。
本稿では,GCLは基本的に,自己教師型タスクの定義を意味的に導くべき,肯定的非ラベル付き学習問題である,と論じる。
論文 参考訳(メタデータ) (2025-05-07T05:27:36Z) - Evaluating the Effectiveness of the Foundational Models for Q&A Classification in Mental Health care [0.18416014644193068]
プレトレーニング言語モデル(PLM)は、メンタルヘルスを変革する可能性がある。
本研究は,精神保健領域における質問紙と回答紙の分類におけるPLMの有効性を評価するものである。
論文 参考訳(メタデータ) (2024-06-23T00:11:07Z) - ReCAP: Recursive Cross Attention Network for Pseudo-Label Generation in Robotic Surgical Skill Assessment [40.09498356923132]
外科的スキル評価において、OATS(Objective Assessments of Technical Skills)とGRS(Global Rating Scale)は、訓練中の外科医を評価するための確立されたツールである。
最近の研究は、運動データ、ビデオ、またはそれらの組み合わせからGRSスコアを回帰することに焦点を当てている。
我々は,OSATSのスコアを集計し,外科的臨床試験において臨床的に有意な変動を見落としているため,GRSのみの回帰は限界であると主張している。
論文 参考訳(メタデータ) (2024-04-22T10:33:06Z) - CLIP the Bias: How Useful is Balancing Data in Multimodal Learning? [72.19502317793133]
比較言語画像事前学習(CLIP)におけるバイアス軽減のためのデータバランスの有効性について検討する。
表現バイアスと相関バイアスの両方を低減するために,Multi-Modal Moment Matching (M4) と呼ばれる新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-03-07T14:43:17Z) - Automatically measuring speech fluency in people with aphasia: first
achievements using read-speech data [55.84746218227712]
本研究の目的は,言語習得の分野で開発された信号処理algorithmの関連性を評価することである。
論文 参考訳(メタデータ) (2023-08-09T07:51:40Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Assessment of contextualised representations in detecting outcome
phrases in clinical trials [14.584741378279316]
本稿では,300 PubMed の要約を専門的に注釈付けしたデータセット "EBM-COMET" を紹介する。
結果の抽出には,事前学習した文脈表現を微調整する。
ベストモデル(BioBERT)は81.5%のF1、81.3%の感度、98.0%の特異性を達成している。
論文 参考訳(メタデータ) (2022-02-13T15:08:00Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Deep F-measure Maximization for End-to-End Speech Understanding [52.36496114728355]
本稿では,F測度に対する微分可能な近似法を提案し,標準バックプロパゲーションを用いてネットワークをトレーニングする。
我々は、アダルト、コミュニティ、犯罪の2つの標準フェアネスデータセットの実験を行い、ATISデータセットの音声・インテリジェンス検出と音声・COCOデータセットの音声・イメージ概念分類を行った。
これらの4つのタスクのすべてにおいて、F測定は、クロスエントロピー損失関数で訓練されたモデルと比較して、最大8%の絶対的な絶対的な改善を含む、マイクロF1スコアの改善をもたらす。
論文 参考訳(メタデータ) (2020-08-08T03:02:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。