論文の概要: Suppressing Prior-Comparison Hallucinations in Radiology Report Generation via Semantically Decoupled Latent Steering
- arxiv url: http://arxiv.org/abs/2602.23676v1
- Date: Fri, 27 Feb 2026 04:49:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-02 19:48:24.255146
- Title: Suppressing Prior-Comparison Hallucinations in Radiology Report Generation via Semantically Decoupled Latent Steering
- Title(参考訳): セマンティックデカップリング型潜伏ステアリングによる放射線学レポート作成における先行比較幻覚の抑制
- Authors: Ao Li, Rui Liu, Mingjie Li, Sheng Liu, Lei Wang, Xiaodan Liang, Lina Yao, Xiaojun Chang, Lei Xing,
- Abstract要約: 本研究では,Semantically Decoupled Latent Steeringと呼ばれる学習自由な推論時間制御フレームワークを開発した。
提案手法は,大言語モデル (LLM) による意味分解による意味のない介入ベクトルを構築する。
本手法は歴史的幻覚の可能性を著しく低下させることを示す。
- 参考スコア(独自算出の注目度): 94.37535002230504
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated radiology report generation using vision-language models (VLMs) is limited by the risk of prior-comparison hallucination, where the model generates historical findings unsupported by the current study. We address this challenge with a training-free, inference-time control framework termed Semantically Decoupled Latent Steering (SDLS). Unlike generic activation steering, which often suffers from semantic entanglement, our approach constructs a semantic-free intervention vector via large language model (LLM)-driven semantic decomposition followed by $QR$-based orthogonalization. This orthogonalization step is critical. It leverages geometric constraints to filter out the clinical semantics often entangled in standard principal component analysis (PCA) directions, ensuring that the steering vector targets only the ``historical comparison" axis. We validate our method on the BiomedGPT foundation model, demonstrating that it overcomes the trade-off between hallucination suppression and clinical accuracy. Extensive experiments on MIMIC-CXR, and zero-shot transfer evaluation on CheXpert Plus and IU-Xray, demonstrate the robustness of our approach. Quantitative evaluations on MIMIC-CXR show that our approach significantly reduces the probability of historical hallucinations (FilBERT score decreases from 0.2373 to 0.1889) and improves clinical label fidelity (CheXpert macro-F1 increases from 0.2242 to 0.3208). Supplementary evaluations confirm that the structural integrity of the clinical narrative is maintained.
- Abstract(参考訳): 視覚言語モデル(VLM)を用いた自動放射線学レポート生成は,過去の幻覚のリスクによって制限される。
本課題は,Semantically Decoupled Latent Steering (SDLS) と呼ばれる,トレーニング不要な推論時間制御フレームワークを用いて解決する。
セマンティックエンタングルメントに悩まされる一般的なアクティベーションステアリングとは違い,我々のアプローチでは,大言語モデル(LLM)によるセマンティック分解と$QR$ベースの直交化によるセマンティックフリー介入ベクターを構築している。
この直交化のステップは重要だ。
幾何学的制約を利用して、しばしば標準主成分分析(PCA)方向に絡み合った臨床的意味論をフィルタリングし、ステアリングベクトルが「歴史的比較」軸のみを目標とすることを保証する。
本手法をBiomedGPTファンデーションモデルで検証し,幻覚抑制と臨床精度のトレードオフを克服できることを実証した。
MIMIC-CXRの広範囲な実験と、CheXpert PlusとIU-Xrayのゼロショット転送評価は、我々のアプローチの堅牢性を示している。
MIMIC-CXRの定量的評価から,本手法は歴史的幻覚の可能性を著しく低下させる(FilBERTスコアは0.2373から0.1889に低下)とともに,臨床ラベルの忠実度を向上させる(CheXpert macro-F1は0.2242から0.3208に上昇)。
補助的評価により,臨床物語の構造的整合性が維持されていることが確認された。
関連論文リスト
- Cross-Linguistic Persona-Driven Data Synthesis for Robust Multimodal Cognitive Decline Detection [20.599682298329213]
我々は、制御可能なゼロショットマルチモーダルデータ合成とChain-of-Thought deductionファインチューニングを統合する新しいフレームワークであるSynCogを紹介する。
この生成パラダイムは、様々な言語にまたがる臨床コーパスの迅速でゼロショット展開を可能にする。
ADReSSとADReSSoベンチマークの実験は、限られた臨床データを合成表現型で増強することで、競争力のある診断性能が得られることを示した。
論文 参考訳(メタデータ) (2026-02-08T14:10:05Z) - SurvKAN: A Fully Parametric Survival Model Based on Kolmogorov-Arnold Networks [7.352227733654751]
Kolmogorov-Arnold Networks (KAN) に基づく完全パラメトリック・時間連続生存モデルであるSurvKANを紹介する。
SurvKANは時間を、ログハザード関数を直接予測するkanへの明示的な入力として扱い、完全な生存可能性に関するエンドツーエンドのトレーニングを可能にする。
論文 参考訳(メタデータ) (2026-02-02T14:49:14Z) - ClinNet: Evidential Ordinal Regression with Bilateral Asymmetry and Prototype Memory for Knee Osteoarthritis Grading [3.337151338735509]
X線画像に基づく膝関節症(KOA)の診断は極めて難しい課題である。
本研究では, KOA グレーディングに対処する信頼性の高い新しいフレームワーク ClinNet を提案する。
論文 参考訳(メタデータ) (2026-01-24T05:49:41Z) - Conformal Lesion Segmentation for 3D Medical Images [82.92159832699583]
本稿では,データ駆動しきい値の校正をコンフォーマル化することで,テスト時間FNRが目標許容値以下であることを保証する,リスク制約付きフレームワークを提案する。
5つのバックボーンモデルにまたがる6つの3D-LSデータセット上でのCLSの統計的健全性と予測性能を検証し,臨床実践におけるリスク認識セグメンテーションの展開に関する実用的な知見を得た。
論文 参考訳(メタデータ) (2025-10-19T08:21:00Z) - Measuring Sample Quality with Copula Discrepancies [0.0]
Copula Discrepancy (CD) は、依存構造に対する原理的かつ計算学的に効率的な診断である。
我々の理論的枠組みは、近似推論の時代に特化して設計された最初の構造認識診断を提供する。
計算オーバーヘッドのオーバヘッドは、既存のスタインの差よりも桁違いに低いため、CDはMCMC実践者にとって即時的な実用価値と、次世代の構造を意識したサンプル品質評価の理論的基礎の両方を提供する。
論文 参考訳(メタデータ) (2025-07-29T02:11:45Z) - Diffusion with a Linguistic Compass: Steering the Generation of Clinically Plausible Future sMRI Representations for Early MCI Conversion Prediction [13.937881108738042]
そこで本研究では,臨床応用可能な将来のsMRI表現を直接ベースラインデータから合成する拡散型フレームワークを提案する。
ADNIとAIBLのコホートの実験では、MCI-Diffは最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-06-05T07:01:05Z) - CRTRE: Causal Rule Generation with Target Trial Emulation Framework [47.2836994469923]
ターゲットトライアルエミュレーションフレームワーク(CRTRE)を用いた因果ルール生成という新しい手法を提案する。
CRTREは、アソシエーションルールの因果効果を推定するためにランダム化トライアル設計原則を適用している。
次に、病気発症予測などの下流アプリケーションにそのような関連ルールを組み込む。
論文 参考訳(メタデータ) (2024-11-10T02:40:06Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Bayesian prognostic covariate adjustment [59.75318183140857]
疾患の結果に関する歴史的データは、様々な方法で臨床試験の分析に組み込むことができる。
我々は, 予測モデルからの予後スコアを用いて, 治療効果推定の効率を向上する既存の文献に基づいて構築する。
論文 参考訳(メタデータ) (2020-12-24T05:19:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。