論文の概要: Skin-R1: Toward Trustworthy Clinical Reasoning for Dermatological Diagnosis
- arxiv url: http://arxiv.org/abs/2511.14900v1
- Date: Tue, 18 Nov 2025 20:38:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.521615
- Title: Skin-R1: Toward Trustworthy Clinical Reasoning for Dermatological Diagnosis
- Title(参考訳): Skin-R1 : 皮膚科診断のための信頼できる臨床推論に向けて
- Authors: Zehao Liu, Wejieying Ren, Jipeng Zhang, Tianxiang Zhao, Jingxi Zhu, Xiaoting Li, Vasant G. Honavar,
- Abstract要約: SkinR1は、深い教科書に基づく推論と強化学習(RL)の広範な一般化能力を組み合わせた新しい皮膚視覚言語モデル(VLM)である。
まず、高忠実度、階層認識、差動診断(DDx)インフォームド・トラジェクトリを合成する教科書ベースの推論生成器を設計する。
第2に,教師付き微調整(SFT)に構築された軌道を利用して,基礎的推論能力を持つモデルを実現する。
- 参考スコア(独自算出の注目度): 27.666376727163073
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The emergence of vision-language models (VLMs) has opened new possibilities for clinical reasoning and has shown promising performance in dermatological diagnosis. However, their trustworthiness and clinical utility are often limited by three major factors: (1) Data heterogeneity, where diverse datasets lack consistent diagnostic labels and clinical concept annotations; (2) Absence of grounded diagnostic rationales, leading to a scarcity of reliable reasoning supervision; and (3) Limited scalability and generalization, as models trained on small, densely annotated datasets struggle to transfer nuanced reasoning to large, sparsely-annotated ones. To address these limitations, we propose SkinR1, a novel dermatological VLM that combines deep, textbook-based reasoning with the broad generalization capabilities of reinforcement learning (RL). SkinR1 systematically resolves the key challenges through a unified, end-to-end framework. First, we design a textbook-based reasoning generator that synthesizes high-fidelity, hierarchy-aware, and differential-diagnosis (DDx)-informed trajectories, providing reliable expert-level supervision. Second, we leverage the constructed trajectories for supervised fine-tuning (SFT) empowering the model with grounded reasoning ability. Third, we develop a novel RL paradigm that, by incorporating the hierarchical structure of diseases, effectively transfers these grounded reasoning patterns to large-scale, sparse data. Extensive experiments on multiple dermatology datasets demonstrate that SkinR1 achieves superior diagnostic accuracy. The ablation study demonstrates the importance of the reasoning foundation instilled by SFT.
- Abstract(参考訳): 視覚言語モデル(VLM)の出現は、臨床推論の新しい可能性を開き、皮膚科診断において有望な性能を示した。
しかし,その信頼性と臨床的有用性は,(1) 多様なデータセットが一貫した診断ラベルや臨床概念アノテーションを欠いているデータ不均一性,(2) 根拠となる診断的根拠の欠如,(3) 信頼性の高い推論監督の欠如,(3) 小型で密度の高い注釈付きデータセットで訓練されたモデルが,比較的拡張性と一般化を困難にしている,という3つの主要な要因によって制限されることが多い。
これらの制約に対処するため、本研究では、深層テキストに基づく推論と強化学習(RL)の広範な一般化機能を組み合わせた、新しい皮膚学的なVLMであるSkinR1を提案する。
SkinR1は、統一されたエンドツーエンドフレームワークを通じて、重要な課題を体系的に解決する。
まず,高忠実度,階層認識,差動診断(DDx)インフォームド・トラジェクトリを合成する教科書ベースの推論生成器を設計し,信頼性の高い専門家レベルの監視を実現する。
第二に、構築された軌道を利用して、基礎的推論能力を持つモデルを強化する教師付き微調整(SFT)を行う。
第3に,疾患の階層構造を取り入れた新しいRLパラダイムを開発し,これらの基礎的推論パターンを大規模でスパースなデータに効果的に転送する。
複数の皮膚科学データセットに対する大規模な実験は、SkinR1がより優れた診断精度を達成することを示した。
アブレーション研究は、SFTが取り入れた推論基盤の重要性を示している。
関連論文リスト
- OncoReason: Structuring Clinical Reasoning in LLMs for Robust and Interpretable Survival Prediction [2.904892426557913]
大規模言語モデル (LLM) は, バイオメディカルNLPにおいて高い性能を示した。
本稿では,自己回帰型LPMと結果予測のための臨床推論を整合させる,統合型マルチタスク学習フレームワークを提案する。
マルチタスク・クリニカル・モデリングにおける推論・アライメントの重要性について検討した。
論文 参考訳(メタデータ) (2025-10-20T13:35:12Z) - Interpretable Neuropsychiatric Diagnosis via Concept-Guided Graph Neural Networks [56.75602443936853]
青少年の5人に1人は、不安、うつ病、行動障害などの精神状態または行動の健康状態と診断されている。
従来の研究では、障害予測にグラフニューラルネットワーク(GNN)アプローチを使用していたが、ブラックボックスのままであり、信頼性と臨床翻訳を制限している。
本研究では,解釈可能な機能接続の概念を符号化する概念に基づく診断フレームワークを提案する。
我々の設計は臨床的に意味のある接続パターンを通じて予測を保証し、解釈可能性と強い予測性能の両方を可能にする。
論文 参考訳(メタデータ) (2025-10-02T19:38:46Z) - RAD: Towards Trustworthy Retrieval-Augmented Multi-modal Clinical Diagnosis [56.373297358647655]
Retrieval-Augmented Diagnosis (RAD)は、下流タスクで直接マルチモーダルモデルに外部知識を注入する新しいフレームワークである。
RADは、複数の医療ソースからの疾患中心の知識の検索と改善、ガイドライン強化コントラスト損失トランスフォーマー、デュアルデコーダの3つの主要なメカニズムで機能する。
論文 参考訳(メタデータ) (2025-09-24T10:36:14Z) - Self-Supervised Cross-Encoder for Neurodegenerative Disease Diagnosis [6.226851122403944]
縦型MRIスキャンにおける時間的連続性を利用した自己監督型クロスエンコーダフレームワークを提案する。
このフレームワークは、学習した表現を2つのコンポーネントに分解する: 静的表現は、対照的な学習によって制約され、安定した解剖学的特徴を捉え、動的表現は、時間的変化を反映する入力漸進正規化によってガイドされる。
アルツハイマー病神経画像イニシアチブデータセットの実験結果から,本手法は分類精度が向上し,解釈性が向上することが示された。
論文 参考訳(メタデータ) (2025-09-09T11:52:24Z) - DermINO: Hybrid Pretraining for a Versatile Dermatology Foundation Model [92.66916452260553]
DermNIOは皮膚科学の多目的基盤モデルである。
自己教師型学習パラダイムを増強する、新しいハイブリッド事前学習フレームワークが組み込まれている。
さまざまなタスクにおいて、最先端のモデルよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-08-17T00:41:39Z) - Improving ARDS Diagnosis Through Context-Aware Concept Bottleneck Models [2.3802351706765017]
病気を理解するための新しいリソースとして、大規模で一般公開された臨床データセットが登場した。
これらのデータセットは、もともと研究目的で収集されていないデータから派生しており、その結果、しばしば不完全であり、重要なラベルが欠落している。
多くのAIツールは、疾患分類を実行するなど、これらのデータセットを振り返ってラベル付けするために開発されている。
従来の研究は、高レベルな臨床概念にマッピングする解釈可能な概念を学ぶConcept Bottleneck Models (CBMs)を用いて、予測を説明しようと試みてきた。
我々は,急性呼吸障害症候群(ARDS)の診断を,臨床ノートからコンテキスト情報を取り入れて改善することの価値を実証するために,挑戦的なテストケースとして用いている。
論文 参考訳(メタデータ) (2025-08-13T11:19:30Z) - An Explainable Diagnostic Framework for Neurodegenerative Dementias via Reinforcement-Optimized LLM Reasoning [1.5646349560044959]
診断透明性を高めるために2つのコアコンポーネントを統合するフレームワークを提案する。
まず,3次元T1強調脳MRIをテキスト・ラジオグラフィー・レポートに変換するモジュールパイプラインを提案する。
第2に,現代大規模言語モデル(LLM)の可能性を探り,臨床医の鑑別診断を支援する。
論文 参考訳(メタデータ) (2025-05-26T13:18:32Z) - SkinGEN: an Explainable Dermatology Diagnosis-to-Generation Framework with Interactive Vision-Language Models [54.32264601568605]
SkinGENは、VLMが提供する診断結果から参照デモを生成する、診断から生成までのフレームワークである。
システム性能と説明可能性の両方を評価するために,32人の参加者によるユーザスタディを実施している。
その結果、SkinGENはVLM予測に対するユーザの理解を著しく改善し、診断プロセスへの信頼を高めることが示されている。
論文 参考訳(メタデータ) (2024-04-23T05:36:33Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。