論文の概要: SkinGPT-X: A Self-Evolving Collaborative Multi-Agent System for Transparent and Trustworthy Dermatological Diagnosis
- arxiv url: http://arxiv.org/abs/2603.26122v1
- Date: Fri, 27 Mar 2026 07:14:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.381013
- Title: SkinGPT-X: A Self-Evolving Collaborative Multi-Agent System for Transparent and Trustworthy Dermatological Diagnosis
- Title(参考訳): SkinGPT-X : 透明で信頼性の高い皮膚科診断のための自己進化型多エージェントシステム
- Authors: Zhangtianyi Chen, Yuhao Shen, Florensia Widjaja, Yan Xu, Liyuan Sun, Zijian Wang, Hongyi Chen, Wufei Dai, Juexiao Zhou,
- Abstract要約: SkinGPT-Xは,自己進化型皮膚科記憶機構と統合された皮膚科診断のための協調的マルチエージェントシステムである。
皮膚科医の診断ワークフローをシミュレートすることで、SkinGPT-Xは、複雑で稀な皮膚科の症例を管理するための透明で信頼できる診断を提供する。
- 参考スコア(独自算出の注目度): 8.619027630628366
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While recent advancements in Large Language Models have significantly advanced dermatological diagnosis, monolithic LLMs frequently struggle with fine-grained, large-scale multi-class diagnostic tasks and rare skin disease diagnosis owing to training data sparsity, while also lacking the interpretability and traceability essential for clinical reasoning. Although multi-agent systems can offer more transparent and explainable diagnostics, existing frameworks are primarily concentrated on Visual Question Answering and conversational tasks, and their heavy reliance on static knowledge bases restricts adaptability in complex real-world clinical settings. Here, we present SkinGPT-X, a multimodal collaborative multi-agent system for dermatological diagnosis integrated with a self-evolving dermatological memory mechanism. By simulating the diagnostic workflow of dermatologists and enabling continuous memory evolution, SkinGPT-X delivers transparent and trustworthy diagnostics for the management of complex and rare dermatological cases. To validate the robustness of SkinGPT-X, we design a three-tier comparative experiment. First, we benchmark SkinGPT-X against four state-of-the-art LLMs across four public datasets, demonstrating its state-of-the-art performance with a +9.6% accuracy improvement on DDI31 and +13% weighted F1 gain on Dermnet over the state-of-the-art model. Second, we construct a large-scale multi-class dataset covering 498 distinct dermatological categories to evaluate its fine-grained classification capabilities. Finally, we curate the rare skin disease dataset, the first benchmark to address the scarcity of clinical rare skin diseases which contains 564 clinical samples with eight rare dermatological diseases. On this dataset, SkinGPT-X achieves a +9.8% accuracy improvement, a +7.1% weighted F1 improvement, a +10% Cohen's Kappa improvement.
- Abstract(参考訳): 近年の大規模言語モデルの進歩は皮膚学的な診断が著しく進んでいるが、モノリシックLLMは、データ空間の訓練による細粒度で大規模なマルチクラス診断やまれな皮膚疾患の診断にしばしば苦労する一方で、臨床的推論に不可欠な解釈性とトレーサビリティが欠如している。
マルチエージェントシステムはより透明で説明可能な診断を提供するが、既存のフレームワークは主にビジュアル質問回答と会話タスクに集中しており、静的知識ベースに依存しているため、複雑な実世界の臨床環境における適応性を制限する。
SkinGPT-Xは, 自己進化型皮膚科記憶機構と統合された皮膚診断のためのマルチモーダル協調型マルチエージェントシステムである。
皮膚科医の診断ワークフローをシミュレートし、継続的な記憶の進化を可能にすることにより、SkinGPT-Xは、複雑で稀な皮膚科の症例を管理するための透明で信頼できる診断を提供する。
SkinGPT-Xのロバスト性を検証するため,3層比較実験を設計した。
まず、SkinGPT-Xを4つの公開データセットにわたる4つの最先端LCMに対してベンチマークし、DDI31の精度が+9.6%向上し、Dermnetの重み付きF1ゲインが+13%向上していることを示す。
第2に、498の異なる皮膚科領域をカバーする大規模マルチクラスデータセットを構築し、その粒度分類能力を評価する。
最後に,8例の皮膚疾患を有する564例の臨床サンプルを含む臨床レア皮膚疾患の重症度に関する最初のベンチマークである,レア皮膚疾患データセットをキュレートする。
このデータセットでは、SkinGPT-Xは+9.8%の精度向上、+7.1%の重み付きF1の改善、+10%のコーエンのKappaの改善を実現している。
関連論文リスト
- DermoGPT: Open Weights and Open Data for Morphology-Grounded Dermatological Reasoning MLLMs [54.8829900010621]
MLLM (Multimodal Large Language Models) は、医学的応用を約束するが、限られたトレーニングデータ、狭いタスクカバレッジ、臨床現場での監督の欠如により、皮膚科の遅れが進行する。
これらのギャップに対処するための包括的なフレームワークを提示します。
まず,211,243のイメージと72,675のトラジェクトリを5つのタスク形式に分けた大規模形態素解析コーパスであるDermo Instructを紹介する。
第二にDermoBenchは、4つの臨床軸(形態学、診断、推論、フェアネス)にまたがる11のタスクを評価する厳密なベンチマークで、3600の挑戦的なサブセットを含む。
論文 参考訳(メタデータ) (2026-01-05T07:55:36Z) - Adapting Large Language Models to Mitigate Skin Tone Biases in Clinical Dermatology Tasks: A Mixed-Methods Study [2.3034630097498883]
皮膚疾患に対するSkinGPT-4(SkinGPT-4)の性能バイアスについて検討した。
我々は、SkinGPT-4のバックボーンを利用して、カスタム皮膚疾患分類タスクのための微調整モデルを開発した。
論文 参考訳(メタデータ) (2025-09-28T09:40:40Z) - A Disease-Centric Vision-Language Foundation Model for Precision Oncology in Kidney Cancer [54.58205672910646]
RenalCLIPは、腎腫瘤の特徴、診断、予後のための視覚言語基盤モデルである。
腎がんの完全な臨床ワークフローにまたがる10のコアタスクにおいて、優れたパフォーマンスと優れた一般化性を実現した。
論文 参考訳(メタデータ) (2025-08-22T17:48:19Z) - DermINO: Hybrid Pretraining for a Versatile Dermatology Foundation Model [92.66916452260553]
DermNIOは皮膚科学の多目的基盤モデルである。
自己教師型学習パラダイムを増強する、新しいハイブリッド事前学習フレームワークが組み込まれている。
さまざまなタスクにおいて、最先端のモデルよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-08-17T00:41:39Z) - An Attention-Guided Deep Learning Approach for Classifying 39 Skin Lesion Types [0.9467360130705921]
本研究は,39種類の皮膚病変からなる包括的および多種多様なデータセットをキュレートすることにより,分野を前進させる。
MobileNetV2、Xception、InceptionV3、EfficientNetB1、Vision Transformerの5つの最先端ディープラーニングモデルが厳格に評価されている。
CBAMと統合されたビジョントランスフォーマーモデルは、93.46%の精度、94%の精度、93%のリコール、93%のF1スコア、93.67%の特異性を達成した。
論文 参考訳(メタデータ) (2025-01-10T14:25:01Z) - A Multimodal Vision Foundation Model for Clinical Dermatology [14.481765406970657]
PanDermは、200万以上の現実世界の皮膚疾患の画像に対する自己教師付き学習を通じて事前訓練されたマルチモーダル皮膚科学の基礎モデルである。
PanDermは、評価されたすべてのタスクで最先端のパフォーマンスを達成し、ラベル付きデータの10%しか使用していない場合、しばしば既存のモデルを上回った。
論文 参考訳(メタデータ) (2024-10-19T08:48:01Z) - SkinGEN: an Explainable Dermatology Diagnosis-to-Generation Framework with Interactive Vision-Language Models [54.32264601568605]
SkinGENは、VLMが提供する診断結果から参照デモを生成する、診断から生成までのフレームワークである。
システム性能と説明可能性の両方を評価するために,32人の参加者によるユーザスタディを実施している。
その結果、SkinGENはVLM予測に対するユーザの理解を著しく改善し、診断プロセスへの信頼を高めることが示されている。
論文 参考訳(メタデータ) (2024-04-23T05:36:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。