論文の概要: DERM-3R: A Resource-Efficient Multimodal Agents Framework for Dermatologic Diagnosis and Treatment in Real-World Clinical Settings
- arxiv url: http://arxiv.org/abs/2604.09596v1
- Date: Fri, 06 Mar 2026 14:19:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.531361
- Title: DERM-3R: A Resource-Efficient Multimodal Agents Framework for Dermatologic Diagnosis and Treatment in Real-World Clinical Settings
- Title(参考訳): DERM-3R : 実地臨床における皮膚科診断・治療のための資源効率のよいマルチモーダル・エージェント・フレームワーク
- Authors: Ziwen Chen, Zhendong Wang, Chongjing Wang, Yurui Dong, Luozhijie Jin, Jihao Gu, Kui Chen, Jiaxi Yang, Bingjie Lu, Zhou Zhang, Jirui Dai, Changyong Luo, Xiameng Gai, Haibing Lan, Zhi Liu,
- Abstract要約: 皮膚科の病気は地球規模で重荷を負い、数十億の生命に影響を及ぼし、生活の質を大幅に低下させる。
伝統的な中国医学は、シンドロームの分化と個別化治療を通じて補完的な総合的なアプローチを提供する。
我々は,限られたデータと計算条件下でのTCM皮膚科診断と治療をモデル化するための資源効率の高いマルチモーダルエージェントフレームワークであるDERM-3Rを提案する。
- 参考スコア(独自算出の注目度): 22.425860818661615
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Dermatologic diseases impose a large and growing global burden, affecting billions and substantially reducing quality of life. While modern therapies can rapidly control acute symptoms, long-term outcomes are often limited by single-target paradigms, recurrent courses, and insufficient attention to systemic comorbidities. Traditional Chinese medicine (TCM) provides a complementary holistic approach via syndrome differentiation and individualized treatment, but practice is hindered by non-standardized knowledge, incomplete multimodal records, and poor scalability of expert reasoning. We propose DERM-3R, a resource-efficient multimodal agent framework to model TCM dermatologic diagnosis and treatment under limited data and compute. Based on real-world workflows, we reformulate decision-making into three core issues: fine-grained lesion recognition, multi-view lesion representation with specialist-level pathogenesis modeling, and holistic reasoning for syndrome differentiation and treatment planning. DERM-3R comprises three collaborative agents: DERM-Rec, DERM-Rep, and DERM-Reason, each targeting one component of this pipeline. Built on a lightweight multimodal LLM and partially fine-tuned on 103 real-world TCM psoriasis cases, DERM-3R performs strongly across dermatologic reasoning tasks. Evaluations using automatic metrics, LLM-as-a-judge, and physician assessment show that despite minimal data and parameter updates, DERM-3R matches or surpasses large general-purpose multimodal models. These results suggest structured, domain-aware multi-agent modeling can be a practical alternative to brute-force scaling for complex clinical tasks in dermatology and integrative medicine.
- Abstract(参考訳): 皮膚科の病気は地球規模で重荷を負い、数十億の生命に影響を及ぼし、生活の質を大幅に低下させる。
近代的な治療法は急性症状を迅速にコントロールできるが、長期的な結果はしばしば、単一目標のパラダイム、反復コース、全身的な協調性への注意不足によって制限される。
伝統的な中国医学(TCM)は、シンドロームの分化と個別化治療を通じて補完的な総合的なアプローチを提供するが、実践は非標準化知識、不完全なマルチモーダル記録、専門家による推論のスケーラビリティの低下によって妨げられている。
我々は,限られたデータと計算条件下でのTCM皮膚科診断と治療をモデル化するための資源効率の高いマルチモーダルエージェントフレームワークであるDERM-3Rを提案する。
実世界のワークフローに基づいて、我々は意思決定を、きめ細かい病変認識、専門レベルの病原性モデリングによる多視点病変表現、およびシンドロームの分化と治療計画のための全体論的推論の3つの問題に再構成する。
DERM-3Rは、DRM-Rec、DRM-Rep、DRM-Reasonの3つの協調エージェントから構成され、それぞれパイプラインの1つのコンポーネントをターゲットにしている。
DERM-3Rは軽量なマルチモーダルLLM上に構築され、103の現実世界のTCM乾皮症に対して部分的に微調整され、皮膚学的な推論タスクで強く機能する。
自動測定, LLM-as-a-judge, 医師による評価は, 最小限のデータとパラメータの更新にもかかわらず, DERM-3Rは大規模な汎用マルチモーダルモデルに適合するか, あるいは超えていることを示している。
これらの結果から, 構造的, ドメイン認識型マルチエージェントモデリングは, 皮膚科・統合医学における複雑な臨床タスクに対するブルートフォーススケーリングの代替となる可能性が示唆された。
関連論文リスト
- MMedExpert-R1: Strengthening Multimodal Medical Reasoning via Domain-Specific Adaptation and Clinical Guideline Reinforcement [63.82954136824963]
医療ビジョンランゲージモデルでは、現実世界のシナリオで必要とされる複雑な臨床推論を伴う知覚タスクが優れている。
本稿ではドメイン固有の適応とガイドライン強化を通じてこれらの課題に対処する新しい推論MedVLMを提案する。
論文 参考訳(メタデータ) (2026-01-16T02:32:07Z) - Multi-Agent Intelligence for Multidisciplinary Decision-Making in Gastrointestinal Oncology [13.663415863327996]
ヒト多部門チーム(MDT)の協調ワークフローをエミュレートした階層型マルチエージェントフレームワークを提案する。
このシステムは4.60/5.00の総合評価スコアを獲得し、モノリシック基線よりも大幅に改善された。
この結果は,腫瘍学における自動意思決定支援のための,緩和的,エージェントベースの協調作業が,スケーラブルで解釈可能,かつ,臨床的に堅牢なパラダイムを提供することを示している。
論文 参考訳(メタデータ) (2025-12-09T14:56:40Z) - RAD: Towards Trustworthy Retrieval-Augmented Multi-modal Clinical Diagnosis [56.373297358647655]
Retrieval-Augmented Diagnosis (RAD)は、下流タスクで直接マルチモーダルモデルに外部知識を注入する新しいフレームワークである。
RADは、複数の医療ソースからの疾患中心の知識の検索と改善、ガイドライン強化コントラスト損失トランスフォーマー、デュアルデコーダの3つの主要なメカニズムで機能する。
論文 参考訳(メタデータ) (2025-09-24T10:36:14Z) - MeD-3D: A Multimodal Deep Learning Framework for Precise Recurrence Prediction in Clear Cell Renal Cell Carcinoma (ccRCC) [0.0]
本研究では、CT、MRI、病理組織像全体(WSI)、臨床データ、ゲノムプロファイルを含む多モードデータを統合するディープラーニング(DL)フレームワークを提案する。
このフレームワークは、特定のモダリティが欠如している場合でも推論を可能にすることで、臨床環境で共通の課題である不完全なデータを扱うように設計されている。
論文 参考訳(メタデータ) (2025-07-10T15:11:09Z) - MMedAgent-RL: Optimizing Multi-Agent Collaboration for Multimodal Medical Reasoning [63.63542462400175]
医療エージェント間の動的に最適化された協調を可能にする強化学習に基づくマルチエージェントフレームワークMMedAgent-RLを提案する。
具体的には、Qwen2.5-VLに基づく2つのGPエージェントをRLを介して訓練する: トリアージ医師は患者を適切な専門分野に割り当てることを学ぶ一方、主治医はマルチスペシャリストの判断を統合する。
5つのVQAベンチマークの実験では、MMedAgent-RLはオープンソースおよびプロプライエタリなMed-LVLMよりも優れており、人間のような推論パターンも示している。
論文 参考訳(メタデータ) (2025-05-31T13:22:55Z) - InfiMed: Low-Resource Medical MLLMs with Advancing Understanding and Reasoning [19.791150694039466]
InfiMed-SFT-3B と InfiMed-RL-3B は7つのマルチモーダル医療ベンチマークで最先端のパフォーマンスを実現する。
InfiMed-RL-3Bの平均精度は59.2%であり、InternVL3-8Bのような大型モデルよりも57.3%高い。
論文 参考訳(メタデータ) (2025-05-29T10:31:57Z) - DoctorAgent-RL: A Multi-Agent Collaborative Reinforcement Learning System for Multi-Turn Clinical Dialogue [18.814676128928234]
大規模言語モデル (LLMs) は, バイオメディカルな質問応答の分野で優れた能力を発揮してきたが, 実際の臨床研究への応用はいまだに課題に直面している。
我々は,医療相談を不確実性下での動的意思決定プロセスとしてモデル化する,強化学習(RL)に基づくマルチエージェント協調フレームワークであるOursを提案する。
本手法は,医療資源の配分を最適化し,労働力不足を緩和する戦略の草分けとして,時間的プレッシャーによる誤診リスクの低減,複雑な症例に対する臨床医の解放,医療資源配分の最適化,労働力不足の緩和など,極めて実践的な価値を示す。
論文 参考訳(メタデータ) (2025-05-26T07:48:14Z) - End-to-End Breast Cancer Radiotherapy Planning via LMMs with Consistency Embedding [47.360760580820966]
放射線腫瘍学の分野に適した包括的大規模マルチモーダルモデル(LMM)であるRO-LMMを提案する。
このモデルは臨床ワークフロー内の一連のタスクを効果的に管理し、臨床コンテキストの要約、放射線治療計画の提案、計画誘導されたターゲットボリュームセグメンテーションを含む。
クリーン入力処理の整合性を維持しつつ,LMMのノイズ入力に対する堅牢性を向上する,CEFTune(Consistency Embedding Fine-Tuning)技術を提案する。
論文 参考訳(メタデータ) (2023-11-27T14:49:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。