論文の概要: SkinCAP: A Multi-modal Dermatology Dataset Annotated with Rich Medical Captions
- arxiv url: http://arxiv.org/abs/2405.18004v1
- Date: Tue, 28 May 2024 09:48:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-29 19:18:23.831841
- Title: SkinCAP: A Multi-modal Dermatology Dataset Annotated with Rich Medical Captions
- Title(参考訳): SkinCAP: リッチメディカルキャプションを付加したマルチモーダル皮膚科学データセット
- Authors: Juexiao Zhou, Liyuan Sun, Yan Xu, Wenbin Liu, Shawn Afvari, Zhongyi Han, Jiaoyan Song, Yongzhi Ji, Xiaonan He, Xin Gao,
- Abstract要約: SkinCAPは、Fitzpatrick 17k皮膚疾患データセットとDiverse Dermatology Imagesデータセットからソースされた4,000の画像で構成されている。
特に、SkinCAPは世界初のそのようなデータセットであり、https://huggingface.co/datasets/joshuachou/SkinCAPで公開されている。
- 参考スコア(独自算出の注目度): 17.803181915074706
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: With the widespread application of artificial intelligence (AI), particularly deep learning (DL) and vision-based large language models (VLLMs), in skin disease diagnosis, the need for interpretability becomes crucial. However, existing dermatology datasets are limited in their inclusion of concept-level meta-labels, and none offer rich medical descriptions in natural language. This deficiency impedes the advancement of LLM-based methods in dermatological diagnosis. To address this gap and provide a meticulously annotated dermatology dataset with comprehensive natural language descriptions, we introduce SkinCAP: a multi-modal dermatology dataset annotated with rich medical captions. SkinCAP comprises 4,000 images sourced from the Fitzpatrick 17k skin disease dataset and the Diverse Dermatology Images dataset, annotated by board-certified dermatologists to provide extensive medical descriptions and captions. Notably, SkinCAP represents the world's first such dataset and is publicly available at https://huggingface.co/datasets/joshuachou/SkinCAP.
- Abstract(参考訳): 人工知能(AI)、特に深層学習(DL)や視覚に基づく大規模言語モデル(VLLM)の皮膚疾患診断への応用により、解釈可能性の必要性が重要となる。
しかしながら、既存の皮膚科学データセットは概念レベルのメタラベルを含めることに制限があり、自然言語で豊富な医学的記述を提供するものはない。
この欠損は皮膚科診断におけるLSM法の発展を阻害する。
このギャップに対処し、包括的自然言語記述を伴う微妙に注釈付けされた皮膚科学データセットを提供するために、リッチな医療キャプションを付加したマルチモーダル皮膚学データセットであるSkinCAPを紹介した。
SkinCAP は Fitzpatrick 17k skin disease データセットと Diverse Dermatology Images データセットから得られた4,000枚の画像で構成されており、ボード認証された皮膚科医によって注釈され、医学的な記述やキャプションを提供する。
特に、SkinCAPは世界初のそのようなデータセットであり、https://huggingface.co/datasets/joshuachou/SkinCAPで公開されている。
関連論文リスト
- DERM12345: A Large, Multisource Dermatoscopic Skin Lesion Dataset with 38 Subclasses [0.48212500317840945]
本研究は,12,345枚の皮膚内視鏡像と38種類の皮膚病変からなる多彩なデータセットをトゥルカイで収集した。
このデータセットは、5つのスーパークラス、15のメインクラス、38のサブクラス、12,345の高解像度皮膚内視鏡画像を持つ多様な構造を通して識別される。
論文 参考訳(メタデータ) (2024-06-11T16:27:32Z) - Medical Vision-Language Pre-Training for Brain Abnormalities [96.1408455065347]
本稿では,PubMedなどの公共リソースから,医用画像・テキスト・アライメントデータを自動的に収集する方法を示す。
特に,まず大きな脳画像テキストデータセットを収集することにより,事前学習プロセスの合理化を図るパイプラインを提案する。
また,医療領域におけるサブフィギュアをサブキャプションにマッピングするというユニークな課題についても検討した。
論文 参考訳(メタデータ) (2024-04-27T05:03:42Z) - SkinGEN: an Explainable Dermatology Diagnosis-to-Generation Framework with Interactive Vision-Language Models [52.90397538472582]
SkinGENは、VLMが提供する診断結果から参照デモを生成する、診断から生成までのフレームワークである。
システム性能と説明可能性の両方を評価するために,32人の参加者によるユーザスタディを実施している。
その結果、SkinGENはVLM予測に対するユーザの理解を著しく改善し、診断プロセスへの信頼を高めることが示されている。
論文 参考訳(メタデータ) (2024-04-23T05:36:33Z) - Optimizing Skin Lesion Classification via Multimodal Data and Auxiliary
Task Integration [54.76511683427566]
本研究は, スマートフォンで撮影した画像と本質的な臨床および人口統計情報を統合することで, 皮膚病変を分類する新しいマルチモーダル手法を提案する。
この手法の特徴は、超高解像度画像予測に焦点を当てた補助的なタスクの統合である。
PAD-UFES20データセットを用いて,様々なディープラーニングアーキテクチャを用いて実験を行った。
論文 参考訳(メタデータ) (2024-02-16T05:16:20Z) - ERCPMP: An Endoscopic Image and Video Dataset for Colorectal Polyps
Morphology and Pathology [0.0]
本データセットは,大腸ポリープ191例の人口統計,形態学的,病理的データ,内視鏡的画像,ビデオを含む。
病理組織学的には, 尿細管, ウイルス, ツブロビラス, 過形成, 血清, 炎症, 腺癌, 異型度などのポリープが診断された。
論文 参考訳(メタデータ) (2023-07-28T09:52:20Z) - PMC-LLaMA: Towards Building Open-source Language Models for Medicine [62.39105735933138]
大規模言語モデル(LLM)は、自然言語理解において顕著な能力を示した。
LLMは、ドメイン固有の知識が不足しているため、医学的応用のような正確性を必要とする領域で苦労している。
PMC-LLaMAと呼ばれる医療応用に特化した強力なオープンソース言語モデルの構築手順について述べる。
論文 参考訳(メタデータ) (2023-04-27T18:29:05Z) - Cross-Modal Causal Intervention for Medical Report Generation [109.83549148448469]
医療報告生成(MRG)は、コンピュータ支援診断と治療指導に不可欠である。
視覚的および言語的バイアスによって引き起こされる画像テキストデータ内の素早い相関のため、病変領域を確実に記述した正確なレポートを生成することは困難である。
本稿では,視覚分解モジュール (VDM) と言語分解モジュール (LDM) からなるMRGのための新しい視覚言語因果干渉 (VLCI) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-16T07:23:55Z) - SkinCon: A skin disease dataset densely annotated by domain experts for
fine-grained model debugging and analysis [9.251248318564617]
概念は人間にとって意味のあるメタラベルである。
医学における厳密な注釈付きデータセットは、メラノーマのような単一の疾患に関連するメタラベルに焦点を当てた。
SkinConにはFitzpatrick 17kデータセットから3230枚の画像が含まれており、48の臨床的概念が付加されている。
論文 参考訳(メタデータ) (2023-02-01T22:39:51Z) - Evaluating Deep Neural Networks Trained on Clinical Images in
Dermatology with the Fitzpatrick 17k Dataset [0.23746609573239755]
このデータセットは、フィッツパトリック皮膚型ラベルを持つ2つの皮膚学アトラスから得られた16,577の臨床画像を含む。
我々は、深層ニューラルネットワークモデルをトレーニングし、114の皮膚条件を分類し、トレーニングされたものと類似した皮膚タイプで最も正確なモデルを見つける。
論文 参考訳(メタデータ) (2021-04-20T13:37:30Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。