論文の概要: Using Large Text-to-Image Models with Structured Prompts for Skin
Disease Identification: A Case Study
- arxiv url: http://arxiv.org/abs/2301.07178v1
- Date: Tue, 17 Jan 2023 20:37:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-19 17:32:58.021801
- Title: Using Large Text-to-Image Models with Structured Prompts for Skin
Disease Identification: A Case Study
- Title(参考訳): 皮膚疾患同定のための構造化プロンプトを用いた大規模テキスト・画像モデル
- Authors: Sajith Rajapaksa, Jean Marie Uwabeza Vianney, Renell Castro, Farzad
Khalvati, Shubhra Aich
- Abstract要約: 本稿では,大容量テキスト・ツー・イメージ(LTI)モデルを用いて,少数の皮膚疾患や注釈付きデータセットの欠如を自動診断する可能性について検討する。
本稿では,標準的な医用教科書から条件付き物語を注意深く観察するために設計された,汎用的だが簡潔なプロンプト構造をターゲットとしたインスタンス化を提案する。
実験では、感染領域のより優れた局在化を含む、提案された枠組みの有効性が示されている。
- 参考スコア(独自算出の注目度): 4.794822439017277
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper investigates the potential usage of large text-to-image (LTI)
models for the automated diagnosis of a few skin conditions with rarity or a
serious lack of annotated datasets. As the input to the LTI model, we provide
the targeted instantiation of a generic but succinct prompt structure designed
upon careful observations of the conditional narratives from the standard
medical textbooks. In this regard, we pave the path to utilizing accessible
textbook descriptions for automated diagnosis of conditions with data scarcity
through the lens of LTI models. Experiments show the efficacy of the proposed
framework, including much better localization of the infected regions.
Moreover, it has the immense possibility for generalization across the medical
sub-domains, not only to mitigate the data scarcity issue but also to debias
automated diagnostics from the all-pervasive racial biases.
- Abstract(参考訳): 本稿では,大容量テキスト・ツー・イメージ(LTI)モデルを用いて,少数の皮膚疾患や注釈付きデータセットの欠如を自動診断する可能性について検討する。
LTIモデルへの入力として、標準医学教科書から条件付き物語を注意深く観察するために設計された汎用的だが簡潔なプロンプト構造のターゲットインスタンス化を提供する。
そこで本研究では,LTIモデルのレンズを通して,データ不足を伴う条件の自動診断のために,アクセス可能な教科書記述を利用する方法を提案する。
実験は、感染領域のより優れた局在化を含む提案された枠組みの有効性を示す。
さらに、医療サブドメインにまたがる広範な一般化の可能性があり、データ不足の問題を緩和するだけでなく、広範囲にわたる人種バイアスから自動診断を逸脱する。
関連論文リスト
- Deep Generative Models Unveil Patterns in Medical Images Through Vision-Language Conditioning [3.4299097748670255]
深部生成モデルでは、データセットのサイズと品質を向上することにより、医療画像解析が大幅に進歩している。
画像合成プロセスの指針として,臨床データとセグメンテーションマスクを組み合わせることによって,ハイブリッド条件による生成構造を用いる。
我々のアプローチは、画像と臨床情報の視覚的相関が低いため、従来の医療報告誘導合成よりも困難であり、課題である。
論文 参考訳(メタデータ) (2024-10-17T17:48:36Z) - PathLDM: Text conditioned Latent Diffusion Model for Histopathology [62.970593674481414]
そこで我々は,高品質な病理像を生成するためのテキスト条件付き遅延拡散モデルPathLDMを紹介した。
提案手法は画像とテキストデータを融合して生成プロセスを強化する。
我々は,TCGA-BRCAデータセット上でのテキスト・ツー・イメージ生成において,SoTA FIDスコア7.64を達成し,FID30.1と最も近いテキスト・コンディショナブル・コンペティタを著しく上回った。
論文 参考訳(メタデータ) (2023-09-01T22:08:32Z) - Text-guided Foundation Model Adaptation for Pathological Image
Classification [40.45252665455015]
本稿では、画像とテキストの埋め込み(CITE)を結合して、病理画像分類を強化することを提案する。
CITEは、幅広いバイオメディカルテキストで事前訓練された言語モデルから得られたテキスト洞察を注入し、病理画像理解に基礎モデルを適用する。
論文 参考訳(メタデータ) (2023-07-27T14:44:56Z) - Class Attention to Regions of Lesion for Imbalanced Medical Image
Recognition [59.28732531600606]
データ不均衡問題に対処するため,textbfClass textbfAttention to textbfRegions of the lesion (CARE)を提案する。
CAREフレームワークは、まれな疾患の病変領域を表すために、バウンディングボックスを必要とする。
その結果,自動バウンディングボックス生成によるCARE変種は,オリジナルのCAREフレームワークに匹敵することがわかった。
論文 参考訳(メタデータ) (2023-07-19T15:19:02Z) - Adapting Pretrained Vision-Language Foundational Models to Medical
Imaging Domains [3.8137985834223502]
臨床の文脈を忠実に描写する医療画像の生成モデルを構築することは、医療データセットの不明瞭さを軽減するのに役立つ。
安定拡散パイプラインのサブコンポーネントを探索し、モデルを微調整して医用画像を生成する。
我々の最良の性能モデルは、安定な拡散ベースラインを改善し、合成ラジオグラフィ画像に現実的な異常を挿入するように条件付けすることができる。
論文 参考訳(メタデータ) (2022-10-09T01:43:08Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - Demystifying Deep Learning Models for Retinal OCT Disease Classification
using Explainable AI [0.6117371161379209]
様々な深層学習技術の採用は、非常に一般的かつ効果的であり、網膜光コヒーレンス・トモグラフィー分野に実装する上でも同様に真実である。
これらの技術はブラックボックスの特徴を持ち、医療従事者がそれらの成果を完全に信頼できないようにする。
本稿では,この研究に説明可能なAIを導入したLimeの使用とともに,比較的小型で簡易な自己開発CNNモデルを提案する。
論文 参考訳(メタデータ) (2021-11-06T13:54:07Z) - Assessing glaucoma in retinal fundus photographs using Deep Feature
Consistent Variational Autoencoders [63.391402501241195]
緑内障は症状が重くなるまで無症状のままでいるため、検出が困難である。
緑内障の早期診断は機能的,構造的,臨床的評価に基づいて行われることが多い。
ディープラーニング手法はこのジレンマを、マーカー識別段階をバイパスし、ハイレベルな情報を分析してデータを分類することで部分的に解決している。
論文 参考訳(メタデータ) (2021-10-04T16:06:49Z) - Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-14T16:50:50Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。