論文の概要: Diverse Image Generation with Diffusion Models and Cross Class Label Learning for Polyp Classification
- arxiv url: http://arxiv.org/abs/2502.05444v1
- Date: Sat, 08 Feb 2025 04:26:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-11 14:30:07.895120
- Title: Diverse Image Generation with Diffusion Models and Cross Class Label Learning for Polyp Classification
- Title(参考訳): 拡散モデルを用いた多言語画像生成と多言語分類のためのクロスクラスラベル学習
- Authors: Vanshali Sharma, Debesh Jha, M. K. Bhuyan, Pradip K. Das, Ulas Bagci,
- Abstract要約: そこで我々は,多種多様な特徴を持つテキスト制御合成画像を生成する新しいモデルPathoPolyp-Diffを開発した。
モデルが他のクラスから特徴を学習できるように、クラス間ラベル学習を導入し、データアノテーションの面倒な作業を減らす。
- 参考スコア(独自算出の注目度): 4.747649393635696
- License:
- Abstract: Pathologic diagnosis is a critical phase in deciding the optimal treatment procedure for dealing with colorectal cancer (CRC). Colonic polyps, precursors to CRC, can pathologically be classified into two major types: adenomatous and hyperplastic. For precise classification and early diagnosis of such polyps, the medical procedure of colonoscopy has been widely adopted paired with various imaging techniques, including narrow band imaging and white light imaging. However, the existing classification techniques mainly rely on a single imaging modality and show limited performance due to data scarcity. Recently, generative artificial intelligence has been gaining prominence in overcoming such issues. Additionally, various generation-controlling mechanisms using text prompts and images have been introduced to obtain visually appealing and desired outcomes. However, such mechanisms require class labels to make the model respond efficiently to the provided control input. In the colonoscopy domain, such controlling mechanisms are rarely explored; specifically, the text prompt is a completely uninvestigated area. Moreover, the unavailability of expensive class-wise labels for diverse sets of images limits such explorations. Therefore, we develop a novel model, PathoPolyp-Diff, that generates text-controlled synthetic images with diverse characteristics in terms of pathology, imaging modalities, and quality. We introduce cross-class label learning to make the model learn features from other classes, reducing the burdensome task of data annotation. The experimental results report an improvement of up to 7.91% in balanced accuracy using a publicly available dataset. Moreover, cross-class label learning achieves a statistically significant improvement of up to 18.33% in balanced accuracy during video-level analysis. The code is available at https://github.com/Vanshali/PathoPolyp-Diff.
- Abstract(参考訳): 病理診断は大腸癌(CRC)の治療に最適な治療法を決定する上で重要な段階である。
CRCの前駆体である大腸ポリープは、病理学的には腺腫と過形成の2つの主要なタイプに分類される。
このようなポリープの正確な分類と早期診断のために、内視鏡検査は狭帯域画像や白色光画像などの様々な画像技術と組み合わせて広く採用されている。
しかし、既存の分類手法は、主に単一の画像モダリティに依存し、データ不足による限られた性能を示す。
近年,このような課題を克服する上で,生成的人工知能が注目されている。
さらに、テキストプロンプトと画像を用いた様々な生成制御機構を導入し、視覚的に魅力的で望ましい結果を得た。
しかし、そのようなメカニズムは、モデルが与えられた制御入力に効率的に応答するようにクラスラベルを必要とする。
大腸内視鏡領域では、このような制御機構はめったに探索されないが、具体的には、テキストプロンプトは完全に調査されていない領域である。
さらに、画像の多様な集合に対して高価なクラスワイドラベルが利用できないことは、そのような探索を制限している。
そこで我々は, 病理, 画像のモダリティ, 品質の異なるテキスト制御合成画像を生成する新しいモデルPathoPolyp-Diffを開発した。
モデルが他のクラスから特徴を学習できるように、クラス間ラベル学習を導入し、データアノテーションの面倒な作業を減らす。
実験結果は、公開データセットを使用して、バランスの取れた精度が最大7.91%向上したことを報告している。
さらに、クロスクラスラベル学習は、ビデオレベルの解析において、バランスの取れた精度が18.33%まで統計的に顕著に向上する。
コードはhttps://github.com/Vanshali/PathoPolyp-Diffで公開されている。
関連論文リスト
- CCIS-Diff: A Generative Model with Stable Diffusion Prior for Controlled Colonoscopy Image Synthesis [7.1892156088672]
拡散アーキテクチャに基づく高品質な大腸内視鏡画像合成のための制御された生成モデルを提案する。
本手法は, 臨床記述に適合するポリープの空間特性(ポリープ位置と形状)と臨床特性の両方を正確に制御する。
論文 参考訳(メタデータ) (2024-11-19T03:30:06Z) - Unleashing the Potential of Synthetic Images: A Study on Histopathology Image Classification [0.12499537119440242]
病理組織像分類は様々な疾患の正確な同定と診断に重要である。
合成画像は、既存のデータセットを効果的に増強し、最終的に下流の病理組織像分類タスクの性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2024-09-24T12:02:55Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Data Augmentation using Feature Generation for Volumetric Medical Images [0.08594140167290097]
医用画像分類は画像認識領域で最も重要な問題の一つである。
この分野での大きな課題の1つは、ラベル付きトレーニングデータの不足である。
特にディープラーニングモデルでは,画像のセグメンテーションや分類問題に関する有望な結果が示されている。
論文 参考訳(メタデータ) (2022-09-28T13:46:24Z) - Application of Transfer Learning and Ensemble Learning in Image-level
Classification for Breast Histopathology [9.037868656840736]
CAD(Computer-Aided Diagnosis)では、従来の分類モデルでは、主に1つのネットワークを使って特徴を抽出する。
本稿では良性病変と悪性病変のバイナリ分類のための画像レベルラベルに基づく深層アンサンブルモデルを提案する。
結果: アンサンブルネットワークモデルにおいて、画像レベルのバイナリ分類は9,8.90%の精度を達成する。
論文 参考訳(メタデータ) (2022-04-18T13:31:53Z) - Harmonizing Pathological and Normal Pixels for Pseudo-healthy Synthesis [68.5287824124996]
そこで本研究では,新しいタイプの識別器であるセグメンタを提案し,病変の正確な特定と擬似健康画像の視覚的品質の向上を図っている。
医用画像強調に生成画像を適用し,低コントラスト問題に対処するために拡張結果を利用する。
BraTSのT2モダリティに関する総合的な実験により、提案手法は最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2022-03-29T08:41:17Z) - Selective Synthetic Augmentation with HistoGAN for Improved
Histopathology Image Classification [11.087537668968888]
我々は,クラスラベルに条件付けされたリアルな病理像パッチを合成するための条件付きGANモデル,すなわちHistoGANを提案する。
また,提案したHistoGANによって生成された新しい合成画像パッチを選択的に追加する新しい合成拡張フレームワークについても検討した。
リンパ節病理組織像と転移性癌のリンパ節病理組織像の2つのデータセットについて検討した。
論文 参考訳(メタデータ) (2021-11-10T23:25:39Z) - Colorectal Polyp Classification from White-light Colonoscopy Images via
Domain Alignment [57.419727894848485]
大腸内視鏡画像からの正確な診断を支援するためには,コンピュータ支援診断システムが必要である。
これまでのほとんどの研究では、Narrow-Band Imaging (NBI) や他の拡張画像を用いて、ポリプの分化モデルの開発を試みている。
正確な大腸ポリープ分類のための教師/学生アーキテクチャに基づく新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-08-05T09:31:46Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Multi-label Thoracic Disease Image Classification with Cross-Attention
Networks [65.37531731899837]
胸部X線画像から胸部疾患を自動分類するためのCAN(Cross-Attention Networks)を提案する。
また,クロスエントロピー損失を超える新たな損失関数を設計し,クラス間の不均衡を克服する。
論文 参考訳(メタデータ) (2020-07-21T14:37:00Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。