論文の概要: Multi-stream Fusion for Class Incremental Learning in Pill Image
Classification
- arxiv url: http://arxiv.org/abs/2210.02313v1
- Date: Wed, 5 Oct 2022 15:05:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 14:19:22.718228
- Title: Multi-stream Fusion for Class Incremental Learning in Pill Image
Classification
- Title(参考訳): ピル画像分類におけるクラスインクリメンタル学習のためのマルチストリーム融合
- Authors: Trong-Tung Nguyen, Hieu H. Pham, Phi Le Nguyen, Thanh Hung Nguyen, and
Minh Do
- Abstract要約: 従来のピル画像分類システムにクラスインクリメンタルラーニング(CIL)機能を導入する。
本フレームワークでは,ピル画像の色特化情報をガイダンスストリームとして検討する。
CG-IMIFは,タスク設定の相違により,複数の最先端手法を一貫して上回っていることがわかった。
- 参考スコア(独自算出の注目度): 5.013866470627594
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Classifying pill categories from real-world images is crucial for various
smart healthcare applications. Although existing approaches in image
classification might achieve a good performance on fixed pill categories, they
fail to handle novel instances of pill categories that are frequently presented
to the learning algorithm. To this end, a trivial solution is to train the
model with novel classes. However, this may result in a phenomenon known as
catastrophic forgetting, in which the system forgets what it learned in
previous classes. In this paper, we address this challenge by introducing the
class incremental learning (CIL) ability to traditional pill image
classification systems. Specifically, we propose a novel incremental
multi-stream intermediate fusion framework enabling incorporation of an
additional guidance information stream that best matches the domain of the
problem into various state-of-the-art CIL methods. From this framework, we
consider color-specific information of pill images as a guidance stream and
devise an approach, namely "Color Guidance with Multi-stream intermediate
fusion"(CG-IMIF) for solving CIL pill image classification task. We conduct
comprehensive experiments on real-world incremental pill image classification
dataset, namely VAIPE-PCIL, and find that the CG-IMIF consistently outperforms
several state-of-the-art methods by a large margin in different task settings.
Our code, data, and trained model are available at
https://github.com/vinuni-vishc/CG-IMIF.
- Abstract(参考訳): 現実世界の画像から薬のカテゴリーを分類することは、さまざまなスマートヘルスケアアプリケーションにとって不可欠である。
画像分類における既存のアプローチは、固定された薬品カテゴリにおいて優れた性能を発揮するかもしれないが、学習アルゴリズムに頻繁に提示される新しい薬品カテゴリのインスタンスを処理できない。
この目的のために、簡単な解決策は、新しいクラスでモデルをトレーニングすることだ。
しかし、これは破滅的な忘れ込みと呼ばれる現象を引き起こし、そこではシステムが以前のクラスで学んだことを忘れてしまう。
本稿では,従来のピル画像分類システムにクラスインクリメンタルラーニング(CIL)機能を導入することで,この問題に対処する。
具体的には,問題領域に最も適合する追加のガイダンス情報ストリームを様々なcil法に組み込むことが可能な,新たなインクリメンタルなマルチストリーム中間融合フレームワークを提案する。
そこで本フレームワークでは,CIL 画像分類タスクを解くために,画素画像の色特化情報をガイダンスストリームとして考慮し,"Color Guidance with Multi-stream intermediate fusion" (CG-IMIF) というアプローチを考案する。
実世界のインクリメンタルピル画像分類データセット、すなわちVAIPE-PCILについて総合的な実験を行い、CG-IMIFはタスク設定の大きなマージンで、一貫していくつかの最先端の手法より優れていることを示した。
私たちのコード、データ、トレーニングされたモデルはhttps://github.com/vinuni-vishc/CG-IMIF.comで公開されています。
関連論文リスト
- HMIL: Hierarchical Multi-Instance Learning for Fine-Grained Whole Slide Image Classification [10.203984731917851]
全スライド画像(WSI)のきめ細かい分類は、正確な癌診断とパーソナライズされた治療戦略を可能にする、精密腫瘍学において不可欠である。
マルチインスタンス学習(MIL)パラダイムはWSIの計算負担を軽減するが、既存のMIL手法は階層的なラベル相関を無視することが多い。
本稿では,これらの制約を克服する新しい階層型マルチインスタンス学習(HMIL)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-12T09:22:00Z) - Enhance Image Classification via Inter-Class Image Mixup with Diffusion Model [80.61157097223058]
画像分類性能を高めるための一般的な戦略は、T2Iモデルによって生成された合成画像でトレーニングセットを増強することである。
本研究では,既存のデータ拡張技術の欠点について検討する。
Diff-Mixと呼ばれる革新的なクラス間データ拡張手法を導入する。
論文 参考訳(メタデータ) (2024-03-28T17:23:45Z) - High-resolution Image-based Malware Classification using Multiple
Instance Learning [0.0]
本稿では,高解像度グレースケール画像と複数インスタンス学習を用いて,マルウェアを家族に分類する方法を提案する。
この実装はMicrosoft Malware Classificationデータセットで評価され、反対に拡大されたサンプルに対して最大96.6%のアキュラシーを達成している。
論文 参考訳(メタデータ) (2023-11-21T18:11:26Z) - Multi-spectral Class Center Network for Face Manipulation Detection and Localization [52.569170436393165]
顔の操作検出と局所化のための新しいマルチスペクトル・クラス・センター・ネットワーク(MSCCNet)を提案する。
周波数帯域の異なる特徴に基づき、MSCCモジュールはマルチスペクトルクラスセンターを収集し、ピクセル対クラス関係を計算する。
多スペクトルクラスレベルの表現を適用することで、偽画像の操作された領域に敏感な視覚概念の意味情報を抑えることができる。
論文 参考訳(メタデータ) (2023-05-18T08:09:20Z) - Generalized Category Discovery [148.32255950504182]
本稿では,ラベル付き画像集合とラベル付き画像集合とを併用した画像認識手法を提案する。
ここでは、未表示の画像はラベル付きクラスから、あるいは新しいものから来ているかもしれない。
まず、新しいカテゴリー発見から最先端のアルゴリズムを取り入れ、そのタスクに適応することで、強力なベースラインを確立する。
次に、単純だが効果的な半教師付き$k$-meansメソッドを導入する。
論文 参考訳(メタデータ) (2022-01-07T18:58:35Z) - Categorical Relation-Preserving Contrastive Knowledge Distillation for
Medical Image Classification [75.27973258196934]
そこで本研究では,一般的な平均教師モデルであるCRCKD(Categorical Relation-Reserving Contrastive Knowledge Distillation)アルゴリズムを提案する。
この正規化により、学生モデルの特徴分布はクラス内類似度が高く、クラス間分散を示す。
CCDとCRPの貢献により、我々のCRCKDアルゴリズムはより包括的に関係知識を蒸留することができる。
論文 参考訳(メタデータ) (2021-07-07T13:56:38Z) - Mixed Supervision Learning for Whole Slide Image Classification [88.31842052998319]
超高解像度画像のための混合監視学習フレームワークを提案する。
パッチトレーニングの段階では、このフレームワークは、粗いイメージレベルのラベルを使用して、自己教師付き学習を洗練することができる。
画素レベルの偽陽性と偽陰性を抑制するための包括的な戦略が提案されている。
論文 参考訳(メタデータ) (2021-07-02T09:46:06Z) - Contrastive Semi-Supervised Learning for 2D Medical Image Segmentation [16.517086214275654]
フルイメージではなく,画像パッチにContrastive Learning(CL)を適用した,新しい半教師付き2次元医療セグメンテーションソリューションを提案する。
これらのパッチは、擬似ラベリングによって得られた異なるクラスの意味情報を用いて有意義に構築される。
また,コントラスト学習と相乗効果を持つ新しい整合正規化手法を提案する。
論文 参考訳(メタデータ) (2021-06-12T15:43:24Z) - VeriMedi: Pill Identification using Proxy-based Deep Metric Learning and
Exact Solution [0.0]
このソリューションには、セグメンテーションと識別を行う2つの連続接続型ディープラーニングソリューションがある。
セグメンテーションソリューションは、マスクR-CNNモデルを使用してバイアル画像内の各ピルのマスクを作成し、その後、セグメンテーションと作物を丸薬を作成し、背景をぼやけます。
生成された埋め込みベクトルは、1つの丸薬イメージを予測するために正確なソリューションで訓練された1層の完全に接続されたネットワークに供給されます。
論文 参考訳(メタデータ) (2021-04-22T06:52:30Z) - HMIC: Hierarchical Medical Image Classification, A Deep Learning
Approach [0.3250512744763586]
本稿では,医療画像分類の課題と異なり,課題をマルチクラス分類とみなすアプローチを概説する。
階層的医用画像分類(HMIC)を用いた階層的分類を行った。
論文 参考訳(メタデータ) (2020-06-12T15:15:29Z) - Fine-Grained Visual Classification via Progressive Multi-Granularity
Training of Jigsaw Patches [67.51747235117]
きめ細かい視覚分類(FGVC)は従来の分類よりもはるかに難しい。
最近の研究は主に、最も差別的な部分の発見に焦点をあてることによってこの問題に対処している。
本稿では,これらの問題に対処するための視覚的細粒度分類のための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2020-03-08T19:27:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。