論文の概要: Rethinking Exemplars for Continual Semantic Segmentation in Endoscopy
Scenes: Entropy-based Mini-Batch Pseudo-Replay
- arxiv url: http://arxiv.org/abs/2308.14100v1
- Date: Sun, 27 Aug 2023 13:07:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-29 16:56:11.903101
- Title: Rethinking Exemplars for Continual Semantic Segmentation in Endoscopy
Scenes: Entropy-based Mini-Batch Pseudo-Replay
- Title(参考訳): 内視鏡シーンにおける連続的セマンティックセグメンテーションの事例再考:エントロピーに基づくミニバッチ擬似再生
- Authors: Guankun Wang, Long Bai, Yanan Wu, Tong Chen, Hongliang Ren
- Abstract要約: 内視鏡は、疾患の早期発見や、ロボットによる最小侵襲手術(RMIS)に広く用いられている技術である
既存のディープラーニング(DL)モデルは破滅的な忘れ込みに悩まされることがある。
データプライバシとストレージの問題は、モデルを更新するときに古いデータが利用できないことにつながる可能性がある。
本研究では,データストレージやプライバシーの問題にかかわらない内視鏡連続セマンティック(EndoCSS)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 18.383604936008744
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Endoscopy is a widely used technique for the early detection of diseases or
robotic-assisted minimally invasive surgery (RMIS). Numerous deep learning
(DL)-based research works have been developed for automated diagnosis or
processing of endoscopic view. However, existing DL models may suffer from
catastrophic forgetting. When new target classes are introduced over time or
cross institutions, the performance of old classes may suffer severe
degradation. More seriously, data privacy and storage issues may lead to the
unavailability of old data when updating the model. Therefore, it is necessary
to develop a continual learning (CL) methodology to solve the problem of
catastrophic forgetting in endoscopic image segmentation. To tackle this, we
propose a Endoscopy Continual Semantic Segmentation (EndoCSS) framework that
does not involve the storage and privacy issues of exemplar data. The framework
includes a mini-batch pseudo-replay (MB-PR) mechanism and a self-adaptive noisy
cross-entropy (SAN-CE) loss. The MB-PR strategy circumvents privacy and storage
issues by generating pseudo-replay images through a generative model.
Meanwhile, the MB-PR strategy can also correct the model deviation to the
replay data and current training data, which is aroused by the significant
difference in the amount of current and replay images. Therefore, the model can
perform effective representation learning on both new and old tasks. SAN-CE
loss can help model fitting by adjusting the model's output logits, and also
improve the robustness of training. Extensive continual semantic segmentation
(CSS) experiments on public datasets demonstrate that our method can robustly
and effectively address the catastrophic forgetting brought by class increment
in endoscopy scenes. The results show that our framework holds excellent
potential for real-world deployment in a streaming learning manner.
- Abstract(参考訳): 内視鏡検査は、疾患の早期発見やロボット支援最小侵襲手術(rmis)に広く用いられている技術である。
内視鏡画像の自動診断や処理のための多種多様な深層学習(DL)に基づく研究が開発されている。
しかし、既存のdlモデルは壊滅的な忘れに苦しむことがある。
新しいターゲットクラスが時間やクロス機関に導入されると、古いクラスのパフォーマンスが著しく低下する可能性がある。
より真面目な話として、データのプライバシとストレージの問題は、モデルを更新する際に古いデータが使えなくなる可能性がある。
そのため, 内視鏡画像分割における破滅的忘れの問題を解決するために, 連続学習(cl)手法を開発する必要がある。
そこで本研究では,従来のデータストレージやプライバシの問題にかかわらない内視鏡連続セマンティックセマンティックセグメンテーション(EndoCSS)フレームワークを提案する。
このフレームワークは、ミニバッチ擬似再生(MB−PR)機構と、自己適応性雑音性クロスエントロピー(SAN−CE)損失を含む。
MB-PR戦略は、生成モデルを通じて擬似再生画像を生成することにより、プライバシとストレージの問題を回避する。
一方、MB-PR戦略は、現在の画像量と再生画像量に大きな差があるため、リプレイデータと現在のトレーニングデータとのモデル偏差を補正することも可能である。
したがって、新しいタスクと古いタスクの両方で効果的な表現学習を行うことができる。
サンスロスはモデルの出力ロジットを調整することでモデルフィッティングを助け、トレーニングの堅牢性も向上する。
大規模連続的セマンティックセグメンテーション (CSS) 実験は, 内視鏡的シーンにおけるクラスインクリメントによる破滅的忘れに頑健かつ効果的に対処できることを実証した。
その結果,本フレームワークはストリーミング学習方式で実世界の展開に優れた可能性を秘めていることがわかった。
関連論文リスト
- ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - Uncovering the Hidden Cost of Model Compression [49.937417635812025]
視覚プロンプティング (VP) はコンピュータビジョンにおいて重要な伝達学習手法として登場した。
モデル間隔は視覚的プロンプトベース転送の性能に悪影響を及ぼす。
以上の結果から,疎度が下流視覚刺激モデルの校正に及ぼす影響が示唆された。
論文 参考訳(メタデータ) (2023-08-29T01:47:49Z) - Vision-Language Modelling For Radiological Imaging and Reports In The
Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。
本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。
テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文 参考訳(メタデータ) (2023-03-30T18:20:00Z) - Retinal Image Segmentation with Small Datasets [25.095695898777656]
糖尿病黄斑浮腫(DME)、加齢関連黄斑変性(AMD)、緑内障などの多くの眼疾患が網膜に出現し、不可逆的な失明や中心バージョンに深刻な障害を引き起こす。
オプティカルコヒーレンス・トモグラフィ(OCT)は網膜の3Dスキャンであり、網膜解剖の変化を診断し、モニターするために用いられる。
多くのDeep Learning(DL)メソッドは、網膜の病理学的変化を監視する自動化ツールの開発の成功を共有している。
論文 参考訳(メタデータ) (2023-03-09T08:32:14Z) - Longitudinal detection of new MS lesions using Deep Learning [0.0]
新たなMS病変の検出・分節作業に対処するディープラーニングベースのパイプラインについて述べる。
まず,1つの時間点を用いたセグメンテーションタスクで訓練されたモデルからの移動学習を提案する。
第2に、新しい病変を伴う現実的な縦断時間を生成するためのデータ合成戦略を提案する。
論文 参考訳(メタデータ) (2022-06-16T16:09:04Z) - Reducing Catastrophic Forgetting in Self Organizing Maps with
Internally-Induced Generative Replay [67.50637511633212]
生涯学習エージェントは、パターン知覚データの無限のストリームから継続的に学習することができる。
適応するエージェントを構築する上での歴史的難しさの1つは、ニューラルネットワークが新しいサンプルから学ぶ際に、以前取得した知識を維持するのに苦労していることである。
この問題は破滅的な忘れ(干渉)と呼ばれ、今日の機械学習の領域では未解決の問題のままである。
論文 参考訳(メタデータ) (2021-12-09T07:11:14Z) - Always Be Dreaming: A New Approach for Data-Free Class-Incremental
Learning [73.24988226158497]
データフリークラスインクリメンタルラーニング(DFCIL)における高インパクト問題について考察する。
そこで本研究では, 改良型クロスエントロピートレーニングと重要重み付き特徴蒸留に寄与するDFCILの新たなインクリメンタル蒸留戦略を提案する。
本手法は,共通クラスインクリメンタルベンチマークにおけるSOTA DFCIL法と比較して,最終タスク精度(絶対差)が25.1%向上する。
論文 参考訳(メタデータ) (2021-06-17T17:56:08Z) - About Explicit Variance Minimization: Training Neural Networks for
Medical Imaging With Limited Data Annotations [2.3204178451683264]
VAT(Variance Aware Training)法は、モデル損失関数に分散誤差を導入することにより、この特性を利用する。
多様な領域から得られた3つの医用画像データセットと様々な学習目標に対するVATの有効性を検証した。
論文 参考訳(メタデータ) (2021-05-28T21:34:04Z) - Self-Adaptive Transfer Learning for Multicenter Glaucoma Classification
in Fundus Retina Images [9.826586293806837]
マルチセンタデータセット間のドメインギャップを埋めるための自己適応型トランスファーラーニング(SATL)戦略を提案する。
具体的には、ソースドメイン上で事前訓練されたDLモデルのエンコーダを使用して、再構成モデルのエンコーダを初期化する。
以上の結果から,SATL法はプライベートおよび2つの公共緑内障診断データセット間の領域適応作業に有効であることが示唆された。
論文 参考訳(メタデータ) (2021-05-07T05:20:37Z) - HM4: Hidden Markov Model with Memory Management for Visual Place
Recognition [54.051025148533554]
自律運転における視覚的位置認識のための隠れマルコフモデルを提案する。
我々のアルゴリズムはHM$4$と呼ばれ、時間的ルックアヘッドを利用して、有望な候補画像をパッシブストレージとアクティブメモリ間で転送する。
固定被覆領域に対して一定の時間と空間推定が可能であることを示す。
論文 参考訳(メタデータ) (2020-11-01T08:49:24Z) - Semi-supervised few-shot learning for medical image segmentation [21.349705243254423]
大規模な注釈付きデータセットの必要性を緩和する最近の試みは、数ショットの学習パラダイムの下でトレーニング戦略を開発した。
セマンティックセグメンテーションのための新しい数発の学習フレームワークを提案し,各エピソードでラベルのない画像も利用できるようにした。
エピソードトレーニングにおけるラベルなしのサロゲートタスクを含めると、より強力な特徴表現がもたらされることを示す。
論文 参考訳(メタデータ) (2020-03-18T20:37:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。