論文の概要: Rethinking Exemplars for Continual Semantic Segmentation in Endoscopy
Scenes: Entropy-based Mini-Batch Pseudo-Replay
- arxiv url: http://arxiv.org/abs/2308.14100v1
- Date: Sun, 27 Aug 2023 13:07:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-29 16:56:11.903101
- Title: Rethinking Exemplars for Continual Semantic Segmentation in Endoscopy
Scenes: Entropy-based Mini-Batch Pseudo-Replay
- Title(参考訳): 内視鏡シーンにおける連続的セマンティックセグメンテーションの事例再考:エントロピーに基づくミニバッチ擬似再生
- Authors: Guankun Wang, Long Bai, Yanan Wu, Tong Chen, Hongliang Ren
- Abstract要約: 内視鏡は、疾患の早期発見や、ロボットによる最小侵襲手術(RMIS)に広く用いられている技術である
既存のディープラーニング(DL)モデルは破滅的な忘れ込みに悩まされることがある。
データプライバシとストレージの問題は、モデルを更新するときに古いデータが利用できないことにつながる可能性がある。
本研究では,データストレージやプライバシーの問題にかかわらない内視鏡連続セマンティック(EndoCSS)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 18.383604936008744
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Endoscopy is a widely used technique for the early detection of diseases or
robotic-assisted minimally invasive surgery (RMIS). Numerous deep learning
(DL)-based research works have been developed for automated diagnosis or
processing of endoscopic view. However, existing DL models may suffer from
catastrophic forgetting. When new target classes are introduced over time or
cross institutions, the performance of old classes may suffer severe
degradation. More seriously, data privacy and storage issues may lead to the
unavailability of old data when updating the model. Therefore, it is necessary
to develop a continual learning (CL) methodology to solve the problem of
catastrophic forgetting in endoscopic image segmentation. To tackle this, we
propose a Endoscopy Continual Semantic Segmentation (EndoCSS) framework that
does not involve the storage and privacy issues of exemplar data. The framework
includes a mini-batch pseudo-replay (MB-PR) mechanism and a self-adaptive noisy
cross-entropy (SAN-CE) loss. The MB-PR strategy circumvents privacy and storage
issues by generating pseudo-replay images through a generative model.
Meanwhile, the MB-PR strategy can also correct the model deviation to the
replay data and current training data, which is aroused by the significant
difference in the amount of current and replay images. Therefore, the model can
perform effective representation learning on both new and old tasks. SAN-CE
loss can help model fitting by adjusting the model's output logits, and also
improve the robustness of training. Extensive continual semantic segmentation
(CSS) experiments on public datasets demonstrate that our method can robustly
and effectively address the catastrophic forgetting brought by class increment
in endoscopy scenes. The results show that our framework holds excellent
potential for real-world deployment in a streaming learning manner.
- Abstract(参考訳): 内視鏡検査は、疾患の早期発見やロボット支援最小侵襲手術(rmis)に広く用いられている技術である。
内視鏡画像の自動診断や処理のための多種多様な深層学習(DL)に基づく研究が開発されている。
しかし、既存のdlモデルは壊滅的な忘れに苦しむことがある。
新しいターゲットクラスが時間やクロス機関に導入されると、古いクラスのパフォーマンスが著しく低下する可能性がある。
より真面目な話として、データのプライバシとストレージの問題は、モデルを更新する際に古いデータが使えなくなる可能性がある。
そのため, 内視鏡画像分割における破滅的忘れの問題を解決するために, 連続学習(cl)手法を開発する必要がある。
そこで本研究では,従来のデータストレージやプライバシの問題にかかわらない内視鏡連続セマンティックセマンティックセグメンテーション(EndoCSS)フレームワークを提案する。
このフレームワークは、ミニバッチ擬似再生(MB−PR)機構と、自己適応性雑音性クロスエントロピー(SAN−CE)損失を含む。
MB-PR戦略は、生成モデルを通じて擬似再生画像を生成することにより、プライバシとストレージの問題を回避する。
一方、MB-PR戦略は、現在の画像量と再生画像量に大きな差があるため、リプレイデータと現在のトレーニングデータとのモデル偏差を補正することも可能である。
したがって、新しいタスクと古いタスクの両方で効果的な表現学習を行うことができる。
サンスロスはモデルの出力ロジットを調整することでモデルフィッティングを助け、トレーニングの堅牢性も向上する。
大規模連続的セマンティックセグメンテーション (CSS) 実験は, 内視鏡的シーンにおけるクラスインクリメントによる破滅的忘れに頑健かつ効果的に対処できることを実証した。
その結果,本フレームワークはストリーミング学習方式で実世界の展開に優れた可能性を秘めていることがわかった。
関連論文リスト
- Image Synthesis with Class-Aware Semantic Diffusion Models for Surgical Scene Segmentation [3.6723640056915436]
本稿では,データ不足と不均衡に対処するクラスアウェア意味拡散モデル(CASDM)を提案する。
クラス認識平均二乗誤差とクラス認識自己認識損失関数は、重要で目立たないクラスを優先するように定義されている。
我々は、テキストプロンプトを用いて、その内容を特定するために、初めて、新しい方法でマルチクラスセグメンテーションマップを生成する。
論文 参考訳(メタデータ) (2024-10-31T14:14:30Z) - Continual Domain Incremental Learning for Privacy-aware Digital Pathology [3.6630930118966814]
連続学習(CL)技術は、分散シフト条件で新しいデータを学習する際の過去のデータ忘れを減らすことを目的としている。
我々は、過去のデータを格納し、新しいデータで潜在リプレイを行うために、ジェネレーティブ潜在リプレイベースのCL(GLRCL)アプローチを開発する。
論文 参考訳(メタデータ) (2024-09-10T12:21:54Z) - Adaptive Affinity-Based Generalization For MRI Imaging Segmentation Across Resource-Limited Settings [1.5703963908242198]
本稿では,適応親和性に基づく蒸留とカーネルベースの蒸留をシームレスに組み合わせた,新しい関係に基づく知識フレームワークを提案する。
革新的アプローチを検証するために,我々は公開されている複数ソースのMRIデータについて実験を行った。
論文 参考訳(メタデータ) (2024-04-03T13:35:51Z) - ECLIPSE: Efficient Continual Learning in Panoptic Segmentation with Visual Prompt Tuning [54.68180752416519]
パノプティカルセグメンテーション(英: Panoptic segmentation)は、コンピュータビジョンの最先端タスクである。
ECLIPSE と呼ばれる Visual Prompt Tuning をベースとした,新規で効率的なパノプティカルセグメンテーション手法を提案する。
我々のアプローチは、基本モデルのパラメータを凍結し、小さなプロンプト埋め込みだけを微調整することであり、破滅的な忘れ物と塑性の両方に対処する。
論文 参考訳(メタデータ) (2024-03-29T11:31:12Z) - Self-STORM: Deep Unrolled Self-Supervised Learning for Super-Resolution Microscopy [55.2480439325792]
我々は、シーケンス固有のモデルベースのオートエンコーダをトレーニングすることで、そのようなデータの必要性を軽減する、深層無学習の自己教師付き学習を導入する。
提案手法は, 監視対象の性能を超過する。
論文 参考訳(メタデータ) (2024-03-25T17:40:32Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - Vision-Language Modelling For Radiological Imaging and Reports In The
Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。
本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。
テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文 参考訳(メタデータ) (2023-03-30T18:20:00Z) - Reducing Catastrophic Forgetting in Self Organizing Maps with
Internally-Induced Generative Replay [67.50637511633212]
生涯学習エージェントは、パターン知覚データの無限のストリームから継続的に学習することができる。
適応するエージェントを構築する上での歴史的難しさの1つは、ニューラルネットワークが新しいサンプルから学ぶ際に、以前取得した知識を維持するのに苦労していることである。
この問題は破滅的な忘れ(干渉)と呼ばれ、今日の機械学習の領域では未解決の問題のままである。
論文 参考訳(メタデータ) (2021-12-09T07:11:14Z) - About Explicit Variance Minimization: Training Neural Networks for
Medical Imaging With Limited Data Annotations [2.3204178451683264]
VAT(Variance Aware Training)法は、モデル損失関数に分散誤差を導入することにより、この特性を利用する。
多様な領域から得られた3つの医用画像データセットと様々な学習目標に対するVATの有効性を検証した。
論文 参考訳(メタデータ) (2021-05-28T21:34:04Z) - Self-Adaptive Transfer Learning for Multicenter Glaucoma Classification
in Fundus Retina Images [9.826586293806837]
マルチセンタデータセット間のドメインギャップを埋めるための自己適応型トランスファーラーニング(SATL)戦略を提案する。
具体的には、ソースドメイン上で事前訓練されたDLモデルのエンコーダを使用して、再構成モデルのエンコーダを初期化する。
以上の結果から,SATL法はプライベートおよび2つの公共緑内障診断データセット間の領域適応作業に有効であることが示唆された。
論文 参考訳(メタデータ) (2021-05-07T05:20:37Z) - HM4: Hidden Markov Model with Memory Management for Visual Place
Recognition [54.051025148533554]
自律運転における視覚的位置認識のための隠れマルコフモデルを提案する。
我々のアルゴリズムはHM$4$と呼ばれ、時間的ルックアヘッドを利用して、有望な候補画像をパッシブストレージとアクティブメモリ間で転送する。
固定被覆領域に対して一定の時間と空間推定が可能であることを示す。
論文 参考訳(メタデータ) (2020-11-01T08:49:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。