Fugu-MT 論文翻訳(概要): Rethinking Exemplars for Continual Semantic Segmentation in Endoscopy Scenes: Entropy-based Mini-Batch Pseudo-Replay

論文の概要: Rethinking Exemplars for Continual Semantic Segmentation in Endoscopy Scenes: Entropy-based Mini-Batch Pseudo-Replay

arxiv url: http://arxiv.org/abs/2308.14100v1
Date: Sun, 27 Aug 2023 13:07:44 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-29 16:56:11.903101
Title: Rethinking Exemplars for Continual Semantic Segmentation in Endoscopy Scenes: Entropy-based Mini-Batch Pseudo-Replay
Title（参考訳）: 内視鏡シーンにおける連続的セマンティックセグメンテーションの事例再考:エントロピーに基づくミニバッチ擬似再生
Authors: Guankun Wang, Long Bai, Yanan Wu, Tong Chen, Hongliang Ren
Abstract要約: 内視鏡は、疾患の早期発見や、ロボットによる最小侵襲手術(RMIS)に広く用いられている技術である既存のディープラーニング(DL)モデルは破滅的な忘れ込みに悩まされることがある。データプライバシとストレージの問題は、モデルを更新するときに古いデータが利用できないことにつながる可能性がある。本研究では,データストレージやプライバシーの問題にかかわらない内視鏡連続セマンティック(EndoCSS)フレームワークを提案する。
参考スコア（独自算出の注目度）: 18.383604936008744
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Endoscopy is a widely used technique for the early detection of diseases or robotic-assisted minimally invasive surgery (RMIS). Numerous deep learning (DL)-based research works have been developed for automated diagnosis or processing of endoscopic view. However, existing DL models may suffer from catastrophic forgetting. When new target classes are introduced over time or cross institutions, the performance of old classes may suffer severe degradation. More seriously, data privacy and storage issues may lead to the unavailability of old data when updating the model. Therefore, it is necessary to develop a continual learning (CL) methodology to solve the problem of catastrophic forgetting in endoscopic image segmentation. To tackle this, we propose a Endoscopy Continual Semantic Segmentation (EndoCSS) framework that does not involve the storage and privacy issues of exemplar data. The framework includes a mini-batch pseudo-replay (MB-PR) mechanism and a self-adaptive noisy cross-entropy (SAN-CE) loss. The MB-PR strategy circumvents privacy and storage issues by generating pseudo-replay images through a generative model. Meanwhile, the MB-PR strategy can also correct the model deviation to the replay data and current training data, which is aroused by the significant difference in the amount of current and replay images. Therefore, the model can perform effective representation learning on both new and old tasks. SAN-CE loss can help model fitting by adjusting the model's output logits, and also improve the robustness of training. Extensive continual semantic segmentation (CSS) experiments on public datasets demonstrate that our method can robustly and effectively address the catastrophic forgetting brought by class increment in endoscopy scenes. The results show that our framework holds excellent potential for real-world deployment in a streaming learning manner.
Abstract（参考訳）: 内視鏡検査は、疾患の早期発見やロボット支援最小侵襲手術(rmis)に広く用いられている技術である。内視鏡画像の自動診断や処理のための多種多様な深層学習(DL)に基づく研究が開発されている。しかし、既存のdlモデルは壊滅的な忘れに苦しむことがある。新しいターゲットクラスが時間やクロス機関に導入されると、古いクラスのパフォーマンスが著しく低下する可能性がある。より真面目な話として、データのプライバシとストレージの問題は、モデルを更新する際に古いデータが使えなくなる可能性がある。そのため, 内視鏡画像分割における破滅的忘れの問題を解決するために, 連続学習(cl)手法を開発する必要がある。そこで本研究では,従来のデータストレージやプライバシの問題にかかわらない内視鏡連続セマンティックセマンティックセグメンテーション(EndoCSS)フレームワークを提案する。このフレームワークは、ミニバッチ擬似再生(MB−PR)機構と、自己適応性雑音性クロスエントロピー(SAN−CE)損失を含む。 MB-PR戦略は、生成モデルを通じて擬似再生画像を生成することにより、プライバシとストレージの問題を回避する。一方、MB-PR戦略は、現在の画像量と再生画像量に大きな差があるため、リプレイデータと現在のトレーニングデータとのモデル偏差を補正することも可能である。したがって、新しいタスクと古いタスクの両方で効果的な表現学習を行うことができる。サンスロスはモデルの出力ロジットを調整することでモデルフィッティングを助け、トレーニングの堅牢性も向上する。大規模連続的セマンティックセグメンテーション (CSS) 実験は, 内視鏡的シーンにおけるクラスインクリメントによる破滅的忘れに頑健かつ効果的に対処できることを実証した。その結果,本フレームワークはストリーミング学習方式で実世界の展開に優れた可能性を秘めていることがわかった。

関連論文リスト

Learned Image Compression and Restoration for Digital Pathology [3.7263231077138608]
デジタル病理画像は医療診断において重要な役割を担っているが、その超高解像度と大きなファイルサイズは、ストレージ、トランスミッション、リアルタイム可視化に重大な課題をもたらす。スライド画像全体(WSI)に特化して設計された新しいディープラーニングベースの画像圧縮フレームワークCLERICを提案する。 CLERICは学習可能なリフトスキームと高度な畳み込み技術を統合し、重要な病理情報を保存しながら圧縮効率を向上させる。
論文参考訳（メタデータ） (2025-03-31T09:09:09Z)
Pathology Image Compression with Pre-trained Autoencoders [52.208181380986524]
デジタル病理学における全スライド画像は、記憶、伝達、計算効率の面で大きな課題をもたらす。 JPEGのような標準的な圧縮手法はファイルサイズを小さくするが、下流のタスクに不可欠な微細な表現型の詳細を保存できない。本研究では,遅延拡散モデル用に設計されたオートエンコーダ(AE)を,病理画像の効率的な学習圧縮フレームワークとして再利用する。
論文参考訳（メタデータ） (2025-03-14T17:01:17Z)
Re-Visible Dual-Domain Self-Supervised Deep Unfolding Network for MRI Reconstruction [48.30341580103962]
本稿では、これらの問題に対処するために、新しい再視覚的二重ドメイン自己教師型深層展開ネットワークを提案する。エンド・ツー・エンドの再構築を実現するために,シャンブルとポック・プロキシ・ポイント・アルゴリズム(DUN-CP-PPA)に基づく深層展開ネットワークを設計する。高速MRIおよびIXIデータセットを用いて行った実験により,本手法は再建性能において最先端の手法よりも有意に優れていることが示された。
論文参考訳（メタデータ） (2025-01-07T12:29:32Z)
Image Synthesis with Class-Aware Semantic Diffusion Models for Surgical Scene Segmentation [3.6723640056915436]
本稿では,データ不足と不均衡に対処するクラスアウェア意味拡散モデル(CASDM)を提案する。クラス認識平均二乗誤差とクラス認識自己認識損失関数は、重要で目立たないクラスを優先するように定義されている。我々は、テキストプロンプトを用いて、その内容を特定するために、初めて、新しい方法でマルチクラスセグメンテーションマップを生成する。
論文参考訳（メタデータ） (2024-10-31T14:14:30Z)
Continual Domain Incremental Learning for Privacy-aware Digital Pathology [3.6630930118966814]
連続学習(CL)技術は、分散シフト条件で新しいデータを学習する際の過去のデータ忘れを減らすことを目的としている。我々は、過去のデータを格納し、新しいデータで潜在リプレイを行うために、ジェネレーティブ潜在リプレイベースのCL(GLRCL)アプローチを開発する。
論文参考訳（メタデータ） (2024-09-10T12:21:54Z)
Adaptive Affinity-Based Generalization For MRI Imaging Segmentation Across Resource-Limited Settings [1.5703963908242198]
本稿では,適応親和性に基づく蒸留とカーネルベースの蒸留をシームレスに組み合わせた,新しい関係に基づく知識フレームワークを提案する。革新的アプローチを検証するために,我々は公開されている複数ソースのMRIデータについて実験を行った。
論文参考訳（メタデータ） (2024-04-03T13:35:51Z)
ECLIPSE: Efficient Continual Learning in Panoptic Segmentation with Visual Prompt Tuning [54.68180752416519]
パノプティカルセグメンテーション(英: Panoptic segmentation)は、コンピュータビジョンの最先端タスクである。 ECLIPSE と呼ばれる Visual Prompt Tuning をベースとした,新規で効率的なパノプティカルセグメンテーション手法を提案する。我々のアプローチは、基本モデルのパラメータを凍結し、小さなプロンプト埋め込みだけを微調整することであり、破滅的な忘れ物と塑性の両方に対処する。
論文参考訳（メタデータ） (2024-03-29T11:31:12Z)
Self-STORM: Deep Unrolled Self-Supervised Learning for Super-Resolution Microscopy [55.2480439325792]
我々は、シーケンス固有のモデルベースのオートエンコーダをトレーニングすることで、そのようなデータの必要性を軽減する、深層無学習の自己教師付き学習を導入する。提案手法は, 監視対象の性能を超過する。
論文参考訳（メタデータ） (2024-03-25T17:40:32Z)
ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文参考訳（メタデータ） (2023-09-03T07:55:46Z)
Vision-Language Modelling For Radiological Imaging and Reports In The Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文参考訳（メタデータ） (2023-03-30T18:20:00Z)
Reducing Catastrophic Forgetting in Self Organizing Maps with Internally-Induced Generative Replay [67.50637511633212]
生涯学習エージェントは、パターン知覚データの無限のストリームから継続的に学習することができる。適応するエージェントを構築する上での歴史的難しさの1つは、ニューラルネットワークが新しいサンプルから学ぶ際に、以前取得した知識を維持するのに苦労していることである。この問題は破滅的な忘れ(干渉)と呼ばれ、今日の機械学習の領域では未解決の問題のままである。
論文参考訳（メタデータ） (2021-12-09T07:11:14Z)
About Explicit Variance Minimization: Training Neural Networks for Medical Imaging With Limited Data Annotations [2.3204178451683264]
VAT(Variance Aware Training)法は、モデル損失関数に分散誤差を導入することにより、この特性を利用する。多様な領域から得られた3つの医用画像データセットと様々な学習目標に対するVATの有効性を検証した。
論文参考訳（メタデータ） (2021-05-28T21:34:04Z)
Self-Adaptive Transfer Learning for Multicenter Glaucoma Classification in Fundus Retina Images [9.826586293806837]
マルチセンタデータセット間のドメインギャップを埋めるための自己適応型トランスファーラーニング(SATL)戦略を提案する。具体的には、ソースドメイン上で事前訓練されたDLモデルのエンコーダを使用して、再構成モデルのエンコーダを初期化する。以上の結果から,SATL法はプライベートおよび2つの公共緑内障診断データセット間の領域適応作業に有効であることが示唆された。
論文参考訳（メタデータ） (2021-05-07T05:20:37Z)
HM4: Hidden Markov Model with Memory Management for Visual Place Recognition [54.051025148533554]
自律運転における視覚的位置認識のための隠れマルコフモデルを提案する。我々のアルゴリズムはHM$4$と呼ばれ、時間的ルックアヘッドを利用して、有望な候補画像をパッシブストレージとアクティブメモリ間で転送する。固定被覆領域に対して一定の時間と空間推定が可能であることを示す。
論文参考訳（メタデータ） (2020-11-01T08:49:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。