論文の概要: C^2GR: Coupled Comprehensive Generative Replay for a Continually Learnable Universal Segmentation Model
- arxiv url: http://arxiv.org/abs/2606.23473v1
- Date: Mon, 22 Jun 2026 15:19:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 18:52:03.883755
- Title: C^2GR: Coupled Comprehensive Generative Replay for a Continually Learnable Universal Segmentation Model
- Title(参考訳): C^2GR: 連続学習可能なユニバーサルセグメンテーションモデルのための包括的包括的生成再生
- Authors: Wei Li, Jingyang Zhang, Guoan Wang, Junzhi Ning, Yang Chen, Guang Yang, Lixu Gu,
- Abstract要約: ユニバーサルセグメンテーションモデルは、様々な画像モダリティとセグメンテーションの目的を含む様々なタスクに重要な可能性を示す。
タスクインクリメンタルラーニング(Task-Incremental Learning)は、シーケンシャルに登録される医療部門からタスクの普遍的なモデルを継続的に進化させる、プライバシー保護アプローチを提供する。
本稿では,従来のタスクのイメージマスク対を同時に合成する新しいC2GR(Coupled Comprehensive Generative)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 17.749377881392828
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Universal segmentation models exhibit significant potential for diverse tasks involving different imaging modalities and segmentation objectives. Task-Incremental Learning provides a privacy-preserving approach to continually evolve a universal model on tasks from sequentially-arriving medical departments. However, training the model solely on the incoming task induces forgetting on past tasks, since consecutive tasks exhibit concurrent shifts in image appearance and segmentation objective. To address this problem, we propose a novel Coupled Comprehensive Generative Replay (C^2GR) framework that simultaneously synthesizes image-mask pairs of previous tasks to mitigate forgetting under concurrent appearance and objective shifts. This requires preserving image-mask correspondence for structure-realistic generation and bridging asynchronous optimization of the generator and segmentor for segmentation-oriented generation. Specifically, we propose a Bayesian Joint Diffusion (BJD) method that formulates the correspondence as conditional distributions optimized via conditional denoising. Furthermore, we develop a Relation-aware Unified Prompt Synchronization (RUPS) scheme to simultaneously modulate the generator and segmentor via a shared task-relation-aware prompt for synchronizing their optimization. Experiments on 20 tasks spanning diverse modalities and objectives demonstrate that C^2GR exhibits only a 2.44% drop in overall performance compared to joint training with all task data, effectively alleviating forgetting from the concurrent shifts. Our code will be made publicly available at https://github.com/mar-cry/C2GR.
- Abstract(参考訳): ユニバーサルセグメンテーションモデルは、様々な画像モダリティとセグメンテーションの目的を含む様々なタスクに重要な可能性を示す。
タスクインクリメンタルラーニング(Task-Incremental Learning)は、シーケンシャルに登録される医療部門からタスクの普遍的なモデルを継続的に進化させる、プライバシー保護アプローチを提供する。
しかし、連続タスクは画像の外観やセグメンテーション目的の同時変化を示すため、入力タスクのみをトレーニングすることで過去のタスクを忘れてしまう。
この問題に対処するために,従来のタスクのイメージマスク対を同時に合成し,同時出現や目標シフトによる忘れを緩和する,結合包括的生成再生(C^2GR)フレームワークを提案する。
これには、構造現実的な生成のためのイメージマスク対応の保存と、セグメンテーション指向生成のためのジェネレータとセグメンタの非同期最適化が必要である。
具体的には,ベイズ連成拡散法 (BJD) を提案する。
さらに,その最適化を同期する共有タスク・リレーショナル・アウェア・プロンプトを用いて,ジェネレータとセグメンタを同時に変調するリレーショナルアウェア統一プロンプト同期(RUPS)方式を開発した。
C^2GRは全タスクデータとの共同トレーニングと比較して,全体のパフォーマンスが2.44%低下し,同時シフトからの忘れを効果的に緩和することを示した。
私たちのコードはhttps://github.com/mar-cry/C2GRで公開されます。
関連論文リスト
- Uni-Synergy: Bridging Understanding and Generation for Personalized Reasoning via Co-operative Reinforcement Learning [56.99010101756807]
我々は、パーソナライズされた理解と生成を共同で最適化する、エンドツーエンドの強化学習フレームワークSync-R1を提案する。
Sync-R1はパーソナライズされた理解を可能にしてコンテンツ生成をガイドし、生成した品質は相互に理解を洗練させる。
また,低電位トラジェクタを適応的にフィルタして勾配分散を低減し,収束を加速する動的グループスケーリング(DGS)も導入する。
実験結果から,Sync-R1は高度なクロスタスク推論とロバストなパーソナライゼーションを実現していることがわかった。
論文 参考訳(メタデータ) (2026-05-11T12:18:26Z) - GenMask: Adapting DiT for Segmentation via Direct Mask Generation [81.54526445834294]
間接的な適応の代わりに、セグメント化タスクは生成的な方法で直接訓練されるべきである、と我々は主張する。
分割のための極度のノイズレベルと画像生成のための中等度雑音を強調する二元マスクの時間ステップサンプリング戦略を導入する。
GenMaskは,RGB空間における色鮮やかな画像だけでなく,黒と白のセグメンテーションマスクを生成するためのDiTトレインである。
論文 参考訳(メタデータ) (2026-03-25T03:52:05Z) - Comprehensive Generative Replay for Task-Incremental Segmentation with Concurrent Appearance and Semantic Forgetting [49.87694319431288]
一般的なセグメンテーションモデルは、異なる画像ソースからの様々なオブジェクトを含む様々なタスクに対して、ますます好まれている。
画像とマスクのペアを合成することで外観と意味の知識を復元する包括的生成(CGR)フレームワークを提案する。
漸進的タスク(心身、基礎、前立腺のセグメンテーション)の実験は、同時出現と意味的忘れを緩和する上で、明らかな優位性を示している。
論文 参考訳(メタデータ) (2024-06-28T10:05:58Z) - Towards a Unified Transformer-based Framework for Scene Graph Generation
and Human-object Interaction Detection [116.21529970404653]
本稿では,Transformerアーキテクチャに基づく一段階統一モデルであるSG2HOI+を紹介する。
本手法では,SGGとHOI検出のタスクをシームレスに統一する2つの対話型階層変換器を用いる。
提案手法は最先端のHOI法と比較して競争性能が向上する。
論文 参考訳(メタデータ) (2023-11-03T07:25:57Z) - Unified Segment-to-Segment Framework for Simultaneous Sequence
Generation [38.27500308373048]
同時シーケンス生成のための統合セグメント・ツー・セグメンテーション・フレームワーク(Seg2Seg)を提案する。
Seg2Segは適応的で統一された方法でマッピングを学習する。
複数の同時生成タスクの実験は、Seg2Segが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2023-10-27T07:34:51Z) - RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - CoADNet: Collaborative Aggregation-and-Distribution Networks for
Co-Salient Object Detection [91.91911418421086]
Co-Salient Object Detection (CoSOD)は、2つ以上の関連する画像を含む所定のクエリグループに繰り返し現れる健全なオブジェクトを発見することを目的としている。
課題の1つは、画像間の関係をモデリングし、活用することによって、コ・サリヤ・キューを効果的にキャプチャする方法である。
我々は,複数画像から有能かつ反復的な視覚パターンを捉えるために,エンドツーエンドの協調集約配信ネットワーク(CoADNet)を提案する。
論文 参考訳(メタデータ) (2020-11-10T04:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。