Fugu-MT 論文翻訳(概要): DuSSS: Dual Semantic Similarity-Supervised Vision-Language Model for Semi-Supervised Medical Image Segmentation

論文の概要: DuSSS: Dual Semantic Similarity-Supervised Vision-Language Model for Semi-Supervised Medical Image Segmentation

arxiv url: http://arxiv.org/abs/2412.12492v1
Date: Tue, 17 Dec 2024 02:47:00 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-18 17:09:38.520859
Title: DuSSS: Dual Semantic Similarity-Supervised Vision-Language Model for Semi-Supervised Medical Image Segmentation
Title（参考訳）: DuSSS: 半監督医用画像分割のためのデュアルセマンティック類似性スーパービジョンランゲージモデル
Authors: Qingtao Pan, Wenhao Qiao, Jingjiao Lou, Bing Ji, Shuo Li,
Abstract要約: 半教師付き医療画像セグメンテーション(SSMIS)は、整合性学習を用いてモデルのトレーニングを規則化する。 SSMISは、しばしば低品質の擬似ラベルのエラー管理に悩まされる。 SSMISのためのDuSSS(Dual Semantic similarity-Supervised VLM)を提案する。
参考スコア（独自算出の注目度）: 4.523111195300109
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Semi-supervised medical image segmentation (SSMIS) uses consistency learning to regularize model training, which alleviates the burden of pixel-wise manual annotations. However, it often suffers from error supervision from low-quality pseudo labels. Vision-Language Model (VLM) has great potential to enhance pseudo labels by introducing text prompt guided multimodal supervision information. It nevertheless faces the cross-modal problem: the obtained messages tend to correspond to multiple targets. To address aforementioned problems, we propose a Dual Semantic Similarity-Supervised VLM (DuSSS) for SSMIS. Specifically, 1) a Dual Contrastive Learning (DCL) is designed to improve cross-modal semantic consistency by capturing intrinsic representations within each modality and semantic correlations across modalities. 2) To encourage the learning of multiple semantic correspondences, a Semantic Similarity-Supervision strategy (SSS) is proposed and injected into each contrastive learning process in DCL, supervising semantic similarity via the distribution-based uncertainty levels. Furthermore, a novel VLM-based SSMIS network is designed to compensate for the quality deficiencies of pseudo-labels. It utilizes the pretrained VLM to generate text prompt guided supervision information, refining the pseudo label for better consistency regularization. Experimental results demonstrate that our DuSSS achieves outstanding performance with Dice of 82.52%, 74.61% and 78.03% on three public datasets (QaTa-COV19, BM-Seg and MoNuSeg).
Abstract（参考訳）: 半教師付き医療画像セグメンテーション(SSMIS)は、一貫性学習を用いてモデルトレーニングを規則化し、ピクセルワイドな手動アノテーションの負担を軽減する。しかし、しばしば低品質の擬似ラベルのエラー管理に悩まされる。 Vision-Language Model (VLM) は、テキストプロンプトによるマルチモーダル監視情報の導入により、擬似ラベルの強化に大きな可能性を秘めている。にもかかわらず、それはクロスモーダルな問題に直面している: 得られたメッセージは複数のターゲットに対応する傾向がある。上記の問題に対処するため、SSMISのためのDuSSS(Dual Semantic similarity-Supervised VLM)を提案する。具体的には 1)DCL(Dual Contrastive Learning)は,各モダリティにおける内在的表現とモダリティ間の意味的相関を捉えることによって,モダリティ間のセマンティック一貫性を改善するように設計されている。 2)複数の意味的対応の学習を促進するために,DCLにおける各コントラスト学習プロセスにSSS(Semantic similarity-Supervision Strategy)を提案し,分布に基づく不確実性レベルを通じて意味的類似性を監督する。さらに,新たなVLMベースのSSMISネットワークは,擬似ラベルの品質欠陥を補うように設計されている。事前訓練されたVLMを使用して、テキストプロンプトによる監視情報を生成し、疑似ラベルを改良して一貫性の整合性を向上する。実験の結果,DuSSSは3つの公開データセット(QaTa-COV19,BM-Seg,MoNuSeg)で82.52%,74.61%,78.03%のDiceで優れた性能を示した。

関連論文リスト

Fully Differentiable Bidirectional Dual-Task Synergistic Learning for Semi-Supervised 3D Medical Image Segmentation [3.9950415168730107]
半教師付き学習は、ラベルなしデータを活用することにより、画像セグメンテーションのための大きなピクセル単位のラベル付きデータセットの必要性を緩和する。我々は,4つの重要なSSLコンポーネントをシームレスに統合し,拡張する,完全に微分可能な双方向シナジスティックラーニング(DBiSL)フレームワークを提案する。
論文参考訳（メタデータ） (2026-02-10T03:44:24Z)
Modality-Specific Enhancement and Complementary Fusion for Semi-Supervised Multi-Modal Brain Tumor Segmentation [6.302779966909783]
医用画像セグメンテーションのための新しい半教師付きマルチモーダルフレームワークを提案する。モダリティ固有のエンハンシングモジュール(MEM)を導入し、各モダリティに意味的なユニークな手がかりを強化する。また,学習可能な相補的情報融合(CIF)モジュールを導入し,モダリティ間の相補的知識を適応的に交換する。
論文参考訳（メタデータ） (2025-12-10T16:15:17Z)
Dual-level Modality Debiasing Learning for Unsupervised Visible-Infrared Person Re-Identification [59.59359638389348]
本稿では,モデルと最適化の両レベルでのデバイアス処理を実装したデュアルレベルのモダリティ・デバイアス学習フレームワークを提案する。ベンチマークデータセットの実験では、DMDLはモダリティ不変の特徴学習とより一般化されたモデルを可能にすることを示した。
論文参考訳（メタデータ） (2025-12-03T12:43:16Z)
Vision-Language Enhanced Foundation Model for Semi-supervised Medical Image Segmentation [6.524403694193453]
半教師付き学習(SSL)は医用画像セグメンテーションの有効なパラダイムとして登場した。 SSLフレームワークに基盤レベルの視覚的セマンティック理解を組み込んだVESSA(Vision-Language Enhanced Semi-supervised Assistant)を導入する。ステージ1では、VESSAはゴールドスタンダードの例を含むテンプレートバンクを使用して、参照誘導セグメンテーションアシスタントとして訓練される。ステージ2では、VESSAは最先端のSSLフレームワークに統合され、学生モデルとの動的相互作用を可能にする。
論文参考訳（メタデータ） (2025-11-24T22:33:19Z)
MoCa: Modality-aware Continual Pre-training Makes Better Bidirectional Multimodal Embeddings [75.0617088717528]
MoCaは、トレーニング済みのVLMバックボーンを効果的な双方向埋め込みモデルに変換するためのフレームワークである。 MoCaは、MMEBとViDoRe-v2ベンチマークのパフォーマンスを継続的に改善し、新しい最先端の結果を達成する。
論文参考訳（メタデータ） (2025-06-29T06:41:00Z)
Semantic-Aligned Learning with Collaborative Refinement for Unsupervised VI-ReID [82.12123628480371]
教師なしの人物再識別(USL-VI-ReID)は、モデル学習のための人間のアノテーションを使わずに、同じ人物の歩行者像を異なるモードでマッチングすることを目指している。従来の手法では、ラベルアソシエーションアルゴリズムを用いて異質な画像の擬似ラベルを統一し、グローバルな特徴学習のためのコントラスト学習フレームワークを設計していた。本稿では,各モダリティによって強調される特定のきめ細かいパターンを対象とするSALCR(Semantic-Aligned Learning with Collaborative Refinement)フレームワークを提案する。
論文参考訳（メタデータ） (2025-04-27T13:58:12Z)
Estimating Commonsense Plausibility through Semantic Shifts [66.06254418551737]
セマンティックシフトを測定することでコモンセンスの妥当性を定量化する新しい識別フレームワークであるComPaSSを提案する。 2種類の細粒度コモンセンス可視性評価タスクの評価は,ComPaSSが一貫してベースラインを上回っていることを示している。
論文参考訳（メタデータ） (2025-02-19T06:31:06Z)
Multi-Memory Matching for Unsupervised Visible-Infrared Person Re-Identification [30.983346937558743]
USL-VI-ReIDの主な課題は、擬似ラベルを効果的に生成し、擬似ラベル対応を確立することである。我々はUSL-VI-ReIDのためのマルチメモリマッチングフレームワークを提案する。公開SYSU-MM01とRegDBデータセットの実験は、確立された相互モダリティ対応の信頼性を示す。
論文参考訳（メタデータ） (2024-01-12T01:24:04Z)
SMC-NCA: Semantic-guided Multi-level Contrast for Semi-supervised Temporal Action Segmentation [53.010417880335424]
半教師付き時間的アクションセグメンテーション(SS-TA)は、長編ビデオにおいてフレームワイズ分類を行うことを目的としている。近年の研究では、教師なし表現学習におけるコントラスト学習の可能性が示されている。本稿では,SMC-NCA(Neighbourhood-Consistency-Aware Unit)を用いたセマンティック誘導型マルチレベルコントラスト方式を提案する。
論文参考訳（メタデータ） (2023-12-19T17:26:44Z)
Cross-head mutual Mean-Teaching for semi-supervised medical image segmentation [6.738522094694818]
SSMIS(Semi-supervised Medical Image segmentation)は、限られたラベル付きデータと豊富なラベルなしデータを活用することで、大幅な進歩を目撃している。既存のSOTA(State-of-the-art)手法は、ラベルなしデータのラベルを正確に予測する際の課題に直面する。強弱データ拡張を組み込んだ新しいクロスヘッド相互学習ネットワーク(CMMT-Net)を提案する。
論文参考訳（メタデータ） (2023-10-08T09:13:04Z)
DUET: Cross-modal Semantic Grounding for Contrastive Zero-shot Learning [37.48292304239107]
本稿では, DUET という変換器を用いたエンドツーエンドZSL手法を提案する。画像からセマンティック属性を分離するモデルの能力を調べるために,モーダルなセマンティックグラウンドネットワークを開発した。 DUETは、しばしば最先端のパフォーマンスを達成することができ、そのコンポーネントは有効であり、予測は解釈可能である。
論文参考訳（メタデータ） (2022-07-04T11:12:12Z)
Learning Self-Supervised Low-Rank Network for Single-Stage Weakly and Semi-Supervised Semantic Segmentation [119.009033745244]
本稿では,単一段階弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)と半教師付きセマンティクスセマンティクスセマンティクス(SSSS)のための自己教師付き低ランクネットワーク(SLRNet)を提案する。 SLRNetは、画像の異なるビューから複数の注意深いLR表現を同時に予測し、正確な擬似ラベルを学習する。 Pascal VOC 2012、COCO、L2IDデータセットの実験では、SLRNetは最先端のWSSSメソッドとSSSSメソッドの両方で、さまざまな設定で優れています。
論文参考訳（メタデータ） (2022-03-19T09:19:55Z)
Dense Contrastive Visual-Linguistic Pretraining [53.61233531733243]
画像とテキストを共同で表現するマルチモーダル表現学習手法が提案されている。これらの手法は,大規模マルチモーダル事前学習から高レベルな意味情報を取得することにより,優れた性能を実現する。そこで本稿では,非バイアスのDense Contrastive Visual-Linguistic Pretrainingを提案する。
論文参考訳（メタデータ） (2021-09-24T07:20:13Z)
Information Symmetry Matters: A Modal-Alternating Propagation Network for Few-Shot Learning [118.45388912229494]
未ラベルサンプルの欠落した意味情報を補うために,モーダル代替伝搬ネットワーク (MAP-Net) を提案する。我々は,情報伝達がより有益になるように,セマンティクスを介して視覚的関係ベクトルを誘導するリレーガイダンス(RG)戦略を設計する。提案手法は有望な性能を達成し,最先端の手法よりも優れる。
論文参考訳（メタデータ） (2021-09-03T03:43:53Z)
Learning Relation Alignment for Calibrated Cross-modal Retrieval [52.760541762871505]
言語的・視覚的関係のセマンティックな距離を計測し,関係の一貫性を定量化するための新しい指標ISD(Intra-modal Self-attention Distance)を提案する。 ISDを最適化し、モダル間アライメントを介してモダル内アライメントを相互に調整するための正規化訓練法である、モダル内アライメント(IAIS)について述べる。
論文参考訳（メタデータ） (2021-05-28T14:25:49Z)
Weakly supervised segmentation with cross-modality equivariant constraints [7.757293476741071]
弱い教師付き学習は、セマンティックセグメンテーションにおける大きなラベル付きデータセットの必要性を軽減するための魅力的な代替手段として登場した。本稿では,マルチモーダル画像シナリオにおける自己スーパービジョンを活用した新しい学習戦略を提案する。私たちのアプローチは、同じ学習条件下で関連する最近の文学を上回ります。
論文参考訳（メタデータ） (2021-04-06T13:14:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。