論文の概要: Prompt Group-Aware Training for Robust Text-Guided Nuclei Segmentation
- arxiv url: http://arxiv.org/abs/2603.06384v1
- Date: Fri, 06 Mar 2026 15:34:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 13:17:46.083505
- Title: Prompt Group-Aware Training for Robust Text-Guided Nuclei Segmentation
- Title(参考訳): ロバストテキスト誘導核セグメンテーションのためのプロンプトグループアウェアトレーニング
- Authors: Yonghuang Wu, Zhenyang Liang, Wenwen Zeng, Xuan Xie, Jinhua Yu,
- Abstract要約: 我々はグループワイド整合性問題として即時感度を再構成する。
本研究では,6つのゼロショット・クロスデータセットタスクにおいて,Diceを平均2.16ポイント改善することを示す。
- 参考スコア(独自算出の注目度): 6.329891529118214
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Foundation models such as Segment Anything Model 3 (SAM3) enable flexible text-guided medical image segmentation, yet their predictions remain highly sensitive to prompt formulation. Even semantically equivalent descriptions can yield inconsistent masks, limiting reliability in clinical and pathology workflows. We reformulate prompt sensitivity as a group-wise consistency problem. Semantically related prompts are organized into \emph{prompt groups} sharing the same ground-truth mask, and a prompt group-aware training framework is introduced for robust text-guided nuclei segmentation. The approach combines (i) a quality-guided group regularization that leverages segmentation loss as an implicit ranking signal, and (ii) a logit-level consistency constraint with a stop-gradient strategy to align predictions within each group. The method requires no architectural modification and leaves inference unchanged. Extensive experiments on multi-dataset nuclei benchmarks show consistent gains under textual prompting and markedly reduced performance variance across prompt quality levels. On six zero-shot cross-dataset tasks, our method improves Dice by an average of 2.16 points. These results demonstrate improved robustness and generalization for vision-language segmentation in computational pathology.
- Abstract(参考訳): Segment Anything Model 3 (SAM3) のような基礎モデルでは、柔軟なテキスト誘導医療画像のセグメンテーションが可能であるが、それらの予測は迅速な定式化に非常に敏感である。
意味的に等価な記述でさえ、臨床および病理のワークフローにおける信頼性を制限し、一貫性のないマスクをもたらす可能性がある。
我々はグループワイド整合性問題として即時感度を再構成する。
意味論的に関連するプロンプトは、同じ接地トラスマスクを共有する \emph{prompt group} に編成され、ロバストなテキスト誘導核セグメンテーションのためのグループ認識トレーニングフレームワークが導入された。
アプローチが組み合わさる
一 セグメンテーション損失を暗黙のランキング信号として活用する品質誘導グループ正規化
(i) 各グループ内の予測を整合させる停止段階戦略によるロジトレベルの整合性制約。
設計上の変更は不要で、推論は変更されていない。
マルチデータセット核ベンチマークの大規模な実験は、テキストプロンプトの下で一貫した利得を示し、迅速な品質レベルの性能ばらつきを著しく低減した。
6つのゼロショットクロスデータセットタスクにおいて、Diceを平均2.16ポイント改善する。
これらの結果は、コンピュータ病理学における視覚言語セグメンテーションの堅牢性の向上と一般化を示す。
関連論文リスト
- Structured Prompt Optimization for Few-Shot Text Classification via Semantic Alignment in Latent Space [3.66782592128973]
本研究は, 意味的絡み合い, ラベル構造の不明確さ, 特徴表現不足といった問題に対処する。
低リソース条件下でのセマンティック理解とタスク適応を強化するために,構造化プロンプトに基づく最適化フレームワークを提案する。
実験結果から,提案手法は意味的矛盾やラベルの曖昧さを効果的に軽減する。
論文 参考訳(メタデータ) (2026-02-27T07:31:16Z) - AgenticSum: An Agentic Inference-Time Framework for Faithful Clinical Text Summarization [6.99563009617414]
本稿では, 文脈選択, 生成, 検証, 対象訂正を分離し, 幻覚的内容を減らすための推論時フレームワークであるAgenticSumを提案する。
我々は,2つの公開データセット上で,基準ベースメトリクス,LCM-as-a-judgeアセスメント,人的評価を用いてエージェントサムを評価する。
以上の結果から, 目標修正を施した構造的エージェント設計は, 臨床メモの要約を改善するための効果的な推測時間解を提供することが明らかとなった。
論文 参考訳(メタデータ) (2026-02-23T16:49:37Z) - Group-Adaptive Threshold Optimization for Robust AI-Generated Text Detection [58.419940585826744]
本稿では,確率的AIテキスト検出のためのグループ固有しきい値最適化アルゴリズムであるFairOPTを紹介する。
属性(例えば、テキストの長さと書き込みスタイル)に基づいてデータをサブグループに分割し、FairOPTを実装して、各グループに対する決定しきい値の学習を行い、不一致を低減しました。
我々のフレームワークは、後処理によるAI生成コンテンツ検出において、より堅牢な分類の道を開く。
論文 参考訳(メタデータ) (2025-02-06T21:58:48Z) - SemSim: Revisiting Weak-to-Strong Consistency from a Semantic Similarity Perspective for Semi-supervised Medical Image Segmentation [18.223854197580145]
医用画像分割のための半教師付き学習(SSL)は難しいが、非常に実践的な課題である。
セムシム(SemSim)という名前のFixMatchに基づく新しいフレームワークを提案する。
SemSimは3つの公開セグメンテーションベンチマークで最先端の手法よりも一貫した改善をもたらすことを示す。
論文 参考訳(メタデータ) (2024-10-17T12:31:37Z) - Multi-Grained Cross-modal Alignment for Learning Open-vocabulary
Semantic Segmentation from Text Supervision [23.931443799102663]
我々は,高密度アノテーションを使わずに粒度ギャップを埋めるために,MGCA(Multi-Grained Cross-Modal Alignment)フレームワークを導入する。
具体的には、MGCAは画像とテキストのペアに基づいて擬似多言語意味対応を構築する。
提案手法は最先端の手法よりも大幅に進歩し,その有効性と効率性を実証する。
論文 参考訳(メタデータ) (2024-03-06T13:43:36Z) - Uncovering Prototypical Knowledge for Weakly Open-Vocabulary Semantic
Segmentation [59.37587762543934]
本稿では,弱開語彙セマンティックセマンティックセグメンテーション(WOVSS)の問題点について検討する。
既存の方法は、グループトークンの使用に関する粒度の矛盾に悩まされる。
マルチモーダル正規化を組み込んだプロトタイプ誘導ネットワーク(PGSeg)を提案する。
論文 参考訳(メタデータ) (2023-10-29T13:18:00Z) - Associating Spatially-Consistent Grouping with Text-supervised Semantic
Segmentation [117.36746226803993]
テキスト教師付きセマンティックセグメンテーションを用いた自己教師付き空間一貫性グループ化を提案する。
部分的なグループ化結果を考えると、さらに画像レベルから領域レベルへのテキスト教師付きモデルを適用する。
59.2% mIoU と 32.4% mIoU を Pascal VOC および Pascal Context ベンチマークで達成した。
論文 参考訳(メタデータ) (2023-04-03T16:24:39Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。