論文の概要: Rethinking Vector Field Learning for Generative Segmentation
- arxiv url: http://arxiv.org/abs/2603.19218v1
- Date: Thu, 19 Mar 2026 17:58:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:06.324808
- Title: Rethinking Vector Field Learning for Generative Segmentation
- Title(参考訳): 生成セグメンテーションのためのベクトル場学習の再考
- Authors: Chaoyang Wang, Yaobo Liang, Boci Peng, Fan Duan, Jingdong Wang, Yunhai Tong,
- Abstract要約: 生成的セグメンテーションのためのモデリング拡散モデルが注目されている。
ベクトル場学習の観点から拡散セグメンテーションを再考する。
本稿では,学習した消滅速度場を距離認識補正項で拡張するベクトル場再構成手法を提案する。
この補正は、誘引的相互作用と反発的相互作用の両方を導入し、元の拡散訓練フレームワークを保ちながら、セントロイド付近の勾配等級を増大させる。
- 参考スコア(独自算出の注目度): 50.08025820235397
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Taming diffusion models for generative segmentation has attracted increasing attention. While existing approaches primarily focus on architectural tweaks or training heuristics, there remains a limited understanding of the intrinsic mismatch between continuous flow matching objectives and discrete perception tasks. In this work, we revisit diffusion segmentation from the perspective of vector field learning. We identify two key limitations of the commonly used flow matching objective: gradient vanishing and trajectory traversing, which result in slow convergence and poor class separation. To tackle these issues, we propose a principled vector field reshaping strategy that augments the learned velocity field with a detached distance-aware correction term. This correction introduces both attractive and repulsive interactions, enhancing gradient magnitudes near centroids while preserving the original diffusion training framework. Furthermore, we design a computationally efficient, quasi-random category encoding scheme inspired by Kronecker sequences, which integrates seamlessly with an end-to-end pixel neural field framework for pixel-level semantic alignment. Extensive experiments consistently demonstrate significant improvements over vanilla flow matching approaches, substantially narrowing the performance gap between generative segmentation and strong discriminative specialists.
- Abstract(参考訳): 生成的セグメンテーションのためのモデリング拡散モデルが注目されている。
既存のアプローチは主にアーキテクチャの微調整やトレーニングのヒューリスティックスに重点を置いているが、継続的フローマッチングの目的と離散的な知覚タスクとの間の本質的なミスマッチについては、依然として限定的な理解が残っている。
本研究では,ベクトル場学習の観点から拡散セグメンテーションを再考する。
フローマッチングの目的として,勾配の消失と軌跡のトラバースという2つの重要な制約を同定し,収束が遅く,クラス分離が貧弱になることを示した。
これらの問題に対処するために,学習速度場を分離した距離認識補正項で拡張するベクトル場再構成手法を提案する。
この補正は、誘引的相互作用と反発的相互作用の両方を導入し、元の拡散訓練フレームワークを保ちながら、セントロイド付近の勾配等級を増大させる。
さらに,Kroneckerシーケンスにインスパイアされた計算効率のよい準ランダムなカテゴリ符号化方式を設計し,画素レベルのセマンティックアライメントのためのエンドツーエンドのニューラルネットワークフレームワークとシームレスに統合する。
大規模な実験は、バニラフローマッチングアプローチよりも大幅に改善され、生成的セグメンテーションと強力な差別的スペシャリストのパフォーマンスギャップが大幅に狭まる。
関連論文リスト
- SPARK: Stochastic Propagation via Affinity-guided Random walK for training-free unsupervised segmentation [18.627047608492795]
訓練のないセグメンテーション法は、セグメンテーションが拡散に由来する親和性に対するスペクトルグラフ分割問題であるという暗黙的で限定的な仮定に依存している。
適応ラベルプルーニング戦略を用いてランダムウォークに基づく拡散を行うマルコフ伝搬方式を提案する。
提案手法は, 従来のスペクトルクラスタリング手法と比較して, よりシャープな境界, よりコヒーレントな領域, より安定したマスクを生成する。
論文 参考訳(メタデータ) (2026-01-31T05:12:17Z) - Cluster Purge Loss: Structuring Transformer Embeddings for Equivalent Mutants Detection [0.05461938536945722]
本稿では,クロスエントロピー損失を,クラスタパージ損失(Cluster Purge Loss)と呼ばれる深層学習目標と統合する新しいフレームワークを提案する。
等価変異検出領域における最先端性能を実証し,より解釈可能な埋め込み空間を創出する。
論文 参考訳(メタデータ) (2025-07-26T23:07:11Z) - Visual Prompt Tuning in Null Space for Continual Learning [51.96411454304625]
既存のプロンプトチューニング手法は、継続学習(CL)における印象的な性能を示す。
本稿では,従来のタスクの特徴に代表される部分空間に直交する方向のプロンプトを調整し,各タスクを学習することを目的とする。
実際には、即時勾配予測を実装するために、実効的なヌル空間に基づく近似解が提案されている。
論文 参考訳(メタデータ) (2024-06-09T05:57:40Z) - Multi-Grained Cross-modal Alignment for Learning Open-vocabulary
Semantic Segmentation from Text Supervision [23.931443799102663]
我々は,高密度アノテーションを使わずに粒度ギャップを埋めるために,MGCA(Multi-Grained Cross-Modal Alignment)フレームワークを導入する。
具体的には、MGCAは画像とテキストのペアに基づいて擬似多言語意味対応を構築する。
提案手法は最先端の手法よりも大幅に進歩し,その有効性と効率性を実証する。
論文 参考訳(メタデータ) (2024-03-06T13:43:36Z) - Margin Preserving Self-paced Contrastive Learning Towards Domain
Adaptation for Medical Image Segmentation [51.93711960601973]
クロスモーダル医療画像セグメンテーションのための自己ペースコントラスト学習モデルを保存する新しいマージンを提案する。
プログレッシブに洗練されたセマンティックプロトタイプの指導により、埋め込み表現空間の識別性を高めるために、コントラスト損失を減少させる新しいマージンが提案される。
クロスモーダル心セグメンテーションタスクの実験は、MPSCLが意味セグメンテーション性能を大幅に改善することを示した。
論文 参考訳(メタデータ) (2021-03-15T15:23:10Z) - Contradictory Structure Learning for Semi-supervised Domain Adaptation [67.89665267469053]
現在の逆順応法は、クロスドメインの特徴を整列させようとする。
1)条件分布ミスマッチ、2)決定境界のソース領域へのバイアス。
本稿では,対向構造の学習を統一することで,半教師付きドメイン適応のための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-06T22:58:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。