論文の概要: Symmetrical Flow Matching: Unified Image Generation, Segmentation, and Classification with Score-Based Generative Models
- arxiv url: http://arxiv.org/abs/2506.10634v1
- Date: Thu, 12 Jun 2025 12:19:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 15:37:22.725217
- Title: Symmetrical Flow Matching: Unified Image Generation, Segmentation, and Classification with Score-Based Generative Models
- Title(参考訳): 対称フローマッチング:スコアベース生成モデルを用いた統一画像生成・分割・分類
- Authors: Francisco Caetano, Christiaan Viviers, Peter H. N. De With, Fons van der Sommen,
- Abstract要約: Flow Matchingは、分散間の継続的な変換を学ぶための強力なフレームワークとして登場した。
この研究は、セマンティックセグメンテーション、分類、画像生成を単一のモデルで統一する新しい定式化であるSymmetrical Flow Matchingを導入している。
CelebAMask-HQでは1.9点、COCO-Stuffでは7.0点、推論ステップは25点である。
- 参考スコア(独自算出の注目度): 7.561148568365396
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Flow Matching has emerged as a powerful framework for learning continuous transformations between distributions, enabling high-fidelity generative modeling. This work introduces Symmetrical Flow Matching (SymmFlow), a new formulation that unifies semantic segmentation, classification, and image generation within a single model. Using a symmetric learning objective, SymmFlow models forward and reverse transformations jointly, ensuring bi-directional consistency, while preserving sufficient entropy for generative diversity. A new training objective is introduced to explicitly retain semantic information across flows, featuring efficient sampling while preserving semantic structure, allowing for one-step segmentation and classification without iterative refinement. Unlike previous approaches that impose strict one-to-one mapping between masks and images, SymmFlow generalizes to flexible conditioning, supporting both pixel-level and image-level class labels. Experimental results on various benchmarks demonstrate that SymmFlow achieves state-of-the-art performance on semantic image synthesis, obtaining FID scores of 11.9 on CelebAMask-HQ and 7.0 on COCO-Stuff with only 25 inference steps. Additionally, it delivers competitive results on semantic segmentation and shows promising capabilities in classification tasks. The code will be publicly available.
- Abstract(参考訳): Flow Matchingは、分散間の継続的な変換を学ぶための強力なフレームワークとして登場し、高忠実な生成モデリングを可能にしている。
この研究はSymmetrical Flow Matching (SymmFlow)を導入し、セマンティックセグメンテーション、分類、画像生成を単一のモデルで統一する新しい定式化を行った。
対称学習の目的を用いて、SymFlowは前方と逆変換を共同でモデル化し、双方向の一貫性を確保しながら、生成的多様性に十分なエントロピーを保持する。
セマンティックな構造を維持しながら効率的なサンプリングを特徴とし、反復的な洗練を伴わずに一段階のセグメンテーションと分類を可能にする。
マスクとイメージの厳密な1対1マッピングを強制する従来のアプローチとは異なり、SymFlowはフレキシブルな条件付けに一般化し、ピクセルレベルとイメージレベルの両方のクラスラベルをサポートする。
様々なベンチマーク実験の結果、SymFlowはセマンティック画像合成における最先端のパフォーマンスを達成し、CelebAMask-HQで1.9、COCO-Stuffで7.0のFIDスコアを得ることができた。
さらに、セマンティックセグメンテーションの競争結果を提供し、分類タスクで有望な機能を示す。
コードは公開されます。
関連論文リスト
- Semantic-Aligned Learning with Collaborative Refinement for Unsupervised VI-ReID [82.12123628480371]
教師なしの人物再識別(USL-VI-ReID)は、モデル学習のための人間のアノテーションを使わずに、同じ人物の歩行者像を異なるモードでマッチングすることを目指している。
従来の手法では、ラベルアソシエーションアルゴリズムを用いて異質な画像の擬似ラベルを統一し、グローバルな特徴学習のためのコントラスト学習フレームワークを設計していた。
本稿では,各モダリティによって強調される特定のきめ細かいパターンを対象とするSALCR(Semantic-Aligned Learning with Collaborative Refinement)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-27T13:58:12Z) - SemFlow: Binding Semantic Segmentation and Image Synthesis via Rectified Flow [94.90853153808987]
セマンティックセグメンテーション(Semantic segmentation)とセマンティックイメージ合成(Semantic image synthesis)は、視覚知覚と生成において代表的なタスクである。
我々は、統一されたフレームワーク(SemFlow)を提案し、それらを2つの逆問題としてモデル化する。
実験の結果,セマンティックセグメンテーションとセマンティック画像合成タスクにおいて,セマンティックセグメンテーションと競合する結果が得られた。
論文 参考訳(メタデータ) (2024-05-30T17:34:40Z) - Semantic Image Synthesis via Diffusion Models [174.24523061460704]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に事実上のGANベースのアプローチに従っている。
意味画像合成のためのDDPMに基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - Learning Contrastive Representation for Semantic Correspondence [150.29135856909477]
セマンティックマッチングのためのマルチレベルコントラスト学習手法を提案する。
画像レベルのコントラスト学習は、畳み込み特徴が類似したオブジェクト間の対応を見出すための鍵となる要素であることを示す。
論文 参考訳(メタデータ) (2021-09-22T18:34:14Z) - Diverse Semantic Image Synthesis via Probability Distribution Modeling [103.88931623488088]
新規な多様な意味的画像合成フレームワークを提案する。
本手法は最先端手法と比較して優れた多様性と同等の品質を実現することができる。
論文 参考訳(メタデータ) (2021-03-11T18:59:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。