論文の概要: Diffusion Representations for Fine-Grained Image Classification: A Marine Plankton Case Study
- arxiv url: http://arxiv.org/abs/2601.13416v1
- Date: Mon, 19 Jan 2026 21:55:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:23.073512
- Title: Diffusion Representations for Fine-Grained Image Classification: A Marine Plankton Case Study
- Title(参考訳): 微細画像分類のための拡散表現:海面プランクトンケーススタディ
- Authors: A. Nieto Juscafresa, Á. Mazcuñán Herreros, J. Sullivan,
- Abstract要約: 凍結拡散バックボーンは, きめ細かい認識を可能にする。
実世界のプランクトンモニタリング環境において,現実的な影響を伴ってこれを評価した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models have emerged as state-of-the-art generative methods for image synthesis, yet their potential as general-purpose feature encoders remains underexplored. Trained for denoising and generation without labels, they can be interpreted as self-supervised learners that capture both low- and high-level structure. We show that a frozen diffusion backbone enables strong fine-grained recognition by probing intermediate denoising features across layers and timesteps and training a linear classifier for each pair. We evaluate this in a real-world plankton-monitoring setting with practical impact, using controlled and comparable training setups against established supervised and self-supervised baselines. Frozen diffusion features are competitive with supervised baselines and outperform other self-supervised methods in both balanced and naturally long-tailed settings. Out-of-distribution evaluations on temporally and geographically shifted plankton datasets further show that frozen diffusion features maintain strong accuracy and Macro F1 under substantial distribution shift.
- Abstract(参考訳): 拡散モデルは、画像合成の最先端な生成方法として登場したが、汎用的特徴エンコーダとしての可能性はまだ未解明のままである。
ラベル無しで発音と生成を訓練することで、低レベル構造と高レベル構造の両方をキャプチャする自己教師型学習者として解釈することができる。
凍結拡散バックボーンは, 層と時間ステップにまたがる中間的特徴を探索し, それぞれのペアに対して線形分類器を訓練することにより, 強力な微粒化認識を可能にすることを示す。
我々はこれを実世界におけるプランクトンモニタリングの実践的影響で評価し、既存の教師付きおよび自己監督型ベースラインに対して、制御および同等のトレーニング設定を用いて評価する。
凍結拡散特性は、教師付きベースラインと競合し、バランスと自然に長い尾を持つ設定において、他の自己教師付き手法よりも優れている。
さらに、時間的および地理的にシフトしたプランクトンデータセットの分布外評価により、凍結拡散特性は高い精度を維持し、マクロF1は実質的な分布シフトにあることが示された。
関連論文リスト
- Learning Robust Diffusion Models from Imprecise Supervision [75.53546939251146]
DMISは、Imrecise Supervisionから堅牢な条件拡散モデルをトレーニングするための統一されたフレームワークである。
我々のフレームワークは、可能性から派生し、その目的を生成的および分類的構成要素に分解する。
画像生成、弱教師付き学習、データセットの凝縮をカバーし、様々な形の不正確な監視実験を行い、DMISが常に高品質でクラス差別的なサンプルを生成することを示した。
論文 参考訳(メタデータ) (2025-10-03T14:00:32Z) - Blind-Spot Guided Diffusion for Self-supervised Real-World Denoising [55.099717395320276]
Blind-Spot Guided Diffusionは、現実のイメージをデノナイズするための新しい自己教師型フレームワークである。
提案手法は,盲点ネットワーク(BSN)の限界と,自己教師型認知への拡散モデルの適用の難しさの2つに対処する。
論文 参考訳(メタデータ) (2025-09-19T15:35:07Z) - Prior-Guided Residual Diffusion: Calibrated and Efficient Medical Image Segmentation [11.375625987308927]
Prior-Guided Residual Diffusion (PGRD) は、ボクセルの分布を学習する拡散ベースのフレームワークである。
MRIおよびCTデータセットを用いて評価した。
論文 参考訳(メタデータ) (2025-09-01T10:13:15Z) - CORAL: Disentangling Latent Representations in Long-Tailed Diffusion [4.310167974376405]
長い尾を持つデータセットで訓練した拡散モデルの挙動について検討する。
尾級部分空間の潜在表現は、ヘッドクラスのそれと大きな重複を示す。
本稿では、教師付き相対的損失を利用して、よく区切られた潜在クラス表現を促進するコントラスト型潜在クラスアライメントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-19T00:23:44Z) - Consistent World Models via Foresight Diffusion [56.45012929930605]
我々は、一貫した拡散に基づく世界モデルを学習する上で重要なボトルネックは、最適下予測能力にあると主張している。
本稿では,拡散に基づく世界モデリングフレームワークであるForesight Diffusion(ForeDiff)を提案する。
論文 参考訳(メタデータ) (2025-05-22T10:01:59Z) - DDAE++: Enhancing Diffusion Models Towards Unified Generative and Discriminative Learning [53.27049077100897]
生成前訓練は差別的な表現をもたらし、統一された視覚生成と理解への道を開くことが示されている。
この研究は自己条件付けを導入し、ネットワークに固有のリッチなセマンティクスを内部的に活用し、独自のデコード層をガイドする。
提案手法は、FIDの生成と認識の精度を1%の計算オーバーヘッドで向上させ、多様な拡散アーキテクチャで一般化する。
論文 参考訳(メタデータ) (2025-05-16T08:47:16Z) - Improving Vector-Quantized Image Modeling with Latent Consistency-Matching Diffusion [55.185588994883226]
VQ-LCMDは、学習を安定させる埋め込み空間内の連続空間潜在拡散フレームワークである。
VQ-LCMDは、関節埋め込み拡散変動下界と整合整合性(CM)損失を組み合わせた新しいトレーニング目標を使用する。
実験により,提案したVQ-LCMDは離散状態潜伏拡散モデルと比較して,FFHQ,LSUN教会,LSUNベッドルームにおいて優れた結果が得られることが示された。
論文 参考訳(メタデータ) (2024-10-18T09:12:33Z) - Training Class-Imbalanced Diffusion Model Via Overlap Optimization [55.96820607533968]
実世界のデータセットで訓練された拡散モデルは、尾クラスの忠実度が劣ることが多い。
拡散モデルを含む深い生成モデルは、豊富な訓練画像を持つクラスに偏りがある。
本研究では,異なるクラスに対する合成画像の分布の重複を最小限に抑えるために,コントラスト学習に基づく手法を提案する。
論文 参考訳(メタデータ) (2024-02-16T16:47:21Z) - Insights into Closed-form IPM-GAN Discriminator Guidance for Diffusion Modeling [11.68361062474064]
本稿では,GAN判別器がLangevinに基づくサンプリングに与える影響を理論的に解析する枠組みを提案する。
提案手法は既存の加速拡散技術と組み合わせて潜在空間画像生成を改善することができることを示す。
論文 参考訳(メタデータ) (2023-06-02T16:24:07Z) - Enhancing Diffusion-Based Image Synthesis with Robust Classifier
Guidance [17.929524924008962]
クラス条件生成のために,時間依存型分類器からの勾配による拡散過程の導出を提案した。
このアイデアは理論上は健全だが、ディープラーニングベースの分類器は、勾配に基づく敵対攻撃に悪名高い。
本研究では,時間依存型頑健な分類器を定義・訓練し,生成拡散モデルのガイダンスとして利用する。
論文 参考訳(メタデータ) (2022-08-18T06:51:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。