論文の概要: Joint Enhancement and Classification using Coupled Diffusion Models of Signals and Logits
- arxiv url: http://arxiv.org/abs/2602.15405v1
- Date: Tue, 17 Feb 2026 07:25:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-18 16:03:18.010093
- Title: Joint Enhancement and Classification using Coupled Diffusion Models of Signals and Logits
- Title(参考訳): 信号とロジットの連成拡散モデルを用いた連成強化と分類
- Authors: Gilad Nurko, Roi Benita, Yehoshua Dissen, Tomohiro Nakatani, Marc Delcroix, Shoko Araki, Joseph Keshet,
- Abstract要約: 2つの相互作用拡散モデルを統合する汎用的なドメインに依存しないフレームワークを提案する。
入力とロジットの結合分布を効果的にモデル化する3つの戦略を導入する。
提案手法は従来の逐次拡張ベースラインを超越し,多様な雑音条件下での分類精度の堅牢かつ柔軟な改善を実現する。
- 参考スコア(独自算出の注目度): 45.99435851580745
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robust classification in noisy environments remains a fundamental challenge in machine learning. Standard approaches typically treat signal enhancement and classification as separate, sequential stages: first enhancing the signal and then applying a classifier. This approach fails to leverage the semantic information in the classifier's output during denoising. In this work, we propose a general, domain-agnostic framework that integrates two interacting diffusion models: one operating on the input signal and the other on the classifier's output logits, without requiring any retraining or fine-tuning of the classifier. This coupled formulation enables mutual guidance, where the enhancing signal refines the class estimation and, conversely, the evolving class logits guide the signal reconstruction towards discriminative regions of the manifold. We introduce three strategies to effectively model the joint distribution of the input and the logit. We evaluated our joint enhancement method for image classification and automatic speech recognition. The proposed framework surpasses traditional sequential enhancement baselines, delivering robust and flexible improvements in classification accuracy under diverse noise conditions.
- Abstract(参考訳): ノイズの多い環境でのロバストな分類は、マシンラーニングにおける根本的な課題である。
標準的なアプローチでは、信号の強化と分類を個別のシーケンシャルな段階として扱い、まず信号を強化し、次に分類器を適用する。
このアプローチは、分類器の出力のセマンティック情報を活用するのに失敗する。
本研究では,2つの相互作用する拡散モデルを統合する汎用的なドメインに依存しないフレームワークを提案する。一方は入力信号で動作し,他方は分類器の出力ロジットで動作し,再学習や微調整は不要である。
この結合された定式化は相互誘導を可能にし、拡張信号はクラス推定を洗練させ、逆に進化するクラスロジットは、多様体の識別領域に向けて信号再構成を導く。
入力とロジットの結合分布を効果的にモデル化する3つの戦略を導入する。
画像分類と自動音声認識のための関節拡張法について検討した。
提案手法は従来の逐次拡張ベースラインを超越し,多様な雑音条件下での分類精度の堅牢かつ柔軟な改善を実現する。
関連論文リスト
- Self-Ensemble Post Learning for Noisy Domain Generalization [18.4218677759831]
本稿では,ノイズに対処する際の既存手法のやり直し方法について検討する。
モデル内の潜在機能には、特定の識別能力があることが分かりました。
本稿では,活用可能な特徴を多様化するセルフアンサンブル・ポストラーニング手法を提案する。
論文 参考訳(メタデータ) (2025-12-11T17:09:35Z) - DiscRec: Disentangled Semantic-Collaborative Modeling for Generative Recommendation [33.152693125551785]
生成的レコメンデーションは、アイテム予測を直接生成する強力なパラダイムとして現れています。
現在の手法ではトークン・イテムのミスアライメントとセマンティック・コラボレーティブな信号の絡み合いという2つの重要な課題に直面している。
Disentangled Semantic-Collaborative Signal Modelingを可能にする新しいフレームワークであるDisdisRecを提案する。
論文 参考訳(メタデータ) (2025-06-18T15:53:47Z) - Studying Classifier(-Free) Guidance From a Classifier-Centric Perspective [100.54185280153753]
分類器なし誘導と分類器なし誘導の両方が,微分拡散軌道を決定境界から遠ざけることによって条件付き生成を実現することがわかった。
本研究では,フローマッチングをベースとした汎用的な後処理ステップを提案し,事前学習した復調拡散モデルに対する学習分布と実データ分布とのギャップを小さくする。
論文 参考訳(メタデータ) (2025-03-13T17:59:59Z) - Audio Contrastive-based Fine-tuning: Decoupling Representation Learning and Classification [26.82307246813389]
本稿では、下流評価から表現の洗練を分離する2段階のアンタングル化フレームワークを提案する。
まず、モデルの埋め込み空間の幾何学的構造を明示的に改善するために「コントラストチューニング」ステージを用いる。
次に、幾何学的観点からこれらの洗練された表現の質を評価するために、双対プローブ評価プロトコルを導入する。
論文 参考訳(メタデータ) (2023-09-21T08:59:13Z) - DiffAug: A Diffuse-and-Denoise Augmentation for Training Robust Classifiers [6.131022957085439]
DiffAugは、画像分類器を訓練するためのシンプルで効率的な拡散に基づく拡張手法である。
与えられた例にDiffAugを適用すると、1つの前方拡散ステップと1つの逆拡散ステップからなる。
論文 参考訳(メタデータ) (2023-06-15T15:19:25Z) - Visualizing Classifier Adjacency Relations: A Case Study in Speaker
Verification and Voice Anti-Spoofing [72.4445825335561]
任意のバイナリ分類器によって生成される検出スコアから2次元表現を導出する簡単な方法を提案する。
ランク相関に基づいて,任意のスコアを用いた分類器の視覚的比較を容易にする。
提案手法は完全に汎用的であり,任意の検出タスクに適用可能だが,自動話者検証と音声アンチスプーフィングシステムによるスコアを用いた手法を実証する。
論文 参考訳(メタデータ) (2021-06-11T13:03:33Z) - Diffusion-Based Representation Learning [65.55681678004038]
教師付き信号のない表現学習を実現するために,デノナイズスコアマッチングフレームワークを拡張した。
対照的に、拡散に基づく表現学習は、デノナイジングスコアマッチング目的の新しい定式化に依存している。
同じ手法を用いて,半教師付き画像分類における最先端モデルの改善を実現する無限次元潜在符号の学習を提案する。
論文 参考訳(メタデータ) (2021-05-29T09:26:02Z) - Ensemble Wrapper Subsampling for Deep Modulation Classification [70.91089216571035]
受信した無線信号のサブサンプリングは、ハードウェア要件と信号処理アルゴリズムの計算コストを緩和するために重要である。
本稿では,無線通信システムにおけるディープラーニングを用いた自動変調分類のためのサブサンプリング手法を提案する。
論文 参考訳(メタデータ) (2020-05-10T06:11:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。