論文の概要: DCDB: Dynamic Conditional Dual Diffusion Bridge for Ill-posed Multi-Tasks
- arxiv url: http://arxiv.org/abs/2509.03044v1
- Date: Wed, 03 Sep 2025 06:12:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 21:40:46.430957
- Title: DCDB: Dynamic Conditional Dual Diffusion Bridge for Ill-posed Multi-Tasks
- Title(参考訳): DCDB: Ill-posed Multi-Tasksのための動的条件付きデュアル拡散ブリッジ
- Authors: Chengjie Huang, Jiafeng Yan, Jing Li, Lu Bai,
- Abstract要約: 本研究では, 動的条件付き二重拡散橋の訓練パラダイムを提案する。
本研究では,1段階の認知過程において,異なる条件下でのネットワークの学習目標を解析する。
公開データセット上の複数の指標で最高のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 6.156822646166696
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Conditional diffusion models have made impressive progress in the field of image processing, but the characteristics of constructing data distribution pathways make it difficult to exploit the intrinsic correlation between tasks in multi-task scenarios, which is even worse in ill-posed tasks with a lack of training data. In addition, traditional static condition control makes it difficult for networks to learn in multi-task scenarios with its dynamically evolving characteristics. To address these challenges, we propose a dynamic conditional double diffusion bridge training paradigm to build a general framework for ill-posed multi-tasks. Firstly, this paradigm decouples the diffusion and condition generation processes, avoiding the dependence of the diffusion model on supervised data in ill-posed tasks. Secondly, generated by the same noise schedule, dynamic conditions are used to gradually adjust their statistical characteristics, naturally embed time-related information, and reduce the difficulty of network learning. We analyze the learning objectives of the network under different conditional forms in the single-step denoising process and compare the changes in its attention weights in the network, demonstrating the superiority of our dynamic conditions. Taking dehazing and visible-infrared fusion as typical ill-posed multi-task scenarios, we achieve the best performance in multiple indicators on public datasets. The code has been publicly released at: https://anonymous.4open.science/r/DCDB-D3C2.
- Abstract(参考訳): 条件付き拡散モデルは画像処理の分野で顕著な進歩を遂げてきたが、データ分散経路の構築の特徴は、マルチタスクシナリオにおけるタスク間の本質的な相関の活用を困難にしている。
さらに、従来の静的条件制御により、ネットワークが動的に進化する特性を持つマルチタスクシナリオで学習することが困難になる。
これらの課題に対処するため、我々は動的条件付き二重拡散橋の訓練パラダイムを提案し、不適切なマルチタスクのための一般的なフレームワークを構築する。
第一に、このパラダイムは拡散と条件生成のプロセスを分離し、不適切なタスクにおける教師付きデータへの拡散モデルの依存を避ける。
第二に、同じノイズスケジュールによって生成される動的条件は、その統計特性を徐々に調整し、時間関連の情報を自然に埋め込んで、ネットワーク学習の難しさを軽減するために使用される。
本研究では,1段階の認知過程における異なる条件下でのネットワークの学習目標を分析し,ネットワーク内の注意重みの変化を比較し,動的条件の優越性を実証する。
一般的な不正なマルチタスクシナリオとして、デハジングと可視赤外線融合を考慮し、公開データセット上の複数の指標で最高のパフォーマンスを達成する。
コードは、https://anonymous.4open.science/r/DCDB-D3C2で公開されている。
関連論文リスト
- Packet-Level DDoS Data Augmentation Using Dual-Stream Temporal-Field Diffusion [2.8498570090658726]
DDoS(Distributed Denial of Service)攻撃に対して、最近の研究は機械学習(ML)ベースのソリューションにますます依存している。
現在の合成トレース生成法は、現生のDDoS攻撃で現れる複雑な時間パターンと空間分布を捉えるのに苦労している。
拡散モデルに基づく多視点マルチストリームネットワークトラフィック生成モデルであるDual-Stream Temporal-Field Diffusion (DSTF-Diffusion)を提案する。
論文 参考訳(メタデータ) (2025-07-27T03:40:56Z) - MoCa: Modality-aware Continual Pre-training Makes Better Bidirectional Multimodal Embeddings [75.0617088717528]
MoCaは、トレーニング済みのVLMバックボーンを効果的な双方向埋め込みモデルに変換するためのフレームワークである。
MoCaは、MMEBとViDoRe-v2ベンチマークのパフォーマンスを継続的に改善し、新しい最先端の結果を達成する。
論文 参考訳(メタデータ) (2025-06-29T06:41:00Z) - Structural-Temporal Coupling Anomaly Detection with Dynamic Graph Transformer [41.16574023720132]
動的グラフトランスモデルを用いた構造・時間結合異常検出アーキテクチャを提案する。
具体的には、2つの統合レベルから構造的特徴と時間的特徴を導入し、異常を意識したグラフの進化パターンを提供する。
論文 参考訳(メタデータ) (2025-05-13T08:10:41Z) - Underlying Semantic Diffusion for Effective and Efficient In-Context Learning [113.4003355229632]
Underlying Semantic Diffusion (US-Diffusion)は、セマンティック学習、計算効率、文脈内学習能力を高める拡張拡散モデルである。
本稿では,フィードバック信号を利用したフィードバック支援学習(FAL)フレームワークを提案する。
また,高雑音レベルの時間ステップで高密度サンプリングを行うためのプラグイン・アンド・プレイの効率的なサンプリング戦略(ESS)を提案する。
論文 参考訳(メタデータ) (2025-03-06T03:06:22Z) - Dynamical Diffusion: Learning Temporal Dynamics with Diffusion Models [71.63194926457119]
動的拡散(DyDiff, Dynamical Diffusion)は, 時間的に意識された前と逆のプロセスを含む理論的に健全なフレームワークである。
科学的時間的予測、ビデオ予測、時系列予測に関する実験は、動的拡散が時間的予測タスクのパフォーマンスを一貫して改善することを示した。
論文 参考訳(メタデータ) (2025-03-02T16:10:32Z) - Causal Time-Series Synchronization for Multi-Dimensional Forecasting [1.1060425537315088]
プロセス産業のDigital Twinsに対する高い期待は、タスクや多様なドメインをまたいで一般化できるモデリングアプローチを必要とする。
提案手法は, (i) データ駆動方式を用いて高度にタグ付けされた因果関係を同定し, (ii) 原因-影響ペアを同期させて, チャネル依存事前学習のためのトレーニングサンプルを生成し, (iii) チャネル依存予測におけるこのアプローチの有効性を評価することに焦点を当てる。
論文 参考訳(メタデータ) (2024-11-15T12:50:57Z) - T-SaS: Toward Shift-aware Dynamic Adaptation for Streaming Data [9.829993835712422]
本稿では,突発的な分散シフトの存在下での逐次データモデリングの課題を解決することを目的とする。
具体的には、データの急激なシフトを捉えるために、離散分布モデリング変数を持つT-SaSと呼ばれるベイズフレームワークを設計する。
提案手法は,全ネットワーク上でどのニューロンを活性化すべきかを学習することで,各分布の特定のモデルパラメータを学習する。
論文 参考訳(メタデータ) (2023-09-05T22:55:10Z) - Diffusion Model is an Effective Planner and Data Synthesizer for
Multi-Task Reinforcement Learning [101.66860222415512]
Multi-Task Diffusion Model (textscMTDiff) は、トランスフォーマーのバックボーンを組み込んだ拡散に基づく手法であり、生成計画とデータ合成のための素早い学習を行う。
生成計画において、textscMTDiffはMeta-World上の50のタスクとMaze2D上の8のマップで最先端のアルゴリズムより優れています。
論文 参考訳(メタデータ) (2023-05-29T05:20:38Z) - Learning to Continuously Optimize Wireless Resource In Episodically
Dynamic Environment [55.91291559442884]
この研究は、データ駆動型手法が動的環境で継続的に学習し、最適化できる方法論を開発する。
本稿では,無線システム学習のモデリングプロセスに連続学習の概念を構築することを提案する。
我々の設計は、異なるデータサンプル間で「一定の公正性を保証する」新しいmin-maxの定式化に基づいている。
論文 参考訳(メタデータ) (2020-11-16T08:24:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。