論文の概要: LADB: Latent Aligned Diffusion Bridges for Semi-Supervised Domain Translation
- arxiv url: http://arxiv.org/abs/2509.08628v1
- Date: Wed, 10 Sep 2025 14:23:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-11 15:16:52.455456
- Title: LADB: Latent Aligned Diffusion Bridges for Semi-Supervised Domain Translation
- Title(参考訳): LADB:半監督ドメイン翻訳のための潜在配向拡散ブリッジ
- Authors: Xuqin Wang, Tao Wu, Yanfeng Zhang, Lu Liu, Dong Wang, Mingwei Sun, Yongliang Wang, Niclas Zeller, Daniel Cremers,
- Abstract要約: 拡散モデルは高品質な出力を生成するのに優れているが、データスカースドメインでは課題に直面している。
サンプルからサンプルへの変換のための半教師付きフレームワークであるLatent Aligned Diffusion Bridges (LADB)を提案する。
- 参考スコア(独自算出の注目度): 54.690154688667086
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Diffusion models excel at generating high-quality outputs but face challenges in data-scarce domains, where exhaustive retraining or costly paired data are often required. To address these limitations, we propose Latent Aligned Diffusion Bridges (LADB), a semi-supervised framework for sample-to-sample translation that effectively bridges domain gaps using partially paired data. By aligning source and target distributions within a shared latent space, LADB seamlessly integrates pretrained source-domain diffusion models with a target-domain Latent Aligned Diffusion Model (LADM), trained on partially paired latent representations. This approach enables deterministic domain mapping without the need for full supervision. Compared to unpaired methods, which often lack controllability, and fully paired approaches that require large, domain-specific datasets, LADB strikes a balance between fidelity and diversity by leveraging a mixture of paired and unpaired latent-target couplings. Our experimental results demonstrate superior performance in depth-to-image translation under partial supervision. Furthermore, we extend LADB to handle multi-source translation (from depth maps and segmentation masks) and multi-target translation in a class-conditioned style transfer task, showcasing its versatility in handling diverse and heterogeneous use cases. Ultimately, we present LADB as a scalable and versatile solution for real-world domain translation, particularly in scenarios where data annotation is costly or incomplete.
- Abstract(参考訳): 拡散モデルは高品質なアウトプットを生成するのに優れていますが、徹底的なリトレーニングやコストのかかるペアリングが必要なデータスカースドメインでは課題に直面します。
これらの制約に対処するため,サンプル・サンプル間翻訳のための半教師付きフレームワークであるLatent Aligned Diffusion Bridges (LADB)を提案する。
LADBは、ソースとターゲットの分布を共有潜在空間内で整列させることにより、事前訓練されたソースドメイン拡散モデルと、部分的にペア化された潜在表現に基づいてトレーニングされたターゲットドメインの遅延アラインド拡散モデル(LADM)をシームレスに統合する。
このアプローチは、完全な監視を必要としない決定論的ドメインマッピングを可能にする。
制御性に欠ける未ペアの手法や、大きなドメイン固有のデータセットを必要とする完全なペアのアプローチと比較すると、LADBはペアと未ペアの潜在ターゲット結合の混合を活用することで、忠実性と多様性のバランスをとる。
本研究は,部分監督下での深度画像翻訳における優れた性能を示すものである。
さらに,LADBを拡張して,マルチソース翻訳(深度マップやセグメンテーションマスクなど)とマルチターゲット翻訳をクラス条件で処理し,多種多様なユースケースを扱うための汎用性を示す。
最終的に、LADBは、特にデータアノテーションがコストがかかる、あるいは不完全なシナリオにおいて、現実世界のドメイン翻訳のためのスケーラブルで汎用的なソリューションとして提示します。
関連論文リスト
- Let Synthetic Data Shine: Domain Reassembly and Soft-Fusion for Single Domain Generalization [68.41367635546183]
単一ドメインの一般化は、単一のソースからのデータを使用して、さまざまなシナリオで一貫したパフォーマンスでモデルをトレーニングすることを目的としている。
モデル一般化を改善するために合成データを活用した学習フレームワークDRSFを提案する。
論文 参考訳(メタデータ) (2025-03-17T18:08:03Z) - Multisource Collaborative Domain Generalization for Cross-Scene Remote Sensing Image Classification [57.945437355714155]
クロスシーン画像分類は, 異なる分布領域のアノテート領域に, 地中物質の事前の知識を伝達することを目的としている。
既存のアプローチでは、未確認のターゲットドメインへの単一ソースドメインの一般化に重点を置いている。
マルチソースリモートセンシングデータの均一性と不均一性特性に基づく,新しいマルチソース協調型ドメイン一般化フレームワーク(MS-CDG)を提案する。
論文 参考訳(メタデータ) (2024-12-05T06:15:08Z) - Multiple Noises in Diffusion Model for Semi-Supervised Multi-Domain Translation [1.9510388605988505]
マルチドメイン翻訳の課題を解決するために,MDD(Multi-Domain Diffusion)を導入する。
MDDは新しいデータオブジェクトの欠落したビューを再構築し、半教師付きコンテキストでの学習を可能にする。
マルチドメイン合成データセットBL3NDTのドメイン翻訳実験により,本手法の評価を行った。
論文 参考訳(メタデータ) (2023-09-25T15:31:16Z) - Unsupervised Domain Adaptation via Domain-Adaptive Diffusion [31.802163238282343]
非教師付きドメイン適応(UDA)は、ソースドメインとターゲットドメインの間に大きな分散不一致があるため、非常に難しい。
大規模なギャップをまたいでデータ分散を段階的に変換する能力を持つ拡散モデルに着想を得て,その課題に対処する拡散手法について検討する。
提案手法は, 広く使用されている3つのUDAデータセットに対して, 現在の最先端技術よりも大きなマージンを達成している。
論文 参考訳(メタデータ) (2023-08-26T14:28:18Z) - MADAv2: Advanced Multi-Anchor Based Active Domain Adaptation
Segmentation [98.09845149258972]
セマンティックセグメンテーションタスクに関するドメイン適応を支援するために,アクティブなサンプル選択を導入する。
これらのサンプルを手動でアノテートする作業量が少ないため、ターゲット領域分布の歪みを効果的に緩和することができる。
長期分布問題を緩和するために、強力な半教師付きドメイン適応戦略を提案する。
論文 参考訳(メタデータ) (2023-01-18T07:55:22Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - Collaborative Semantic Aggregation and Calibration for Federated Domain
Generalization [28.573872986524794]
DGは、未知のターゲットドメインに適切に一般化できるモデルとして、複数の既知のソースドメインから学習することを目的としている。
本稿では、ソースデータセットをローカルにしかアクセスできないフェデレーションドメイン一般化の問題に取り組む。
データフリーなセマンティックアグリゲーションは、分離されたドメイン層でトレーニングされたモデルを層ごとに融合することで実現します。
論文 参考訳(メタデータ) (2021-10-13T14:08:29Z) - Multi-Source domain adaptation via supervised contrastive learning and
confident consistency regularization [0.0]
Multi-Source Unsupervised Domain Adaptation (multi-source UDA)は、複数のラベル付きソースドメインからモデルを学習することを目的としている。
本稿では,この制限に対処するマルチソースUDAに対して,コントラスト型マルチソースドメイン適応(CMSDA)を提案する。
論文 参考訳(メタデータ) (2021-06-30T14:39:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。