論文の概要: Universal Multi-Domain Translation via Diffusion Routers
- arxiv url: http://arxiv.org/abs/2510.03252v1
- Date: Fri, 26 Sep 2025 07:32:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-12 15:03:05.802892
- Title: Universal Multi-Domain Translation via Diffusion Routers
- Title(参考訳): 拡散ルータによるユニバーサルマルチドメイン翻訳
- Authors: Duc Kieu, Kien Do, Tuan Hoang, Thao Minh Le, Tung Kieu, Dang Nguyen, Thin Nguyen,
- Abstract要約: マルチドメイン翻訳(MDT)は、複数のドメイン間の翻訳を学習することを目的としている。
我々は,MDTの一般化であるUniversal MDT (UMDT)を導入し,中央ドメインと組み合わせたK-1$のみを用いて任意の$K$ドメイン間の変換を試みる。
単一雑音予測器を用いた中央$leftarrow$non-central翻訳をモデル化した拡散型統合フレームワークDiffusion Router (DR)を提案する。
- 参考スコア(独自算出の注目度): 23.85537575452933
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-domain translation (MDT) aims to learn translations between multiple domains, yet existing approaches either require fully aligned tuples or can only handle domain pairs seen in training, limiting their practicality and excluding many cross-domain mappings. We introduce universal MDT (UMDT), a generalization of MDT that seeks to translate between any pair of $K$ domains using only $K-1$ paired datasets with a central domain. To tackle this problem, we propose Diffusion Router (DR), a unified diffusion-based framework that models all central$\leftrightarrow$non-central translations with a single noise predictor conditioned on the source and target domain labels. DR enables indirect non-central translations by routing through the central domain. We further introduce a novel scalable learning strategy with a variational-bound objective and an efficient Tweedie refinement procedure to support direct non-central mappings. Through evaluation on three large-scale UMDT benchmarks, DR achieves state-of-the-art results for both indirect and direct translations, while lowering sampling cost and unlocking novel tasks such as sketch$\leftrightarrow$segmentation. These results establish DR as a scalable and versatile framework for universal translation across multiple domains.
- Abstract(参考訳): マルチドメイン翻訳(MDT)は、複数のドメイン間の翻訳を学習することを目的としているが、既存のアプローチでは、完全に整列したタプルを必要とするか、トレーニングで見られるドメインペアのみを扱うことができる。
我々は、MDTの一般化であるUniversal MDT(UMDT)を導入し、中央ドメインとのペアデータセットのみを使用して、任意の$K$ドメイン間の変換を試みる。
この問題に対処するために、Diffusion Router (DR) を提案する。Diffusion Routerは、ソースおよびターゲットドメインラベルに条件付き単一ノイズ予測器を備えた中央$\leftrightarrow$non-central翻訳をモデル化する統合拡散ベースフレームワークである。
DRは、中央ドメインをルーティングすることで間接的な非中央翻訳を可能にする。
さらに,非中央の直接マッピングを支援するために,変分有向目的と効率的なTweedie改良手順を備えた,スケーラブルな新しい学習戦略を導入する。
3つの大規模UMDTベンチマークの評価を通じて、DRは間接翻訳と直接翻訳の両方に対して最先端の結果を得るとともに、サンプリングコストを下げ、スケッチ$\leftrightarrow$segmentationのような新しいタスクをアンロックする。
これらの結果は、DRを複数の領域にわたる普遍翻訳のためのスケーラブルで汎用的なフレームワークとして確立する。
関連論文リスト
- LADB: Latent Aligned Diffusion Bridges for Semi-Supervised Domain Translation [54.690154688667086]
拡散モデルは高品質な出力を生成するのに優れているが、データスカースドメインでは課題に直面している。
サンプルからサンプルへの変換のための半教師付きフレームワークであるLatent Aligned Diffusion Bridges (LADB)を提案する。
論文 参考訳(メタデータ) (2025-09-10T14:23:07Z) - Large Language Model for Multi-Domain Translation: Benchmarking and Domain CoT Fine-tuning [55.107329995417786]
大規模言語モデル(LLM)は、目覚ましい一般的な理解と生成能力を示している。
我々は、25のドイツ語$Leftrightarrow$ Englishと22の中国語$Leftrightarrow$ Englishテストセットを特徴とするマルチドメイン翻訳のベンチマークを確立する。
本稿では,LLMの内在的マルチドメインインテリジェンスを活用し,翻訳性能を向上させるためのドメインチェーン・オブ・シント(CoT)ファインチューニング手法を提案する。
論文 参考訳(メタデータ) (2024-10-03T16:15:04Z) - Multiple Noises in Diffusion Model for Semi-Supervised Multi-Domain Translation [1.9510388605988505]
マルチドメイン翻訳の課題を解決するために,MDD(Multi-Domain Diffusion)を導入する。
MDDは新しいデータオブジェクトの欠落したビューを再構築し、半教師付きコンテキストでの学習を可能にする。
マルチドメイン合成データセットBL3NDTのドメイン翻訳実験により,本手法の評価を行った。
論文 参考訳(メタデータ) (2023-09-25T15:31:16Z) - UOD: Universal One-shot Detection of Anatomical Landmarks [16.360644135635333]
我々は、Universal One-shot Detection (UOD)という、多領域の医療画像を扱うためのドメイン適応型ワンショットランドマーク検出フレームワークを開発した。
UODは、ドメイン固有モジュールとドメイン共有モジュールの組み合わせとして設計された、2つのステージと2つの対応するユニバーサルモデルから構成される。
解剖学的領域で広く利用されている3つの公開X線データセットに対して,提案するUODの質的および定量的な検討を行った。
論文 参考訳(メタデータ) (2023-06-13T08:19:14Z) - Non-Parametric Unsupervised Domain Adaptation for Neural Machine
Translation [61.27321597981737]
$k$NN-MTは、トレーニング済みニューラルネットワーク翻訳(NMT)モデルとドメイン固有のトークンレベルである$k$-nearest-neighbor検索を直接組み込むという有望な能力を示している。
対象言語におけるドメイン内単言語文を直接使用して,$k$-nearest-neighbor検索に有効なデータストアを構築する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-14T11:50:01Z) - Iterative Domain-Repaired Back-Translation [50.32925322697343]
本稿では,ドメイン内並列コーパスが少ない,あるいは存在しない,低リソースのドメイン固有翻訳に焦点を当てる。
本稿では,合成バイリンガルデータの翻訳を洗練するためのドメイン・リペアモデルを提案する。
提案手法の有効性を示すため,NMTモデルを特定の領域と一般領域から特定の領域に適応させる実験を行った。
論文 参考訳(メタデータ) (2020-10-06T04:38:09Z) - Mutual Learning Network for Multi-Source Domain Adaptation [73.25974539191553]
ML-MSDA(Multial Learning Network for Multiple Source Domain Adaptation)を提案する。
相互学習の枠組みのもと,提案手法は対象ドメインと各ソースドメインをペアリングし,条件付き対向ドメイン適応ネットワークを分岐ネットワークとして訓練する。
提案手法は, 比較手法より優れ, 最先端の性能を実現する。
論文 参考訳(メタデータ) (2020-03-29T04:31:43Z) - Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN [117.80737222754306]
我々はUniversal-RCNNと呼ばれる新しいユニバーサルオブジェクト検出器を提案する。
まず、すべてのカテゴリの高レベルなセマンティック表現を統合することで、グローバルなセマンティックプールを生成する。
ドメイン内推論モジュールは、空間認識GCNによってガイドされる1つのデータセット内のスパースグラフ表現を学習し、伝播する。
論文 参考訳(メタデータ) (2020-02-18T07:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。