論文の概要: Domain Expansion: A Latent Space Construction Framework for Multi-Task Learning
- arxiv url: http://arxiv.org/abs/2601.20069v1
- Date: Tue, 27 Jan 2026 21:30:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-29 15:46:06.667603
- Title: Domain Expansion: A Latent Space Construction Framework for Multi-Task Learning
- Title(参考訳): ドメイン拡張:マルチタスク学習のための遅延空間構築フレームワーク
- Authors: Chi-Yao Huang, Khoa Vo, Aayush Atul Verma, Duo Lu, Yezhou Yang,
- Abstract要約: 複数の目的を持つ単一ネットワークのトレーニングは、共有表現を低下させる矛盾する勾配につながることが多い。
このフレームワークは、潜伏空間自体を再構築することで、これらの衝突を防ぐ。
- 参考スコア(独自算出の注目度): 26.322513515274764
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Training a single network with multiple objectives often leads to conflicting gradients that degrade shared representations, forcing them into a compromised state that is suboptimal for any single task--a problem we term latent representation collapse. We introduce Domain Expansion, a framework that prevents these conflicts by restructuring the latent space itself. Our framework uses a novel orthogonal pooling mechanism to construct a latent space where each objective is assigned to a mutually orthogonal subspace. We validate our approach across diverse benchmarks--including ShapeNet, MPIIGaze, and Rotated MNIST--on challenging multi-objective problems combining classification with pose and gaze estimation. Our experiments demonstrate that this structure not only prevents collapse but also yields an explicit, interpretable, and compositional latent space where concepts can be directly manipulated.
- Abstract(参考訳): 複数の目的を持つ単一ネットワークをトレーニングすることは、しばしば、共有表現を低下させ、一つのタスクに最適でない妥協状態に陥る。遅延表現の崩壊を言う問題だ。我々は、遅延空間自体を再構成することで、これらの衝突を防ぐフレームワークであるDomain Expansionを導入する。我々のフレームワークは、各目的が相互直交部分空間に割り当てられる潜在空間を構築するために、新しい直交プーリング機構を用いており、我々は、様々なベンチマーク(ShapeNet、MPIIGaze、Rotated MNIST-on)にまたがるアプローチを検証している。
我々の実験は、この構造が崩壊を防ぐだけでなく、概念を直接操作できる明示的で解釈可能な、構成的な潜在空間も生み出すことを示した。
関連論文リスト
- Synergy over Discrepancy: A Partition-Based Approach to Multi-Domain LLM Fine-Tuning [9.97195966127976]
大規模言語モデル(LLM)は印象的な一般化能力を示すが、複数の異種ドメインに効果的に適用することは困難である。
負の転送を最小限に抑えつつドメイン間シナジーを生かした分割型多段階微調整フレームワークを提案する。
私たちのアプローチでは、ドメインの相違、シナジー、モデルキャパシティの制約のバランスをとることによって、ドメインを(ステージ)に戦略的に分割します。
論文 参考訳(メタデータ) (2025-11-10T15:27:26Z) - Towards Robust and Realistic Human Pose Estimation via WiFi Signals [85.60557095666934]
WiFiベースの人間のポーズ推定は、離散的で微妙なWiFi信号を人間の骨格にブリッジする難しいタスクである。
本論文は,本問題を再検討し,(1)ドメイン間ギャップ,(2)ソース・ターゲット領域のポーズ分布の顕著な変化,(2)骨格のポーズが歪んだトポロジーを示す構造的フィデリティギャップ,の2つの重要な問題を明らかにする。
本稿では,タスクをDT-Poseと呼ばれる新しい2段階のフレームワークに書き換えることで,これらのギャップを埋める:ドメイン一貫性表現学習とトポロジ制約ポスデコーディング。
論文 参考訳(メタデータ) (2025-01-16T09:38:22Z) - Disentangled Representation Learning with the Gromov-Monge Gap [65.73194652234848]
乱れのないデータから歪んだ表現を学習することは、機械学習における根本的な課題である。
本稿では,2次最適輸送に基づく非交叉表現学習手法を提案する。
提案手法の有効性を4つの標準ベンチマークで示す。
論文 参考訳(メタデータ) (2024-07-10T16:51:32Z) - Latent Functional Maps: a spectral framework for representation alignment [34.20582953800544]
表現学習コミュニティに多目的フレームワークを導入し、(i)異なる空間を解釈可能な方法で比較し、その内在的類似性を測定すること、(ii)教師なしと弱教師付きの両方で対応性を見出すこと、(iii)異なる空間間の表現を効果的に伝達すること。
我々は, 縫合作業から検索作業, および複数のモダリティに至るまで, 様々なアプリケーションにおいて, フレームワークを検証し, 表現アライメントのためのスウィスアームナイフとして機能することを示す。
論文 参考訳(メタデータ) (2024-06-20T10:43:28Z) - Separate and Conquer: Decoupling Co-occurrence via Decomposition and Representation for Weakly Supervised Semantic Segmentation [14.419786126791369]
画像レベルのラベルを持つ弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)は、高密度アノテーションなしでセマンティクスタスクを実現することを目的としている。
共起問題は広く存在し、WSSSにおけるオブジェクトの誤活性化につながる。
画像空間と特徴空間の次元からこの問題に対処する'分離・コンカ'スキームSeCoを考案する。
論文 参考訳(メタデータ) (2024-02-28T16:43:27Z) - Multimodal hierarchical Variational AutoEncoders with Factor Analysis latent space [45.418113011182186]
本研究では,変分オートエンコーダ(VAE)と因子解析潜時空間(FA-VAE)を組み合わせることで,制約に対処する新しい手法を提案する。
FA-VAE法は複数のVAEを用いて連続潜伏空間における各異種データビューのプライベート表現を学習する。
論文 参考訳(メタデータ) (2022-07-19T10:46:02Z) - Few Shot Generative Model Adaption via Relaxed Spatial Structural
Alignment [130.84010267004803]
限られたデータでGAN(Generative Adversarial Network)を訓練することは難しい課題である。
実現可能な解決策は、大規模なソースドメインで十分に訓練されたGANから始め、ターゲットドメインにいくつかのサンプルで適応することである。
本研究では,適応時の対象生成モデルのキャリブレーションを行うための緩和された空間構造アライメント手法を提案する。
論文 参考訳(メタデータ) (2022-03-06T14:26:25Z) - Design Strategy Network: A deep hierarchical framework to represent
generative design strategies in complex action spaces [0.0]
この研究は、任意の複雑なアクション空間上の戦略を学習するデータ駆動の深層階層型フレームワークであるDesign Strategy Network (DSN)を紹介する。
階層的アーキテクチャは、すべてのアクション決定を分解し、設計空間における好ましい空間領域を第一に予測する。
その結果, DSNは政策表現の非階層的手法よりも優れていた。
論文 参考訳(メタデータ) (2021-10-07T19:29:40Z) - Structured Latent Embeddings for Recognizing Unseen Classes in Unseen
Domains [108.11746235308046]
本稿では,異なる領域からの画像を投影することで,ドメインに依存しない遅延埋め込みを学習する手法を提案する。
挑戦的なDomainNetとDomainNet-LSベンチマークの実験は、既存のメソッドよりもアプローチの方が優れていることを示している。
論文 参考訳(メタデータ) (2021-07-12T17:57:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。