論文の概要: Multi-modal Domain Adaptation for REG via Relation Transfer
- arxiv url: http://arxiv.org/abs/2309.13247v1
- Date: Sat, 23 Sep 2023 04:02:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-26 21:14:16.674542
- Title: Multi-modal Domain Adaptation for REG via Relation Transfer
- Title(参考訳): リレーショナルトランスファーによるREGのマルチモーダルドメイン適応
- Authors: Yifan Ding, Liqiang Wang and Boqing Gong
- Abstract要約: 本稿では,Referring Expression Grounding (REG) 問題に対する特別な関係調整手法により,マルチモーダルな知識を効果的に伝達する手法を提案する。
ドメイン間の関係を同時に強化し,ドメイン間の関係を移譲することで,マルチモーダルなドメイン適応問題に取り組む。
- 参考スコア(独自算出の注目度): 46.03480352815051
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Domain adaptation, which aims to transfer knowledge between domains, has been
well studied in many areas such as image classification and object detection.
However, for multi-modal tasks, conventional approaches rely on large-scale
pre-training. But due to the difficulty of acquiring multi-modal data,
large-scale pre-training is often impractical. Therefore, domain adaptation,
which can efficiently utilize the knowledge from different datasets (domains),
is crucial for multi-modal tasks. In this paper, we focus on the Referring
Expression Grounding (REG) task, which is to localize an image region described
by a natural language expression. Specifically, we propose a novel approach to
effectively transfer multi-modal knowledge through a specially
relation-tailored approach for the REG problem. Our approach tackles the
multi-modal domain adaptation problem by simultaneously enriching inter-domain
relations and transferring relations between domains. Experiments show that our
proposed approach significantly improves the transferability of multi-modal
domains and enhances adaptation performance in the REG problem.
- Abstract(参考訳): ドメイン間の知識伝達を目的としたドメイン適応は,画像分類やオブジェクト検出など,多くの分野で研究されている。
しかし、マルチモーダルタスクでは、従来のアプローチは大規模事前トレーニングに依存している。
しかし、マルチモーダルデータの取得が難しいため、大規模な事前学習は現実的ではないことが多い。
したがって、異なるデータセット(ドメイン)からの知識を効率的に活用できるドメイン適応は、マルチモーダルタスクに不可欠である。
本稿では、自然言語表現によって記述された画像領域をローカライズするReferring Expression Grounding (REG)タスクに焦点を当てる。
具体的には,reg問題に対する特殊関係対応アプローチを通じて,マルチモーダル知識を効果的に伝達する新しい手法を提案する。
ドメイン間の関係を同時に強化し,ドメイン間の関係を伝達することで,マルチモーダルなドメイン適応問題に取り組む。
実験の結果,提案手法はマルチモーダル領域の転送性を大幅に向上し,REG問題における適応性能を向上させる。
関連論文リスト
- Cross-Domain Policy Transfer by Representation Alignment via Multi-Domain Behavioral Cloning [13.674493608667627]
本稿では、ドメイン間の共有潜在表現と、その上に共通の抽象ポリシーを学習する、ドメイン間ポリシー転送のためのシンプルなアプローチを提案する。
提案手法は,プロキシタスクの不整合軌道上でのマルチドメイン動作のクローン化と,ドメイン間のアライメントを促進するために,最大平均不整合(MMD)を正規化用語として利用する。
論文 参考訳(メタデータ) (2024-07-24T00:13:00Z) - Investigating the potential of Sparse Mixtures-of-Experts for multi-domain neural machine translation [59.41178047749177]
トレーニング中に見られるさまざまなドメインのデータを扱うことができ、トレーニング中に見つからないドメインに対して堅牢な効率的なモデルを開発することを目的として、マルチドメインニューラルネットワーク翻訳に重点を置いている。
SMOE(Sparse Mixture-of-Experts)モデルは、効率的なモデルスケーリングを可能にするため、このタスクに適していると仮定する。
マルチドメインシナリオにおけるSMoEの有用性を検証するための一連の実験を行い、Transformerの簡単な幅スケーリングは、実際はよりシンプルで驚くほど効率的なアプローチであり、SMoEと同等の性能レベルに達することを発見した。
論文 参考訳(メタデータ) (2024-07-01T09:45:22Z) - Role Prompting Guided Domain Adaptation with General Capability Preserve
for Large Language Models [55.51408151807268]
特定のドメインに合わせると、LLM(Large Language Models)は破滅的な忘れを経験する傾向がある。
同時に複数のドメインのための汎用モデルを構築することで、全体的なパフォーマンスが低下することが多い。
RolE Prompting Guided Multi-Domain Adaptation (REGA) 戦略を提案する。
論文 参考訳(メタデータ) (2024-03-05T08:22:41Z) - Dynamic Domain Discrepancy Adjustment for Active Multi-Domain Adaptation [3.367755441623275]
マルチソースアン教師付きドメイン適応(MUDA)は、関連するソースドメインから未ラベルのターゲットドメインに知識を転送することを目的としている。
アクティブマルチドメイン適応(D3AAMDA)のための動的ドメイン不一致適応法(Dynamic Domain Disrepancy Adjustment)を提案する。
このメカニズムは、ソースドメインとターゲットドメイン間の特徴のアライメントレベルを制御し、ソースドメイン内のローカルな有利な特徴情報を効果的に活用する。
論文 参考訳(メタデータ) (2023-07-26T09:40:19Z) - Transfer RL via the Undo Maps Formalism [29.798971172941627]
ドメイン間で知識を伝達することは、機械学習における最も基本的な問題の1つである。
本稿では,対話型ドメイン間で知識を伝達するフレームワークTvDを提案する。
この目的が,模倣学習を想起させるポリシー更新スキームに結びつき,それを実装するための効率的なアルゴリズムを導出することを示す。
論文 参考訳(メタデータ) (2022-11-26T03:44:28Z) - Adaptively-Accumulated Knowledge Transfer for Partial Domain Adaptation [66.74638960925854]
部分ドメイン適応(PDA)は、ソースドメインラベル空間がターゲットドメインを置き換えるとき、現実的で困難な問題を扱う。
本稿では,2つの領域にまたがる関連カテゴリを整合させる適応的知識伝達フレームワーク(A$2KT)を提案する。
論文 参考訳(メタデータ) (2020-08-27T00:53:43Z) - Learning to Combine: Knowledge Aggregation for Multi-Source Domain
Adaptation [56.694330303488435]
マルチソースドメイン適応(LtC-MSDA)フレームワークを併用する学習法を提案する。
簡単に言うと、知識グラフは様々なドメインのプロトタイプ上に構築され、セマンティックに隣接した表現間の情報伝達を実現する。
我々のアプローチは、既存の手法よりも顕著なマージンで優れています。
論文 参考訳(メタデータ) (2020-07-17T07:52:44Z) - Domain Conditioned Adaptation Network [90.63261870610211]
本稿では,ドメイン条件付きチャネルアテンション機構を用いて,異なる畳み込みチャネルを励起するドメイン条件適応ネットワーク(DCAN)を提案する。
これは、ディープDAネットワークのドメインワイドな畳み込みチャネルアクティベーションを探求する最初の試みである。
論文 参考訳(メタデータ) (2020-05-14T04:23:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。