論文の概要: SUMMIT: Source-Free Adaptation of Uni-Modal Models to Multi-Modal
Targets
- arxiv url: http://arxiv.org/abs/2308.11880v1
- Date: Wed, 23 Aug 2023 02:57:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-24 16:09:58.663780
- Title: SUMMIT: Source-Free Adaptation of Uni-Modal Models to Multi-Modal
Targets
- Title(参考訳): SUMMIT:マルチモーダルターゲットへのユニモーダルモデルのソースフリー適応
- Authors: Cody Simons, Dripta S. Raychaudhuri, Sk Miraj Ahmed, Suya You,
Konstantinos Karydis, Amit K. Roy-Chowdhury
- Abstract要約: 現在のアプローチでは、ソースデータが適応中に利用可能であり、ソースはペア化されたマルチモーダルデータで構成されていると仮定している。
本稿では,2つの相補的な擬似ラベル融合法を自動選択するスイッチングフレームワークを提案する。
提案手法は,mIoUが競合するベースラインよりも最大12%向上することを示す。
- 参考スコア(独自算出の注目度): 30.262094419776208
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scene understanding using multi-modal data is necessary in many applications,
e.g., autonomous navigation. To achieve this in a variety of situations,
existing models must be able to adapt to shifting data distributions without
arduous data annotation. Current approaches assume that the source data is
available during adaptation and that the source consists of paired multi-modal
data. Both these assumptions may be problematic for many applications. Source
data may not be available due to privacy, security, or economic concerns.
Assuming the existence of paired multi-modal data for training also entails
significant data collection costs and fails to take advantage of widely
available freely distributed pre-trained uni-modal models. In this work, we
relax both of these assumptions by addressing the problem of adapting a set of
models trained independently on uni-modal data to a target domain consisting of
unlabeled multi-modal data, without having access to the original source
dataset. Our proposed approach solves this problem through a switching
framework which automatically chooses between two complementary methods of
cross-modal pseudo-label fusion -- agreement filtering and entropy weighting --
based on the estimated domain gap. We demonstrate our work on the semantic
segmentation problem. Experiments across seven challenging adaptation scenarios
verify the efficacy of our approach, achieving results comparable to, and in
some cases outperforming, methods which assume access to source data. Our
method achieves an improvement in mIoU of up to 12% over competing baselines.
Our code is publicly available at https://github.com/csimo005/SUMMIT.
- Abstract(参考訳): マルチモーダルデータを用いたシーン理解は、自律ナビゲーションなど多くのアプリケーションで必要である。
さまざまな状況でこれを実現するためには、既存のモデルは、厳しいデータアノテーションなしで、シフトするデータ分布に適応できなければならない。
現在のアプローチでは、ソースデータは適応中に利用可能であり、ソースはペア化されたマルチモーダルデータで構成されていると仮定している。
これらの仮定は、多くのアプリケーションで問題となる可能性がある。
ソースデータは、プライバシー、セキュリティ、経済的懸念のために利用できない可能性がある。
トレーニング用にペア化されたマルチモーダルデータが存在すると仮定すると、データ収集コストが大幅に増加し、広く利用可能な分散されたユニモーダルモデルの活用に失敗する。
本研究では,マルチモーダルデータを含む対象領域に対して,単一モーダルデータに基づいて独立にトレーニングされたモデル群を,元のソースデータセットにアクセスせずに対応させることで,これらの仮定を緩和する。
提案手法は,ドメインギャップの推定に基づいて,2つの相補的擬似ラベル融合法 – 合意フィルタリングとエントロピー重み付け – を自動的に選択する交換フレームワークを用いてこの問題を解決する。
セマンティックセグメンテーション問題に対する我々の取り組みを実証する。
7つの挑戦的な適応シナリオをまたいだ実験は、我々のアプローチの有効性を検証し、ソースデータへのアクセスを想定するメソッドに匹敵する結果、場合によってはパフォーマンスを上回る結果を得る。
本手法は,競合ベースラインに対して最大12%のmiou改善を実現する。
私たちのコードはhttps://github.com/csimo005/SUMMIT.comで公開されています。
関連論文リスト
- FedMAC: Tackling Partial-Modality Missing in Federated Learning with Cross-Modal Aggregation and Contrastive Regularization [11.954904313477176]
Federated Learning(FL)は、分散データソースを使用して機械学習モデルをトレーニングする手法である。
本研究ではFedMACという新しいフレームワークを提案し,FLに欠落した部分モダリティ条件下でのマルチモダリティの解消を図った。
論文 参考訳(メタデータ) (2024-10-04T01:24:02Z) - Missing Modality Prediction for Unpaired Multimodal Learning via Joint Embedding of Unimodal Models [6.610033827647869]
実世界のシナリオでは、完全なマルチモーダルデータを一貫して取得することは重大な課題である。
これはしばしば、特定のモダリティのデータが欠落しているモダリティの問題につながる。
自己教師型共同埋め込み学習手法を用いて, パラメータ効率のよい未学習モデルの微調整を行う新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-17T14:44:25Z) - Borrowing Treasures from Neighbors: In-Context Learning for Multimodal Learning with Missing Modalities and Data Scarcity [9.811378971225727]
本稿では、欠落したモダリティに関する現在の研究を低データ体制に拡張する。
フルモダリティデータと十分なアノテートされたトレーニングサンプルを取得することは、しばしばコストがかかる。
本稿では,この2つの重要な問題に対処するために,検索強化したテキスト内学習を提案する。
論文 参考訳(メタデータ) (2024-03-14T14:19:48Z) - Debiasing Multimodal Models via Causal Information Minimization [65.23982806840182]
我々は、マルチモーダルデータのための因果グラフにおいて、共同創設者から生じるバイアスを研究する。
ロバストな予測機能は、モデルがアウト・オブ・ディストリビューションデータに一般化するのに役立つ多様な情報を含んでいる。
これらの特徴を共同設立者表現として使用し、因果理論によって動機づけられた手法を用いてモデルからバイアスを取り除く。
論文 参考訳(メタデータ) (2023-11-28T16:46:14Z) - Informative Data Mining for One-Shot Cross-Domain Semantic Segmentation [84.82153655786183]
Informative Data Mining (IDM) と呼ばれる新しいフレームワークを提案し、セマンティックセグメンテーションのための効率的なワンショットドメイン適応を実現する。
IDMは、最も情報性の高いサンプルを特定するために不確実性に基づく選択基準を提供し、迅速に適応し、冗長なトレーニングを減らす。
提案手法は,GTA5/SYNTHIAからCityscapesへの適応タスクにおいて,既存の手法より優れ,56.7%/55.4%の最先端のワンショット性能を実現している。
論文 参考訳(メタデータ) (2023-09-25T15:56:01Z) - Dataless Knowledge Fusion by Merging Weights of Language Models [51.8162883997512]
微調整された事前学習言語モデルは、下流のNLPモデルを構築するための主要なパラダイムとなっている。
これは、より優れた単一モデルを生み出すために、個々のモデル間で知識を融合させる障壁を生み出します。
パラメータ空間のモデルをマージするデータレス知識融合法を提案する。
論文 参考訳(メタデータ) (2022-12-19T20:46:43Z) - Discriminative Multimodal Learning via Conditional Priors in Generative
Models [21.166519800652047]
本研究は,モデルトレーニングにおいて,すべてのモダリティとクラスラベルが利用できる現実的なシナリオについて研究する。
このシナリオでは、変動的な下界境界は、結合表現と欠測モダリティの間の相互情報を制限する。
論文 参考訳(メタデータ) (2021-10-09T17:22:24Z) - Learning Invariant Representation with Consistency and Diversity for
Semi-supervised Source Hypothesis Transfer [46.68586555288172]
本稿では,SSHT(Semi-supervised Source hypothesis Transfer)という新たなタスクを提案する。
本研究では、ランダムに拡張された2つの未ラベルデータ間の予測整合性を容易にし、SSHTの簡易かつ効果的なフレームワークである一貫性と多様性の学習(CDL)を提案する。
実験の結果,本手法は,DomainNet,Office-Home,Office-31データセット上で,既存のSSDA手法や教師なしモデル適応手法よりも優れていた。
論文 参考訳(メタデータ) (2021-07-07T04:14:24Z) - Unsupervised Multi-source Domain Adaptation Without Access to Source
Data [58.551861130011886]
Unsupervised Domain Adaptation (UDA)は、ラベル付きソースドメインから知識を転送することで、ラベル付きドメインの予測モデルを学ぶことを目的としている。
本稿では,ソースモデルと適切な重み付けを自動的に組み合わせ,少なくとも最良のソースモデルと同等の性能を発揮する新しい効率的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-04-05T10:45:12Z) - Relating by Contrasting: A Data-efficient Framework for Multimodal
Generative Models [86.9292779620645]
生成モデル学習のための対照的なフレームワークを開発し、モダリティ間の共通性だけでなく、「関連」と「関連しない」マルチモーダルデータの区別によってモデルを訓練することができる。
提案手法では, 生成モデルを用いて, 関係のないサンプルから関連サンプルを正確に識別し, ラベルのない多モードデータの利用が可能となる。
論文 参考訳(メタデータ) (2020-07-02T15:08:11Z) - Do We Really Need to Access the Source Data? Source Hypothesis Transfer
for Unsupervised Domain Adaptation [102.67010690592011]
Unsupervised adaptUDA (UDA) は、ラベル付きソースデータセットから学んだ知識を活用して、新しいラベル付きドメインで同様のタスクを解決することを目的としている。
従来のUDAメソッドは、モデルに適応するためには、通常、ソースデータにアクセスする必要がある。
この作業は、訓練済みのソースモデルのみが利用できる実践的な環境に取り組み、ソースデータなしでそのようなモデルを効果的に活用してUDA問題を解決する方法に取り組みます。
論文 参考訳(メタデータ) (2020-02-20T03:13:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。