論文の概要: Multi-Representation Adaptation Network for Cross-domain Image
Classification
- arxiv url: http://arxiv.org/abs/2201.01002v1
- Date: Tue, 4 Jan 2022 06:34:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-05 13:06:22.588649
- Title: Multi-Representation Adaptation Network for Cross-domain Image
Classification
- Title(参考訳): クロスドメイン画像分類のための多表現適応ネットワーク
- Authors: Yongchun Zhu, Fuzhen Zhuang, Jindong Wang, Jingwu Chen, Zhiping Shi,
Wenjuan Wu, Qing He
- Abstract要約: 画像分類では、十分なラベルを取得するのに高価で時間がかかることが多い。
既存のアプローチは、主に単一の構造によって抽出された表現の分布を整列させる。
クロスドメイン画像分類における分類精度を劇的に向上させる多表現適応を提案する。
- 参考スコア(独自算出の注目度): 20.615155915233693
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In image classification, it is often expensive and time-consuming to acquire
sufficient labels. To solve this problem, domain adaptation often provides an
attractive option given a large amount of labeled data from a similar nature
but different domain. Existing approaches mainly align the distributions of
representations extracted by a single structure and the representations may
only contain partial information, e.g., only contain part of the saturation,
brightness, and hue information. Along this line, we propose
Multi-Representation Adaptation which can dramatically improve the
classification accuracy for cross-domain image classification and specially
aims to align the distributions of multiple representations extracted by a
hybrid structure named Inception Adaptation Module (IAM). Based on this, we
present Multi-Representation Adaptation Network (MRAN) to accomplish the
cross-domain image classification task via multi-representation alignment which
can capture the information from different aspects. In addition, we extend
Maximum Mean Discrepancy (MMD) to compute the adaptation loss. Our approach can
be easily implemented by extending most feed-forward models with IAM, and the
network can be trained efficiently via back-propagation. Experiments conducted
on three benchmark image datasets demonstrate the effectiveness of MRAN. The
code has been available at https://github.com/easezyc/deep-transfer-learning.
- Abstract(参考訳): 画像分類では、十分なラベルを取得するのにしばしば高価で時間がかかる。
この問題を解決するために、ドメイン適応は、同じ性質の異なるドメインからの大量のラベル付きデータに対して魅力的な選択肢を提供することが多い。
既存のアプローチは主に単一の構造によって抽出された表現の分布を整列させ、その表現は部分的な情報のみを含む(例えば、飽和度、明るさ、色調情報の一部だけを含む)。
本稿では,クロスドメイン画像分類の分類精度を劇的に向上させ,特にインセプション適応モジュール (iam) と呼ばれるハイブリッド構造によって抽出された複数の表現の分布を整合させることを目的としている。
そこで本研究では,複数表現アライメントによるクロスドメイン画像分類タスクを実現するために,mran(multi-representation adaptation network)を提案する。
さらに,適応損失を計算するために,最大平均離散性(MMD)を拡張した。
提案手法は,多くのフィードフォワードモデルをiamで拡張することで容易に実装でき,ネットワークはバックプロパゲーションによって効率的にトレーニングできる。
3つのベンチマーク画像データセットで実施された実験は、MRANの有効性を示す。
コードはhttps://github.com/easezyc/deep-transfer-learningで入手できる。
関連論文リスト
- Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Interpretable Small Training Set Image Segmentation Network Originated
from Multi-Grid Variational Model [5.283735137946097]
深層学習法 (DL) が提案され, 画像分割に広く利用されている。
DLメソッドは通常、トレーニングデータとして大量の手動セグメントデータを必要とし、解釈性に乏しい。
本稿では,MSモデルにおける手作り正則項をデータ適応型一般化可学習正則項に置き換える。
論文 参考訳(メタデータ) (2023-06-25T02:34:34Z) - UniDAformer: Unified Domain Adaptive Panoptic Segmentation Transformer
via Hierarchical Mask Calibration [49.16591283724376]
単一ネットワーク内でのドメイン適応型インスタンス分割とセマンティックセマンティックセマンティックセマンティクスを同時に実現可能な,シンプルで統一されたドメイン適応型パン光学セマンティクスセマンティクス変換器UniDAformerを設計する。
UniDAformerは階層型マスク(Hierarchical Mask, HMC)を導入し、オンザフライでのオンラインセルフトレーニングを通じて、領域、スーパーピクセル、注釈付きピクセルのレベルで不正確な予測を修正した。
1) 統合されたドメイン適応型パン光学適応を可能にする; 2) 誤った予測を緩和し、ドメイン適応型パン光学セグメンテーションを効果的に改善する; 3) より単純なトレーニングと推論パイプラインでエンドツーエンドのトレーニングを可能にする。
論文 参考訳(メタデータ) (2022-06-30T07:32:23Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Domain Adaptor Networks for Hyperspectral Image Recognition [35.95313368586933]
本稿では,3チャンネルカラー画像に基づいてトレーニングしたネットワークを,多数のチャネルを持つハイパースペクトル領域に適応させる問題について考察する。
画像ネットのような大規模カラー画像データセットでトレーニングされたネットワークと互換性のある入力をマップするドメインアダプタネットワークを提案する。
論文 参考訳(メタデータ) (2021-08-03T15:06:39Z) - Multi-dataset Pretraining: A Unified Model for Semantic Segmentation [97.61605021985062]
我々は、異なるデータセットの断片化アノテーションを最大限に活用するために、マルチデータセット事前訓練と呼ばれる統合フレームワークを提案する。
これは、複数のデータセットに対して提案されたピクセルからプロトタイプへのコントラスト損失を通じてネットワークを事前トレーニングすることで実現される。
異なるデータセットからの画像とクラス間の関係をより良くモデル化するために、クロスデータセットの混合によりピクセルレベルの埋め込みを拡張する。
論文 参考訳(メタデータ) (2021-06-08T06:13:11Z) - Semantic Distribution-aware Contrastive Adaptation for Semantic
Segmentation [50.621269117524925]
ドメイン適応セマンティックセグメンテーション(ドメイン適応セマンティックセグメンテーション)とは、特定のソースドメインのアノテーションだけで特定のターゲットドメイン上で予測を行うことを指す。
画素ワイド表示アライメントを可能にする意味分布対応コントラスト適応アルゴリズムを提案する。
複数のベンチマークでSDCAを評価し、既存のアルゴリズムを大幅に改善します。
論文 参考訳(メタデータ) (2021-05-11T13:21:25Z) - A Universal Representation Transformer Layer for Few-Shot Image
Classification [43.31379752656756]
少ないショット分類は、少数のサンプルで示される場合、目に見えないクラスを認識することを目的としている。
本稿では,多様なデータソースから未確認のクラスやサンプルを抽出するマルチドメイン・少数ショット画像分類の問題点について考察する。
そこで本研究では,メタ学習者がユニバーサルな特徴を活用できるユニバーサル表現変換器層を提案する。
論文 参考訳(メタデータ) (2020-06-21T03:08:00Z) - Split-Merge Pooling [36.2980225204665]
スプリット・マージ・プールはサブサンプリングなしで空間情報を保存するために導入された。
本研究では,CityscapesとGTA-5データセットから得られた大規模画像の高密度なセマンティックセマンティックセマンティックセグメンテーションについて検討した。
論文 参考訳(メタデータ) (2020-06-13T23:20:30Z) - Selecting Relevant Features from a Multi-domain Representation for
Few-shot Classification [91.67977602992657]
本稿では,従来の特徴適応手法よりもシンプルかつ効果的である特徴選択に基づく新しい戦略を提案する。
このような特徴の上に構築された単純な非パラメトリック分類器は高い精度を示し、訓練中に見たことのない領域に一般化する。
論文 参考訳(メタデータ) (2020-03-20T15:44:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。