論文の概要: Wave-SAN: Wavelet based Style Augmentation Network for Cross-Domain
Few-Shot Learning
- arxiv url: http://arxiv.org/abs/2203.07656v1
- Date: Tue, 15 Mar 2022 05:36:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-16 14:52:30.817302
- Title: Wave-SAN: Wavelet based Style Augmentation Network for Cross-Domain
Few-Shot Learning
- Title(参考訳): wave-san: クロスドメイン・マイナショット学習のためのウェーブレットベースの拡張ネットワーク
- Authors: Yuqian Fu, Yu Xie, Yanwei Fu, Jingjing Chen, Yu-Gang Jiang
- Abstract要約: クロスドメイン少ショット学習は、一般的な自然画像から新しいドメイン固有のターゲットカテゴリへ知識を伝達することを目的としている。
本稿では、ソースデータセットのスタイル分布を分散させることにより、CD-FSLの問題点を考察する。
我々のモデルを視覚的スタイルに堅牢にするために、低周波成分のスタイルを交換することで、ソースイメージを拡張します。
- 参考スコア(独自算出の注目度): 95.78635058475439
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Previous few-shot learning (FSL) works mostly are limited to natural images
of general concepts and categories. These works assume very high visual
similarity between the source and target classes. In contrast, the recently
proposed cross-domain few-shot learning (CD-FSL) aims at transferring knowledge
from general nature images of many labeled examples to novel domain-specific
target categories of only a few labeled examples. The key challenge of CD-FSL
lies in the huge data shift between source and target domains, which is
typically in the form of totally different visual styles. This makes it very
nontrivial to directly extend the classical FSL methods to address the CD-FSL
task. To this end, this paper studies the problem of CD-FSL by spanning the
style distributions of the source dataset. Particularly, wavelet transform is
introduced to enable the decomposition of visual representations into
low-frequency components such as shape and style and high-frequency components
e.g., texture. To make our model robust to visual styles, the source images are
augmented by swapping the styles of their low-frequency components with each
other. We propose a novel Style Augmentation (StyleAug) module to implement
this idea. Furthermore, we present a Self-Supervised Learning (SSL) module to
ensure the predictions of style-augmented images are semantically similar to
the unchanged ones. This avoids the potential semantic drift problem in
exchanging the styles. Extensive experiments on two CD-FSL benchmarks show the
effectiveness of our method. Our codes and models will be released.
- Abstract(参考訳): これまでのFSLは、一般的な概念やカテゴリの自然なイメージに限られていた。
これらの作業は、ソースクラスとターゲットクラスの間に非常に高い視覚的類似性を仮定する。
対照的に、最近提案されたクロスドメイン・ショットラーニング (CD-FSL) は、多くのラベル付き例の一般的な自然画像から、少数のラベル付き例の新規ドメイン固有ターゲットカテゴリへの知識の伝達を目的としている。
CD-FSLの鍵となる課題は、ソースとターゲットドメインの間の大きなデータシフトにある。
これにより、CD-FSLタスクに対処するために古典的なFSLメソッドを直接拡張するのは、非常に簡単ではない。
そこで本稿では,cd-fslの問題を,ソースデータセットのスタイル分布にまたがって検討する。
特にウェーブレット変換を導入し、視覚表現を形状やスタイルなどの低周波成分、例えばテクスチャなどの高周波成分に分解する。
我々のモデルを視覚的スタイルに堅牢にするために、低周波成分のスタイルを交換することで、ソースイメージを拡張します。
本稿では,新しいStyle Augmentation (StyleAug) モジュールを提案する。
さらに, 自己教師学習(ssl)モジュールを提案することで, スタイル提示画像の予測が, 変化しない画像と意味的に類似していることを保証する。
これにより、スタイルを交換する際の潜在的なセマンティックドリフトの問題を回避することができる。
2つのCD-FSLベンチマークの大規模な実験により,本手法の有効性が示された。
コードとモデルはリリースされます。
関連論文リスト
- MoreStyle: Relax Low-frequency Constraint of Fourier-based Image Reconstruction in Generalizable Medical Image Segmentation [53.24011398381715]
MoreStyleと呼ばれるデータ拡張のためのPlug-and-Playモジュールを紹介します。
MoreStyleは、フーリエ空間の低周波制約を緩和することで、イメージスタイルを多様化する。
敵対的学習の助けを借りて、MoreStyleは潜在機能の中で最も複雑なスタイルの組み合わせを指差している。
論文 参考訳(メタデータ) (2024-03-18T11:38:47Z) - ESPT: A Self-Supervised Episodic Spatial Pretext Task for Improving
Few-Shot Learning [16.859375666701]
我々は,新しい自己教師型空間規範タスク(ESPT)により,数発の学習目標を増強することを提案する。
ESPTの目的は、原エピソードと変換されたエピソードの間の局所的な空間的関係の一貫性を最大化することである。
ESPT法は,3つのメインステイ・ベンチマーク・データセットを用いた数ショット画像分類のための新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2023-04-26T04:52:08Z) - A Unified Arbitrary Style Transfer Framework via Adaptive Contrastive
Learning [84.8813842101747]
Unified Contrastive Arbitrary Style Transfer (UCAST)は、新しいスタイルの学習・伝達フレームワークである。
入力依存温度を導入することで,スタイル伝達のための適応型コントラスト学習方式を提案する。
本フレームワークは,スタイル表現とスタイル伝達のための並列コントラスト学習方式,スタイル分布を効果的に学習するためのドメイン拡張モジュール,スタイル伝達のための生成ネットワークという,3つの重要なコンポーネントから構成される。
論文 参考訳(メタデータ) (2023-03-09T04:35:00Z) - StyleAdv: Meta Style Adversarial Training for Cross-Domain Few-Shot
Learning [89.86971464234533]
Cross-Domain Few-Shot Learning (CD-FSL)は、最近登場したタスクで、異なるドメインにわたる数ショットの学習に対処している。
本稿では,モデルに依存しないメタスタイル逆アタック(StyleAdv)手法と,新しいスタイル逆アタック手法を提案する。
本手法は視覚的スタイルに対して徐々に頑健であり,新たなターゲットデータセットの一般化能力を高める。
論文 参考訳(メタデータ) (2023-02-18T11:54:37Z) - Semantic Cross Attention for Few-shot Learning [9.529264466445236]
本稿では,ラベルテキストのセマンティックな特徴を補助的タスクとして見るためのマルチタスク学習手法を提案する。
提案モデルでは,単語埋め込み表現をセマンティックな特徴として用いて,埋め込みネットワークとセマンティックなクロスアテンションモジュールをトレーニングし,セマンティックな特徴を一般的な視覚的モーダルにブリッジする。
論文 参考訳(メタデータ) (2022-10-12T15:24:59Z) - Semantic decoupled representation learning for remote sensing image
change detection [17.548248093344576]
RS画像CDのセマンティックデカップリング表現学習を提案する。
我々は、セマンティックマスクを利用して、異なるセマンティック領域の表現をアンタングルする。
さらに、下流CDタスクにおける関心対象の認識に役立ち、異なる意味表現を区別するようモデルに強制する。
論文 参考訳(メタデータ) (2022-01-15T07:35:26Z) - Interventional Few-Shot Learning [88.31112565383457]
本稿では,新しいFew-Shot Learningパラダイム,Interventional Few-Shot Learningを提案する。
コードはhttps://github.com/yue-zhongqi/ifsl.comで公開されている。
論文 参考訳(メタデータ) (2020-09-28T01:16:54Z) - AdarGCN: Adaptive Aggregation GCN for Few-Shot Learning [112.95742995816367]
FSFSLと呼ばれる新しい数発のスナップショット・ラーニング・セッティングを提案する。
FSFSLでは、ソースクラスとターゲットクラスの両方に限られたトレーニングサンプルがある。
また,無関係な画像を削除するためのグラフ畳み込みネットワーク (GCN) ベースのラベルデノイング (LDN) 手法を提案する。
論文 参考訳(メタデータ) (2020-02-28T10:34:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。