論文の概要: Progressive Random Convolutions for Single Domain Generalization
- arxiv url: http://arxiv.org/abs/2304.00424v1
- Date: Sun, 2 Apr 2023 01:42:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-04 18:06:46.053362
- Title: Progressive Random Convolutions for Single Domain Generalization
- Title(参考訳): 単一領域一般化のための漸進的ランダム畳み込み
- Authors: Seokeon Choi, Debasmit Das, Sungha Choi, Seunghan Yang, Hyunsin Park,
Sungrack Yun
- Abstract要約: 単一ドメインの一般化は、任意の未知のターゲットドメインで正常に動作するように、1つのソースドメインで一般化可能なモデルをトレーニングすることを目的としている。
ランダム畳み込み(RandConv)に基づく画像拡張により、局所的なテクスチャを歪ませることで、一般化可能な視覚表現を学習することができる。
本稿では,カーネルサイズを小さくすることなく,ランダムな畳み込み層を積み重ねるプログレッシブランダム畳み込み(Pro-RandConv)手法を提案する。
- 参考スコア(独自算出の注目度): 23.07924668615951
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Single domain generalization aims to train a generalizable model with only
one source domain to perform well on arbitrary unseen target domains. Image
augmentation based on Random Convolutions (RandConv), consisting of one
convolution layer randomly initialized for each mini-batch, enables the model
to learn generalizable visual representations by distorting local textures
despite its simple and lightweight structure. However, RandConv has structural
limitations in that the generated image easily loses semantics as the kernel
size increases, and lacks the inherent diversity of a single convolution
operation. To solve the problem, we propose a Progressive Random Convolution
(Pro-RandConv) method that recursively stacks random convolution layers with a
small kernel size instead of increasing the kernel size. This progressive
approach can not only mitigate semantic distortions by reducing the influence
of pixels away from the center in the theoretical receptive field, but also
create more effective virtual domains by gradually increasing the style
diversity. In addition, we develop a basic random convolution layer into a
random convolution block including deformable offsets and affine transformation
to support texture and contrast diversification, both of which are also
randomly initialized. Without complex generators or adversarial learning, we
demonstrate that our simple yet effective augmentation strategy outperforms
state-of-the-art methods on single domain generalization benchmarks.
- Abstract(参考訳): 単一ドメイン一般化(single domain generalization)は、1つのソースドメインしか持たない一般化モデルのトレーニングを目標とする。
ランダム畳み込み(RandConv)に基づく画像拡張は、各ミニバッチに対してランダムに初期化された1つの畳み込み層で構成され、単純で軽量な構造にもかかわらず局所的なテクスチャを歪ませることで、一般化可能な視覚表現を学習することができる。
しかし、RandConvは、生成したイメージがカーネルサイズが大きくなるにつれて意味論が容易に失われ、単一の畳み込み操作の固有の多様性が欠如している構造的制限がある。
そこで本研究では,カーネルサイズを増大させる代わりに,カーネルサイズを小さくしてランダムな畳み込み層を再帰的に積み重ねるプログレッシブランダム畳み込み法を提案する。
このプログレッシブアプローチは、理論受容領域の中心から画素の影響を減らし、意味の歪みを軽減するだけでなく、スタイルの多様性を徐々に増大させることでより効果的な仮想領域を作り出すことができる。
さらに、変形可能なオフセットとアフィン変換を含むランダムな畳み込みブロックに基本的ランダムな畳み込み層を構築し、どちらもランダムに初期化されるテクスチャとコントラストの多様化をサポートする。
複雑なジェネレータや逆学習がなければ、我々の単純かつ効果的な拡張戦略は、単一のドメイン一般化ベンチマークにおける最先端の手法よりも優れていることを示す。
関連論文リスト
- Padding-free Convolution based on Preservation of Differential
Characteristics of Kernels [1.3597551064547502]
本稿では,カーネルの差分特性の保存に基づくサイズ保持畳み込み法を提案する。
主なアイデアは、不完全なスライドウィンドウ上の畳み込みを、その中心画素で局所的に評価された線形微分作用素に"崩壊"させることである。
論文 参考訳(メタデータ) (2023-09-12T16:36:12Z) - Look at the Neighbor: Distortion-aware Unsupervised Domain Adaptation
for Panoramic Semantic Segmentation [5.352137021024213]
この目的は、等方射影(ERP)の均一分布画素のスタイル不均一性と歪み問題に起因する領域ギャップに対処することである。
パノラマ的セマンティックセグメンテーションの歪み問題に効果的に対処できる新しいUDAフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-10T10:47:12Z) - OneDConv: Generalized Convolution For Transform-Invariant Representation [76.15687106423859]
一般化された一次元畳み込み作用素(OneDConv)を提案する。
計算的かつパラメトリック的に効率的な方法で入力特徴に基づいて、畳み込みカーネルを動的に変換する。
一般的な画像のパフォーマンスを犠牲にすることなく、畳み込みの堅牢性と一般化を改善する。
論文 参考訳(メタデータ) (2022-01-15T07:44:44Z) - Adaptive Single Image Deblurring [43.02281823557039]
本稿では,画像間の大きなぼやけた変化を扱うために,効率的な画素適応化と特徴注意設計を提案する。
また、性能を大幅に向上させる効果的なコンテンツ認識グローバルローカルフィルタリングモジュールを提案する。
論文 参考訳(メタデータ) (2022-01-01T10:10:19Z) - CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。
提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。
実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文 参考訳(メタデータ) (2021-12-31T04:37:11Z) - Learning with convolution and pooling operations in kernel methods [8.528384027684192]
近年の実証研究により、階層的畳み込みカーネルは、画像分類タスクにおけるカーネルメソッドの性能を向上させることが示されている。
畳み込みアーキテクチャにおける近似と一般化の正確な相互作用について検討する。
この結果から,対象関数に適応したアーキテクチャの選択が,サンプルの複雑性を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2021-11-16T09:00:44Z) - Mutual Affine Network for Spatially Variant Kernel Estimation in Blind
Image Super-Resolution [130.32026819172256]
既存のブラインド画像超解像法(SR)は、ぼやけたカーネルが画像全体にわたって空間的に不変であると仮定する。
本稿では,空間変動カーネル推定のための相互アフィンネットワーク(MANet)を提案する。
論文 参考訳(メタデータ) (2021-08-11T16:11:17Z) - X-volution: On the unification of convolution and self-attention [52.80459687846842]
本稿では,畳み込み操作と自己注意操作の両方からなるマルチブランチ基本モジュールを提案する。
提案したX-進化は、非常に競争力のある視覚的理解の改善を実現する。
論文 参考訳(メタデータ) (2021-06-04T04:32:02Z) - Robust and Generalizable Visual Representation Learning via Random
Convolutions [44.62476686073595]
ニューラルネットワークのロバスト性は、ランダム畳み込みをデータ拡張として利用することにより、大幅に改善できることを示す。
我々の手法は、より堅牢な事前訓練された視覚表現を提供することで、下流タスクの恩恵を受けることができる。
論文 参考訳(メタデータ) (2020-07-25T19:52:25Z) - Locally Masked Convolution for Autoregressive Models [107.4635841204146]
LMConvは標準的な2Dコンボリューションの簡単な修正であり、任意のマスクを画像の各位置の重みに適用することができる。
我々は,パラメータを共有するが生成順序が異なる分布推定器のアンサンブルを学習し,全画像密度推定の性能を向上させる。
論文 参考訳(メタデータ) (2020-06-22T17:59:07Z) - FDA: Fourier Domain Adaptation for Semantic Segmentation [82.4963423086097]
本稿では,教師なし領域適応の簡易な手法について述べる。一方の低周波スペクトルを他方と交換することにより,音源と対象分布の相違を低減できる。
本手法を意味的セグメンテーション(semantic segmentation, 意味的セグメンテーション, 意味的セグメンテーション)で説明する。
以上の結果から,より高度な手法が学習に苦しむデータにおいて,単純な手順であってもニュアンス変動を低減できる可能性が示唆された。
論文 参考訳(メタデータ) (2020-04-11T22:20:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。