論文の概要: CNNs with Multi-Level Attention for Domain Generalization
- arxiv url: http://arxiv.org/abs/2304.00502v1
- Date: Sun, 2 Apr 2023 10:34:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-04 17:39:23.327992
- Title: CNNs with Multi-Level Attention for Domain Generalization
- Title(参考訳): ドメイン一般化のためのマルチレベル注意CNN
- Authors: Aristotelis Ballas and Christos Diou
- Abstract要約: 深層畳み込みニューラルネットワークは、画像分類とランキングにおいて大きな成功を収めている。
ディープ畳み込みニューラルネットワークは、分散外のシナリオでニューラルネットワークをテストした場合、性能劣化に悩まされる。
本稿では,頑健な分布外画像分類のためのニューラルネットワークアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 3.1372269816123994
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the past decade, deep convolutional neural networks have achieved
significant success in image classification and ranking and have therefore
found numerous applications in multimedia content retrieval. Still, these
models suffer from performance degradation when neural networks are tested on
out-of-distribution scenarios or on data originating from previously unseen
data Domains. In the present work, we focus on this problem of Domain
Generalization and propose an alternative neural network architecture for
robust, out-of-distribution image classification. We attempt to produce a model
that focuses on the causal features of the depicted class for robust image
classification in the Domain Generalization setting. To achieve this, we
propose attending to multiple-levels of information throughout a Convolutional
Neural Network and leveraging the most important attributes of an image by
employing trainable attention mechanisms. To validate our method, we evaluate
our model on four widely accepted Domain Generalization benchmarks, on which
our model is able to surpass previously reported baselines in three out of four
datasets and achieve the second best score in the fourth one.
- Abstract(参考訳): 過去10年間で、深層畳み込みニューラルネットワークは画像分類とランキングにおいて大きな成功を収めており、マルチメディアコンテンツ検索における多くの応用を見出している。
それでもこれらのモデルでは、ニューラルネットワークが配布外シナリオや、これまで目に見えないデータドメインから生まれたデータでテストされると、パフォーマンスが低下する。
本稿では,この領域一般化の問題に着目し,ロバストな分散画像分類のための代替ニューラルネットワークアーキテクチャを提案する。
我々は、ドメイン一般化設定におけるロバストな画像分類のための表現されたクラスの因果的特徴に焦点を当てたモデルを作ろうとする。
これを実現するために,畳み込みニューラルネットワークを通じて複数のレベルの情報への参加を提案し,トレーニング可能な注意機構を用いて画像の最も重要な属性を活用する。
提案手法を検証するために、4つの広く受け入れられたドメイン一般化ベンチマークを用いて評価を行い、4つのデータセットのうち3つで以前に報告されたベースラインを上回り、第4のベンチマークで第2のスコアを得ることができた。
関連論文リスト
- Learning to Generalize Unseen Domains via Multi-Source Meta Learning for Text Classification [71.08024880298613]
テキスト分類の多元的領域一般化について検討する。
本稿では、複数の参照ドメインを使用して、未知のドメインで高い精度を達成可能なモデルをトレーニングするフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-20T07:46:21Z) - GM-DF: Generalized Multi-Scenario Deepfake Detection [49.072106087564144]
既存の偽造検出は、通常、単一のドメインでのトレーニングモデルのパラダイムに従う。
本稿では,複数の顔偽造検出データセットを共同で訓練した場合のディープフェイク検出モデルの一般化能力について詳しく検討する。
論文 参考訳(メタデータ) (2024-06-28T17:42:08Z) - Visual Foundation Models Boost Cross-Modal Unsupervised Domain Adaptation for 3D Semantic Segmentation [17.875516787157018]
本研究では,2次元視覚基礎モデルから得られた知識を活用して,ラベルのない対象ドメインのより正確なラベルを生成する方法について検討する。
本手法は, 各種自律走行データセットを用いて評価し, 3次元セグメンテーションタスクにおいて有意な改善が得られた。
論文 参考訳(メタデータ) (2024-03-15T03:58:17Z) - Multi-Scale and Multi-Layer Contrastive Learning for Domain Generalization [5.124256074746721]
深部畳み込みニューラルネットワークの一般化能力は、ネットワークの多層的および多スケール的表現を活用することで向上できると論じる。
画像分類器の領域一般化を目的とした,低レベル特徴と高レベル特徴を複数スケールで組み合わせたフレームワークを提案する。
我々のモデルは従来のDG手法よりも優れており、全てのデータセットにおいて競争力と最先端の結果を連続的に生成できることを示す。
論文 参考訳(メタデータ) (2023-08-28T08:54:27Z) - Treasure in Distribution: A Domain Randomization based Multi-Source
Domain Generalization for 2D Medical Image Segmentation [20.97329150274455]
本稿では,Treasure in Distribution (TriD) と呼ばれるマルチソース領域一般化手法を提案する。
TriDは、一様分布からランダムにサンプリングすることで、強靭性のあるモデルを得るために、前例のない探索空間を構築する。
2つの医学的セグメンテーションタスクの実験により、我々のTriDは、目に見えないターゲットドメインデータに対して優れた一般化性能を達成できることを示した。
論文 参考訳(メタデータ) (2023-05-31T15:33:57Z) - CNN Feature Map Augmentation for Single-Source Domain Generalization [6.053629733936548]
ドメイン・ジェネリゼーション(DG)はここ数年で大きな注目を集めている。
DGの目標は、トレーニング中に利用可能なものと異なるデータ分散を提示した場合、引き続き正常に機能するモデルを作成することだ。
単一ソースDG画像分類設定における畳み込みニューラルネットワークアーキテクチャの代替正則化手法を提案する。
論文 参考訳(メタデータ) (2023-05-26T08:48:17Z) - Discovering Spatial Relationships by Transformers for Domain
Generalization [8.106918528575267]
ドメインの一般化は、コンピュータビジョンにおけるAI技術の迅速な開発のおかげで難しい問題である。
ほとんどの高度なアルゴリズムは畳み込みニューラルネット(CNN)に基づくディープアーキテクチャによって提案されている。
論文 参考訳(メタデータ) (2021-08-23T10:35:38Z) - Polynomial Networks in Deep Classifiers [55.90321402256631]
我々は深層ニューラルネットワークの研究を統一的な枠組みで行った。
私たちのフレームワークは、各モデルの誘導バイアスに関する洞察を提供します。
提案モデルの有効性を,標準画像および音声分類ベンチマークで評価した。
論文 参考訳(メタデータ) (2021-04-16T06:41:20Z) - Probabilistic Graph Attention Network with Conditional Kernels for
Pixel-Wise Prediction [158.88345945211185]
本稿では,画素レベルの予測を基本的側面,すなわち,技術の現状を推し進める新たなアプローチを提案する。
構造化されたマルチスケール機能学習と融合。
本論文では,マルチスケール表現を原理的に学習・融合するための新しいアテンテンションゲート条件ランダムフィールド(AG-CRFs)モデルに基づく確率的グラフアテンションネットワーク構造を提案する。
論文 参考訳(メタデータ) (2021-01-08T04:14:29Z) - DoFE: Domain-oriented Feature Embedding for Generalizable Fundus Image
Segmentation on Unseen Datasets [96.92018649136217]
対象ドメインに対するCNNの一般化能力を向上させるために,新しいドメイン指向特徴埋め込み(DoFE)フレームワークを提案する。
私たちのDoFEフレームワークは、マルチソースドメインから学んだ追加のドメイン事前知識で、画像機能を動的に強化します。
本フレームワークは、未確認データセットのセグメンテーション結果を満足して生成し、他の領域の一般化やネットワークの正規化手法を超越する。
論文 参考訳(メタデータ) (2020-10-13T07:28:39Z) - Adversarial Bipartite Graph Learning for Video Domain Adaptation [50.68420708387015]
ドメイン適応技術は,異なる領域間のモデルを適応させることに重点を置いているが,ビデオ認識領域ではめったに研究されていない。
近年,映像のソースと対象映像の表現を統一するために,対角学習を活用する視覚領域適応はビデオにはあまり効果がない。
本稿では,ソースとターゲットの相互作用を直接モデル化するAdversarial Bipartite Graph (ABG)学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-31T03:48:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。