論文の概要: DAF-NET: a saliency based weakly supervised method of dual attention
fusion for fine-grained image classification
- arxiv url: http://arxiv.org/abs/2001.02219v1
- Date: Sat, 4 Jan 2020 12:59:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-14 12:48:15.195824
- Title: DAF-NET: a saliency based weakly supervised method of dual attention
fusion for fine-grained image classification
- Title(参考訳): DAF-NET : 微細な画像分類のための二重注意融合法
- Authors: ZiChao Dong, JiLong Wu, TingTing Ren, Yue Wang, MengYing Ge
- Abstract要約: 本研究では,2種類の注意を融合させ,深層双線形変換モジュールのPAF(part attention filter)として利用する新しいDAF法を提案する。
実験の結果、CUBデータセットの精度は87.6%、教師ネットとの連携は89.1%であった。
- 参考スコア(独自算出の注目度): 5.937828755755689
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fine-grained image classification is a challenging problem, since the
difficulty of finding discriminative features. To handle this circumstance,
basically, there are two ways to go. One is use attention based method to focus
on informative areas, while the other one aims to find high order between
features. Further, for attention based method there are two directions,
activation based and detection based, which are proved effective by scholars.
However ,rare work focus on fusing two types of attention with high order
feature. In this paper, we propose a novel DAF method which fuse two types of
attention and use them to as PAF(part attention filter) in deep bilinear
transformation module to mine the relationship between separate parts of an
object. Briefly, our network constructed by a student net who attempt to output
two attention maps and a teacher net uses these two maps as empirical
information to refine the result. The experiment result shows that only student
net could get 87.6% accuracy in CUB dataset while cooperating with teacher net
could achieve 89.1% accuracy.
- Abstract(参考訳): 識別的特徴を見つけるのが難しいため、きめ細かい画像分類は難しい問題である。
この状況に対処するには、基本的には2つの方法がある。
1つは注意に基づく手法で情報領域に焦点を合わせ、もう1つは特徴間の高次性を見つけることを目的としている。
さらに,注意に基づく手法には,アクティベーションベースと検出ベースという2つの方向がある。
しかし、高次特徴を持つ2種類の注意を融合させることに焦点が当てられている。
本稿では,2種類の注意を融合させて深部双線形変換モジュールのPAF(part attention filter)として用いる新しいDAF法を提案する。
簡単に言うと,2つのアテンションマップを出力しようとする学生ネットと,これら2つのマップを経験的情報として活用し,その結果を洗練する教師ネットによって構築されたネットワークである。
実験の結果,CUBデータセットの精度は87.6%,教師ネットとの連携は89.1%であった。
関連論文リスト
- AMFD: Distillation via Adaptive Multimodal Fusion for Multispectral Pedestrian Detection [23.91870504363899]
マルチスペクトル検出におけるダブルストリームネットワークは、マルチモーダルデータに2つの異なる特徴抽出枝を用いる。
これにより、組み込みデバイスにおける多スペクトル歩行者検出が自律システムに広く採用されるのを妨げている。
本稿では,教師ネットワークの本来のモーダル特徴を完全に活用できる適応型モーダル核融合蒸留(AMFD)フレームワークについて紹介する。
論文 参考訳(メタデータ) (2024-05-21T17:17:17Z) - Improving Fine-Grained Visual Recognition in Low Data Regimes via
Self-Boosting Attention Mechanism [27.628260249895973]
SAM(Self-boosting attention mechanism)は、ネットワークを正規化して、サンプルやクラス間で共有されるキー領域に集中するための新しい手法である。
我々はSAMを用いて、二線形プール方式で畳み込みマップをプールするために複数の注意マップを作成する変種を開発する。
論文 参考訳(メタデータ) (2022-08-01T05:36:27Z) - Target-aware Dual Adversarial Learning and a Multi-scenario
Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection [65.30079184700755]
本研究は、物体検出のために異なるように見える赤外線と可視画像の融合の問題に対処する。
従来のアプローチでは、2つのモダリティの根底にある共通点を発見し、反復最適化またはディープネットワークによって共通空間に融合する。
本稿では、融合と検出の連立問題に対する二段階最適化の定式化を提案し、その後、核融合と一般的に使用される検出ネットワークのためのターゲット認識デュアル逆学習(TarDAL)ネットワークに展開する。
論文 参考訳(メタデータ) (2022-03-30T11:44:56Z) - Exploring Inter-Channel Correlation for Diversity-preserved
KnowledgeDistillation [91.56643684860062]
ICKD (Inter-Channel correlation for Knowledge Distillation) を開発した。
ICKDは教師ネットワークにおける特徴空間の内在分布と十分な多様性特性をキャプチャする。
我々は,ノウルエッジ蒸留に基づく最初の手法であるResNet18は,ImageNet分類におけるTop-1の精度を72%以上向上させる。
論文 参考訳(メタデータ) (2022-02-08T07:01:56Z) - Light Field Saliency Detection with Dual Local Graph Learning
andReciprocative Guidance [148.9832328803202]
我々は、グラフネットワークを介して焦点スタック内のインフォメーション融合をモデル化する。
我々は、全焦点パタンを用いて焦点スタック融合過程をガイドする新しいデュアルグラフモデルを構築した。
論文 参考訳(メタデータ) (2021-10-02T00:54:39Z) - BCFNet: A Balanced Collaborative Filtering Network with Attention
Mechanism [106.43103176833371]
協調フィルタリング(CF)ベースの推奨方法が広く研究されている。
BCFNet(Balanced Collaborative Filtering Network)という新しい推薦モデルを提案する。
さらに注意機構は、暗黙のフィードバックの中で隠れた情報をよりよく捉え、ニューラルネットワークの学習能力を強化するように設計されている。
論文 参考訳(メタデータ) (2021-03-10T14:59:23Z) - Multi-attentional Deepfake Detection [79.80308897734491]
ディープフェイクによる顔の偽造はインターネットに広まり、深刻な社会的懸念を引き起こしている。
新たなマルチアテンテーショナルディープフェイク検出ネットワークを提案する。
具体的には,1)ネットワークを異なる局所的部分へ配置するための複数の空間的注意ヘッド,2)浅い特徴の微妙なアーティファクトをズームするテクスチャ的特徴拡張ブロック,3)低レベルなテクスチャ特徴と高レベルなセマンティクス特徴をアグリゲートする,の3つの構成要素からなる。
論文 参考訳(メタデータ) (2021-03-03T13:56:14Z) - Differentiable Feature Aggregation Search for Knowledge Distillation [47.94874193183427]
単教師蒸留フレームワークにおける多教師蒸留を模倣する特徴集約について紹介する。
DFAは、ニューラルネットワーク探索においてDARTSによって動機付けられた2段階の微分可能特徴集合探索法である。
実験の結果,DFAはCIFAR-100およびCINIC-10データセットの既存手法よりも優れていた。
論文 参考訳(メタデータ) (2020-08-02T15:42:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。