論文の概要: Differentiable Channel Selection in Self-Attention For Person Re-Identification
- arxiv url: http://arxiv.org/abs/2505.08961v1
- Date: Tue, 13 May 2025 21:01:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-15 21:44:09.293974
- Title: Differentiable Channel Selection in Self-Attention For Person Re-Identification
- Title(参考訳): 個人再同定のための自己注意におけるチャンネル選択の相違
- Authors: Yancheng Wang, Nebojsa Jojic, Yingzhen Yang,
- Abstract要約: 本稿では,微分チャネル選択アテンションモジュール (DCS-アテンションモジュール) と呼ばれる新しいアテンションモジュールを提案する。
従来の自己注意とは対照的に、DCS-Attentionモジュールは注意重みの計算において情報チャネルの選択を行う。
我々のDCS-Attentionは、固定されたニューラルネットワークのバックボーンと互換性があるか、微分可能なニューラルネットワークサーチ(DNAS)で学習可能なバックボーンと互換性があり、それぞれ固定されたバックボーン(DCS-FB)とDCS-DNASでDCSに導かれる。
- 参考スコア(独自算出の注目度): 18.19602558582884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a novel attention module termed the Differentiable Channel Selection Attention module, or the DCS-Attention module. In contrast with conventional self-attention, the DCS-Attention module features selection of informative channels in the computation of the attention weights. The selection of the feature channels is performed in a differentiable manner, enabling seamless integration with DNN training. Our DCS-Attention is compatible with either fixed neural network backbones or learnable backbones with Differentiable Neural Architecture Search (DNAS), leading to DCS with Fixed Backbone (DCS-FB) and DCS-DNAS, respectively. Importantly, our DCS-Attention is motivated by the principle of Information Bottleneck (IB), and a novel variational upper bound for the IB loss, which can be optimized by SGD, is derived and incorporated into the training loss of the networks with the DCS-Attention modules. In this manner, a neural network with DCS-Attention modules is capable of selecting the most informative channels for feature extraction so that it enjoys state-of-the-art performance for the Re-ID task. Extensive experiments on multiple person Re-ID benchmarks using both DCS-FB and DCS-DNAS show that DCS-Attention significantly enhances the prediction accuracy of DNNs for person Re-ID, which demonstrates the effectiveness of DCS-Attention in learning discriminative features critical to identifying person identities. The code of our work is available at https://github.com/Statistical-Deep-Learning/DCS-Attention.
- Abstract(参考訳): 本稿では,微分チャネル選択アテンションモジュール (DCS-Attention Module) と呼ばれる新しいアテンションモジュールを提案する。
従来の自己注意とは対照的に、DCS-Attentionモジュールは注意重みの計算において情報チャネルの選択を行う。
特徴チャネルの選択は異なる方法で行われ、DNNトレーニングとのシームレスな統合を可能にする。
我々のDCS-Attentionは、固定されたニューラルネットワークのバックボーンと互換性があるか、微分可能なニューラルネットワークサーチ(DNAS)で学習可能なバックボーンと互換性があり、それぞれ固定されたバックボーン(DCS-FB)とDCS-DNASでDCSに導かれる。
重要なことは、我々のDCS-AttentionはInformation Bottleneck(IB)の原則によって動機付けられており、SGDで最適化可能な新しいIB損失の変動上界は、DCS-Attentionモジュールによるネットワークのトレーニング損失に導出され、組み込まれている。
このように、DCS-Attentionモジュールを持つニューラルネットワークは、特徴抽出のための最も情報性の高いチャネルを選択して、Re-IDタスクの最先端性能を享受することができる。
DCS-FBとDCS-DNASを併用した複数の人物Re-IDベンチマークの大規模な実験により、DCS-Attentionは人物Re-IDに対するDNNの予測精度を大幅に向上し、個人識別に不可欠な識別的特徴の学習におけるDCS-Attentionの有効性を示す。
私たちの作業のコードはhttps://github.com/Statistical-Deep-Learning/DCS-Attention.comで公開されています。
関連論文リスト
- A dynamic vision sensor object recognition model based on trainable event-driven convolution and spiking attention mechanism [9.745798797360886]
Spiking Neural Networks(SNN)は、ダイナミックビジュアルセンサー(DVS)からのイベントストリームを処理するのに適している
DVSオブジェクトから特徴を抽出するために、SNNは通常、固定されたカーネルパラメータでイベント駆動の畳み込みを使用する。
トレーニング可能なイベント駆動型畳み込みとスパイク注意機構を利用するDVSオブジェクト認識モデルを提案する。
論文 参考訳(メタデータ) (2024-09-19T12:01:05Z) - DCNN: Dual Cross-current Neural Networks Realized Using An Interactive Deep Learning Discriminator for Fine-grained Objects [48.65846477275723]
本研究では、微細な画像分類の精度を向上させるために、新しい二重電流ニューラルネットワーク(DCNN)を提案する。
弱い教師付き学習バックボーンモデルを構築するための新しい特徴として、(a)異種データの抽出、(b)特徴マップの解像度の維持、(c)受容領域の拡大、(d)グローバル表現と局所特徴の融合などがある。
論文 参考訳(メタデータ) (2024-05-07T07:51:28Z) - CTVIS: Consistent Training for Online Video Instance Segmentation [62.957370691452844]
オンラインビデオインスタンスセグメンテーション(VIS)におけるインスタンスの関連付けにおいて,インスタンス埋め込みの識別が重要な役割を担っている
近年のオンラインVIS手法では,参照フレームのみから派生したCIを活用している。
我々は,オンラインVIS(Consistent Training for Online VIS)と呼ばれる,トレーニングパイプラインと推論パイプラインの整合性を重視した,シンプルで効果的なトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-07-24T08:44:25Z) - Feature Disentanglement Learning with Switching and Aggregation for
Video-based Person Re-Identification [9.068045610800667]
映像人物再識別(Re-ID)では、連続したフレームから対象人物の特徴を一貫して抽出する必要がある。
既存の手法は時間的情報の使用方法にのみ焦点をあてる傾向があり、しばしばネットワークは同じような外観と同じ背景に騙される。
本稿では,DSANet(Disentanglement and Switching and Aggregation Network)を提案する。
論文 参考訳(メタデータ) (2022-12-16T04:27:56Z) - A Generic Shared Attention Mechanism for Various Backbone Neural Networks [53.36677373145012]
自己注意モジュール(SAM)は、異なる層にまたがる強い相関した注意マップを生成する。
Dense-and-Implicit Attention (DIA)はSAMをレイヤ間で共有し、長期間のメモリモジュールを使用する。
我々のシンプルで効果的なDIAは、様々なネットワークバックボーンを一貫して拡張できます。
論文 参考訳(メタデータ) (2022-10-27T13:24:08Z) - Unsupervised Domain Adaptation via Style-Aware Self-intermediate Domain [52.783709712318405]
非教師なしドメイン適応(UDA)は、ラベル豊富なソースドメインから関連するがラベルのないターゲットドメインに知識を伝達する、かなりの注目を集めている。
本研究では,大規模なドメインギャップと伝達知識を橋渡しし,クラス非ネイティブ情報の損失を軽減するために,SAFF(style-aware feature fusion)法を提案する。
論文 参考訳(メタデータ) (2022-09-05T10:06:03Z) - Instance Explainable Temporal Network For Multivariate Timeseries [0.0]
本稿では,推論のインスタンスごとの分類決定において重要なチャネルを識別する新しいネットワーク(IETNet)を提案する。
IETNetは、時間的特徴抽出、変数選択、共同変数の相互作用を単一の学習フレームワークに組み合わせたエンドツーエンドネットワークである。
論文 参考訳(メタデータ) (2020-05-26T20:55:24Z) - STDPG: A Spatio-Temporal Deterministic Policy Gradient Agent for Dynamic
Routing in SDN [6.27420060051673]
ソフトウェア定義ネットワーク(SDN)における動的ルーティングは、集中的な意思決定問題と見なすことができる。
本稿では,SDNにおける動的ルーティングのための新しいモデルフリーフレームワークを提案する。
STDPGは、平均的なエンドツーエンド遅延の観点から、より良いルーティングソリューションを実現する。
論文 参考訳(メタデータ) (2020-04-21T07:19:07Z) - Modality Compensation Network: Cross-Modal Adaptation for Action
Recognition [77.24983234113957]
異なるモダリティの関係を探索するためのモダリティ補償ネットワーク(MCN)を提案する。
我々のモデルは、適応表現学習を実現するために、モーダリティ適応ブロックによって、ソースおよび補助モーダリティからのデータをブリッジする。
実験の結果,MCNは4つの広く使用されている行動認識ベンチマークにおいて,最先端のアプローチよりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-01-31T04:51:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。