論文の概要: Bridging the Distribution Gap of Visible-Infrared Person
Re-identification with Modality Batch Normalization
- arxiv url: http://arxiv.org/abs/2103.04778v1
- Date: Mon, 8 Mar 2021 14:16:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-09 15:31:48.823750
- Title: Bridging the Distribution Gap of Visible-Infrared Person
Re-identification with Modality Batch Normalization
- Title(参考訳): モダリティバッチ正規化による可視赤外人物の分布ギャップのブリッジ化
- Authors: Wenkang Li, Qi Ke, Wenbin Chen, Yicong Zhou
- Abstract要約: 最小バッチ全体ではなく、各モードのサブバッチを正規化するMBN(Modality Batch Normalization)と呼ばれる新しいバッチ正規化層を提案する。
MBNは、異なるデータセット、バックボーン、損失でもVI-ReIDモデルのパフォーマンスを向上させることができます。
- 参考スコア(独自算出の注目度): 33.312909330685656
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visible-infrared cross-modality person re-identification (VI-ReID), whose aim
is to match person images between visible and infrared modality, is a
challenging cross-modality image retrieval task. Most existing works integrate
batch normalization layers into their neural network, but we found out that
batch normalization layers would lead to two types of distribution gap: 1)
inter-mini-batch distribution gap -- the distribution gap of the same modality
between each mini-batch; 2) intra-mini-batch modality distribution gap -- the
distribution gap of different modality within the same mini-batch. To address
these problems, we propose a new batch normalization layer called Modality
Batch Normalization (MBN), which normalizes each modality sub-mini-batch
respectively instead of the whole mini-batch, and can reduce these distribution
gap significantly. Extensive experiments show that our MBN is able to boost the
performance of VI-ReID models, even with different datasets, backbones and
losses.
- Abstract(参考訳): Visible-infrared cross-modality person re-identification (VI-ReID) は、視覚的モダリティと赤外線的モダリティの人物像をマッチングすることを目的としている。
既存の研究の多くは、バッチ正規化層をニューラルネットワークに統合するが、バッチ正規化層が2種類の分散ギャップをもたらすことが判明した: 1) ミニバッチ間分散ギャップ -- 各ミニバッチ間の同じモダリティの分配ギャップ; 2) ミニバッチ内分散ギャップ -- 同じミニバッチ内の異なるモダリティの分配ギャップ。
これらの問題に対処するため、我々は、各モダリティサブミニバッチをそれぞれミニバッチ全体ではなく正規化し、分散ギャップを著しく低減できる、modality batch normalization(mbn)と呼ばれる新しいバッチ正規化層を提案する。
広範な実験により、MBNは異なるデータセット、バックボーン、損失でもVI-ReIDモデルのパフォーマンスを向上させることができます。
関連論文リスト
- Improving Distribution Alignment with Diversity-based Sampling [0.0]
ドメインシフトは機械学習においてユビキタスであり、実際のデータにデプロイすると、モデルのパフォーマンスが大幅に低下する可能性がある。
本稿では,各サンプル小バッチの多様性を誘導することにより,これらの推定値を改善することを提案する。
同時にデータのバランスを保ち、勾配のばらつきを低減し、それによってモデルの一般化能力を高める。
論文 参考訳(メタデータ) (2024-10-05T17:26:03Z) - Selective Hourglass Mapping for Universal Image Restoration Based on Diffusion Model [36.57703763466984]
そこで我々は拡散モデルDiffUIRに基づく高度な時間ガラスマッピング戦略を提案する。
5つの画像復元タスク、22のベンチマーク、ゼロショットの一般化設定で最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-03-17T09:41:20Z) - One-step Diffusion with Distribution Matching Distillation [54.723565605974294]
本稿では,拡散モデルを1ステップ画像生成器に変換する手法である分散マッチング蒸留(DMD)を紹介する。
約KLの発散を最小化することにより,拡散モデルと分布レベルで一致した一段階画像生成装置を強制する。
提案手法は,イメージネット64x64では2.62 FID,ゼロショットCOCO-30kでは11.49 FIDに到達した。
論文 参考訳(メタデータ) (2023-11-30T18:59:20Z) - Efficient Bilateral Cross-Modality Cluster Matching for Unsupervised Visible-Infrared Person ReID [56.573905143954015]
本稿では, クラスタ間マッチングによるモダリティギャップを低減するための, クラスタマッチングに基づく新たな学習フレームワークを提案する。
このような監視信号の下では、クラスタレベルで特徴を協調的に整列させるために、モダリティ・特定・モダリティ・非依存(MSMA)コントラスト学習フレームワークが提案されている。
公開SYSU-MM01とRegDBデータセットの実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-05-22T03:27:46Z) - One Transformer Fits All Distributions in Multi-Modal Diffusion at Scale [36.590918776922905]
本論文では,マルチモーダルデータの集合に関連するすべての分布を1つのモデルに適合させる統合拡散フレームワーク(UniDiffuser)を提案する。
統一的な視点に触発されたUniDiffuserは、元の拡散モデルに最小限の変更を加えながら、全ての分布を同時に学習する。
論文 参考訳(メタデータ) (2023-03-12T03:38:39Z) - Cooperative Distribution Alignment via JSD Upper Bound [7.071749623370137]
教師なし分布アライメントは、2つ以上のソース分布を共有整列分布にマッピングする変換を推定する。
このタスクには、生成モデリング、教師なしドメイン適応、社会的に認識された学習など、多くの応用がある。
我々は,従来のフローベースアプローチを,単一の非逆数フレームワークで統一し,一般化することを提案する。
論文 参考訳(メタデータ) (2022-07-05T20:09:03Z) - KL Guided Domain Adaptation [88.19298405363452]
ドメイン適応は重要な問題であり、現実世界のアプリケーションにしばしば必要である。
ドメイン適応文学における一般的なアプローチは、ソースとターゲットドメインに同じ分布を持つ入力の表現を学ぶことである。
確率的表現ネットワークにより、KL項はミニバッチサンプルにより効率的に推定できることを示す。
論文 参考訳(メタデータ) (2021-06-14T22:24:23Z) - Gaussian Mixture Graphical Lasso with Application to Edge Detection in
Brain Networks [21.49394455839253]
この作品はLatent DirichletAllocation (LDA)にインスパイアされたものです。
GaussianMixture Graphical Lasso (MGL) という新しいモデルを提案する。
mglは、各混合成分が生成する信号の比率とそれらのパラメータをemフレームワークを介して反復的に学習する。
論文 参考訳(メタデータ) (2021-01-13T21:15:30Z) - Learning to Match Distributions for Domain Adaptation [116.14838935146004]
本稿では,ドメイン間分布マッチングを自動的に学習する学習 to Match (L2M)を提案する。
L2Mは、メタネットワークを用いてデータ駆動方式で分布整合損失を学習することにより、誘導バイアスを低減する。
公開データセットの実験は、SOTA法よりもL2Mの方が優れていることを裏付けている。
論文 参考訳(メタデータ) (2020-07-17T03:26:13Z) - Embedding Propagation: Smoother Manifold for Few-Shot Classification [131.81692677836202]
本稿では, 組込み伝搬を非教師なし非パラメトリック正規化器として, 数ショット分類における多様体平滑化に用いることを提案する。
埋め込み伝播がより滑らかな埋め込み多様体を生み出すことを実証的に示す。
複数の半教師付き学習シナリオにおいて,埋め込み伝搬によりモデルの精度が最大16%向上することを示す。
論文 参考訳(メタデータ) (2020-03-09T13:51:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。