論文の概要: An Effective Data Augmentation for Person Re-identification
- arxiv url: http://arxiv.org/abs/2101.08533v1
- Date: Thu, 21 Jan 2021 10:33:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-21 16:38:09.518199
- Title: An Effective Data Augmentation for Person Re-identification
- Title(参考訳): 人物再識別のための効果的なデータ拡張
- Authors: Yunpeng Gong and Zhiyong Zeng
- Abstract要約: 本稿では,ランダムグレースケール変換,ランダムグレースケールパッチ置換とその組み合わせについて述べる。
構造情報はreidモデルの性能に有意な影響を与えることが判明した。
提案手法は最大3.3%の性能向上を実現し,複数のデータセット上で現在最も高い検索精度を実現している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In order to make full use of structural information of grayscale images and
reduce adverse impact of illumination variation for person re-identification
(ReID), an effective data augmentation method is proposed in this paper, which
includes Random Grayscale Transformation, Random Grayscale Patch Replacement
and their combination. It is discovered that structural information has a
significant effect on the ReID model performance, and it is very important
complementary to RGB images ReID. During ReID model training, on the one hand,
we randomly selected a rectangular area in the RGB image and replace its color
with the same rectangular area grayscale in corresponding grayscale image, thus
we generate a training image with different grayscale areas; On the other hand,
we convert an image into a grayscale image. These two methods will reduce the
risk of overfitting the model due to illumination variations and make the model
more robust to cross-camera. The experimental results show that our method
achieves a performance improvement of up to 3.3%, achieving the highest
retrieval accuracy currently on multiple datasets.
- Abstract(参考訳): 本稿では, グレースケール画像の構造情報を十分に活用し, 人物再同定(reid)における照明変動の悪影響を低減するために, ランダムグレースケール変換, ランダムグレースケールパッチ置換, それらの組合せを含む効果的なデータ拡張法を提案する。
構造情報はReIDモデルの性能に重要な影響を及ぼし,RGB画像ReIDの補完となることが判明した。
reidモデルのトレーニング中、rgb画像の矩形領域をランダムに選択し、その色を対応するグレースケール画像において同じ矩形領域グレースケールに置き換えることにより、グレースケール領域の異なるトレーニング画像を生成する一方、グレースケール画像に変換する。
これら2つの方法は、照明のバリエーションによってモデルが過度に適合するリスクを低減し、モデルがクロスカメラに対してより堅牢になる。
実験の結果,提案手法は最大3.3%の性能向上を実現し,複数のデータセット上での検索精度を最大化できることがわかった。
関連論文リスト
- Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - Invertible Rescaling Network and Its Extensions [118.72015270085535]
本研究では,新たな視点から双方向の劣化と復元をモデル化する,新しい可逆的枠組みを提案する。
我々は、有効な劣化画像を生成し、失われたコンテンツの分布を変換する可逆モデルを開発する。
そして、ランダムに描画された潜在変数とともに、生成された劣化画像に逆変換を適用することにより、復元可能とする。
論文 参考訳(メタデータ) (2022-10-09T06:58:58Z) - Detecting Recolored Image by Spatial Correlation [60.08643417333974]
画像のリカラー化は、画像の色値を操作して新しいスタイルを与える、新たな編集技術である。
本稿では,空間相関の観点から,従来型と深層学習による再色検出の汎用的検出能力を示す解を探索する。
提案手法は,複数のベンチマークデータセット上での最先端検出精度を実現し,未知の種類の再色法を適切に一般化する。
論文 参考訳(メタデータ) (2022-04-23T01:54:06Z) - Towards Homogeneous Modality Learning and Multi-Granularity Information
Exploration for Visible-Infrared Person Re-Identification [16.22986967958162]
Visible-infrared person re-identification (VI-ReID) は、可視・赤外線カメラビューを介して人物画像の集合を検索することを目的とした、困難かつ必須の課題である。
従来の手法では, GAN (Generative Adversarial Network) を用いて, モーダリティ・コンシデント・データを生成する手法が提案されている。
そこで本研究では、視線外デュアルモード学習をグレーグレー単一モード学習問題として再構成する、統一されたダークラインスペクトルであるAligned Grayscale Modality (AGM)を用いて、モード間マッチング問題に対処する。
論文 参考訳(メタデータ) (2022-04-11T03:03:19Z) - Deep Amended Gradient Descent for Efficient Spectral Reconstruction from
Single RGB Images [42.26124628784883]
本稿では、AGD-Netという、コンパクトで効率的でエンドツーエンドの学習ベースのフレームワークを提案する。
まず、古典的勾配降下アルゴリズムに基づいて問題を明示的に定式化する。
AGD-Netは、平均1.0dB以上のリコンストラクション品質を向上させることができる。
論文 参考訳(メタデータ) (2021-08-12T05:54:09Z) - Degrade is Upgrade: Learning Degradation for Low-light Image Enhancement [52.49231695707198]
2段階の工程で細部と色を精錬しながら、内在的な劣化と低照度画像を照らし出す。
カラー画像の定式化に触発されて,まず低照度入力からの劣化を推定し,環境照明色の歪みをシミュレーションし,そのコンテンツを精錬して拡散照明色の損失を回復した。
LOL1000データセットではPSNRで0.95dB、ExDarkデータセットでは3.18%のmAPでSOTAを上回った。
論文 参考訳(メタデータ) (2021-03-19T04:00:27Z) - SFANet: A Spectrum-aware Feature Augmentation Network for
Visible-Infrared Person Re-Identification [12.566284647658053]
クロスモダリティマッチング問題に対するSFANetという新しいスペクトル認識特徴量化ネットワークを提案する。
grayscale-spectrumイメージで学習すると、モダリティの不一致を低減し、内部構造関係を検出することができる。
特徴レベルでは、特定および粉砕可能な畳み込みブロックの数のバランスをとることにより、従来の2ストリームネットワークを改善します。
論文 参考訳(メタデータ) (2021-02-24T08:57:32Z) - A Person Re-identification Data Augmentation Method with Adversarial
Defense Effect [5.8377608127737375]
対角防御効果を有するReIDマルチモーダルデータ拡張法を提案する。
提案手法は,複数のデータセット上で良好に動作し,CVPR 2020 が提案する ReID に対する MS-SSIM 攻撃の防御に成功している。
論文 参考訳(メタデータ) (2021-01-21T12:07:57Z) - Deep Variational Network Toward Blind Image Restoration [60.45350399661175]
ブラインド画像復元はコンピュータビジョンでは一般的だが難しい問題である。
両利点を両立させることを目的として,新しいブラインド画像復元手法を提案する。
画像デノイングと超解像という2つの典型的なブラインド赤外線タスクの実験により,提案手法が現状よりも優れた性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-08-25T03:30:53Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。