論文の概要: A Review on Generative Adversarial Networks for Data Augmentation in
Person Re-Identification Systems
- arxiv url: http://arxiv.org/abs/2302.09119v2
- Date: Tue, 21 Feb 2023 15:21:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-22 11:41:39.940753
- Title: A Review on Generative Adversarial Networks for Data Augmentation in
Person Re-Identification Systems
- Title(参考訳): 個人再同定システムにおけるデータ拡張のための生成型adversarial networkの検討
- Authors: Victor Uc-Cetina, Laura Alvarez-Gonzalez, Anabel Martin-Gonzalez
- Abstract要約: データセットを減らした機械学習ベースのコンピュータビジョンアプリケーションでは、ニューラルモデルのトレーニングに利用可能な画像やビデオの集合を拡大することで、再識別システムの性能を改善する可能性がある。
本稿では、データ拡張による人物再識別モデルの性能向上に向けた、直近の最も関連性の高いアプローチについて、生成的敵ネットワークを用いて概説する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Interest in automatic people re-identification systems has significantly
grown in recent years, mainly for developing surveillance and smart shops
software. Due to the variability in person posture, different lighting
conditions, and occluded scenarios, together with the poor quality of the
images obtained by different cameras, it is currently an unsolved problem. In
machine learning-based computer vision applications with reduced data sets, one
possibility to improve the performance of re-identification system is through
the augmentation of the set of images or videos available for training the
neural models. Currently, one of the most robust ways to generate synthetic
information for data augmentation, whether it is video, images or text, are the
generative adversarial networks. This article reviews the most relevant recent
approaches to improve the performance of person re-identification models
through data augmentation, using generative adversarial networks. We focus on
three categories of data augmentation approaches: style transfer, pose
transfer, and random generation.
- Abstract(参考訳): 近年,監視ソフトやスマートショップソフトの開発を中心に,自動人物識別システムへの関心が高まっている。
人物の姿勢の変化、異なる照明条件、オクルードされたシナリオ、異なるカメラで得られた画像の質の悪さなどにより、現在未解決の問題となっている。
データセットを減らした機械学習ベースのコンピュータビジョンアプリケーションでは、ニューラルモデルのトレーニングに利用可能な画像やビデオの集合を拡大することで、再識別システムの性能を改善する可能性がある。
現在、データ拡張のための合成情報を生成する最も堅牢な方法の1つは、ビデオ、画像、テキストである。
本稿では,データ拡張による人物再識別モデルの性能向上に最も関連性の高いアプローチを,生成的敵ネットワークを用いて概説する。
データ拡張アプローチでは,スタイル転送,ポーズ転送,ランダム生成という3つのカテゴリに注目した。
関連論文リスト
- A Review of Image Retrieval Techniques: Data Augmentation and Adversarial Learning Approaches [0.0]
本稿では,検索性能向上におけるデータ強化と対人学習技術の役割について概説する。
データ拡張は、より多様なトレーニングサンプルを生成し、現実世界のバリエーションをシミュレートし、オーバーフィッティングを減らすことで、モデルの一般化能力と堅牢性を高める。
敵の攻撃と防衛は 訓練中に混乱をもたらす 潜在的な攻撃に対する モデルの堅牢性を改善するために
論文 参考訳(メタデータ) (2024-09-02T12:55:17Z) - A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - Synthesizing Efficient Data with Diffusion Models for Person Re-Identification Pre-Training [51.87027943520492]
本稿では,既知の同一性に基づく多様な画像の効率向上と生成を行う新しいパラダイムDiffusion-ReIDを提案する。
提案したパラダイムに適合して,まず,5,183個のIDから777K以上の画像で構成された,大規模なRe-IDデータセットDiff-Personを新たに作成する。
論文 参考訳(メタデータ) (2024-06-10T06:26:03Z) - Training on Thin Air: Improve Image Classification with Generated Data [28.96941414724037]
Diffusion Inversionは、画像分類のための多種多様な高品質なトレーニングデータを生成するための、シンプルで効果的な方法である。
提案手法は,元のデータ分布を捕捉し,画像を安定拡散の潜在空間に反転させることにより,データカバレッジを確保する。
生成した画像が元のデータセットに取って代わることに成功した3つの重要なコンポーネントを特定します。
論文 参考訳(メタデータ) (2023-05-24T16:33:02Z) - Effective Data Augmentation With Diffusion Models [65.09758931804478]
我々は、事前訓練されたテキスト・画像拡散モデルによりパラメータ化された画像・画像変換によるデータ拡張の多様性の欠如に対処する。
本手法は,市販の拡散モデルを用いて画像のセマンティクスを編集し,いくつかのラベル付き例から新しい視覚概念に一般化する。
本手法は,実世界の雑草認識タスクと数ショット画像分類タスクにおいて評価し,テスト領域における精度の向上を観察する。
論文 参考訳(メタデータ) (2023-02-07T20:42:28Z) - Robust Semi-supervised Federated Learning for Images Automatic
Recognition in Internet of Drones [57.468730437381076]
プライバシー保護型UAV画像認識のための半教師付きフェデレートラーニング(SSFL)フレームワークを提案する。
異なるカメラモジュールを使用したUAVによって収集されたローカルデータの数、特徴、分布には大きな違いがある。
本稿では,クライアントがトレーニングに参加する頻度,すなわちFedFreqアグリゲーションルールに基づくアグリゲーションルールを提案する。
論文 参考訳(メタデータ) (2022-01-03T16:49:33Z) - Learning Representational Invariances for Data-Efficient Action
Recognition [52.23716087656834]
我々は,データ拡張戦略により,Kinetics-100,UCF-101,HMDB-51データセットのパフォーマンスが期待できることを示す。
また,完全な教師付き設定でデータ拡張戦略を検証し,性能向上を実証した。
論文 参考訳(メタデータ) (2021-03-30T17:59:49Z) - A 3D GAN for Improved Large-pose Facial Recognition [3.791440300377753]
深層畳み込みニューラルネットワークを用いた顔認識は、顔画像の大きなデータセットの可用性に依存している。
近年の研究では、アイデンティティからポーズを離す方法が不十分であることが示されている。
本研究では,GAN発生器に3次元モーフィラブルモデルを組み込むことにより,野生画像から非線形テクスチャモデルを学習する。
これにより、新しい合成IDの生成と、アイデンティティを損なうことなくポーズ、照明、表現の操作が可能になります。
論文 参考訳(メタデータ) (2020-12-18T22:41:15Z) - Encoding Robustness to Image Style via Adversarial Feature Perturbations [72.81911076841408]
我々は、画像画素ではなく特徴統計を直接摂動することで、頑健なモデルを生成することで、敵の訓練に適応する。
提案手法であるAdvBN(Adversarial Batch Normalization)は,トレーニング中に最悪の機能摂動を発生させる単一ネットワーク層である。
論文 参考訳(メタデータ) (2020-09-18T17:52:34Z) - Camera On-boarding for Person Re-identification using Hypothesis
Transfer Learning [41.115022307850424]
仮説伝達学習を用いた人物再同定のための効率的なモデル適応手法を開発した。
提案手法は,知識を伝達するための複数の音源モデルの最適重み付け組合せを求めることにより,負の伝達効果を最小化する。
論文 参考訳(メタデータ) (2020-07-22T00:43:29Z) - CIAGAN: Conditional Identity Anonymization Generative Adversarial
Networks [12.20367903755194]
CIAGANは条件付き生成対向ネットワークに基づく画像およびビデオの匿名化モデルである。
このモデルでは,高品質な画像や映像を制作しながら,顔や身体の特徴を識別できる。
論文 参考訳(メタデータ) (2020-05-19T15:56:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。