論文の概要: Person Re-identification: Implicitly Defining the Receptive Fields of
Deep Learning Classification Frameworks
- arxiv url: http://arxiv.org/abs/2001.11267v4
- Date: Thu, 2 Jul 2020 19:59:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 11:38:30.052549
- Title: Person Re-identification: Implicitly Defining the Receptive Fields of
Deep Learning Classification Frameworks
- Title(参考訳): 人物再同定:深層学習分類フレームワークの受容領域を暗黙的に定義する
- Authors: Ehsan Yaghoubi, Diana Borza, Aruna Kumar, Hugo Proen\c{c}a
- Abstract要約: 本稿では,ネットワークの受容領域の推論を暗黙的に駆動する手法について述べる。
セグメンテーションモジュールを使用して、各学習インスタンスの前景(重要)/バックグラウンド(無関係)を区別します。
この戦略は典型的にネットワークを早期収束と適切な解へと駆り立て、アイデンティティと記述は相関しない。
- 参考スコア(独自算出の注目度): 5.123298347655088
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The \emph{receptive fields} of deep learning classification models determine
the regions of the input data that have the most significance for providing
correct decisions. The primary way to learn such receptive fields is to train
the models upon masked data, which helps the networks to ignore any unwanted
regions, but has two major drawbacks: 1) it often yields edge-sensitive
decision processes; and 2) augments the computational cost of the inference
phase considerably. This paper describes a solution for implicitly driving the
inference of the networks' receptive fields, by creating synthetic learning
data composed of interchanged segments that should be \emph{apriori}
important/irrelevant for the network decision. In practice, we use a
segmentation module to distinguish between the foreground
(important)/background (irrelevant) parts of each learning instance, and
randomly swap segments between image pairs, while keeping the class label
exclusively consistent with the label of the deemed important segments. This
strategy typically drives the networks to early convergence and appropriate
solutions, where the identity and clutter descriptions are not correlated.
Moreover, this data augmentation solution has various interesting properties:
1) it is parameter-free; 2) it fully preserves the label information; and, 3)
it is compatible with the typical data augmentation techniques. In the
empirical validation, we considered the person re-identification problem and
evaluated the effectiveness of the proposed solution in the well-known
\emph{Richly Annotated Pedestrian} (RAP) dataset for two different settings
(\emph{upper-body} and \emph{full-body}), observing highly competitive results
over the state-of-the-art. Under a reproducible research paradigm, both the
code and the empirical evaluation protocol are available at
\url{https://github.com/Ehsan-Yaghoubi/reid-strong-baseline}.
- Abstract(参考訳): ディープラーニング分類モデルの \emph{receptive fields} は、正しい判断を提供する上で最も重要な入力データの領域を決定する。
このような受容的フィールドを学ぶ一番の方法は、マスクされたデータに基づいてモデルをトレーニングすることであり、ネットワークが望ましくない領域を無視するのに役立つが、2つの大きな欠点がある。
1) しばしばエッジに敏感な意思決定プロセスをもたらします。
2) 推論フェーズの計算コストを大幅に増加させる。
本稿では,ネットワーク決定に重要な/無関係な,交換セグメントからなる合成学習データを作成することにより,ネットワークの受容領域の推論を暗黙的に駆動する解について述べる。
実際には,各学習インスタンスの前景/背景(重要でない)部分を区別するためにセグメンテーションモジュールを使用し,画像ペア間のセグメントをランダムにスワップし,クラスラベルを重要セグメントのラベルに排他的に一致させる。
この戦略は典型的にネットワークを早期収束と適切な解へと駆り立てるが、そこではアイデンティティと乱雑な記述は相関しない。
さらに、このデータ拡張ソリューションには様々な興味深い特性がある。
1) パラメータフリーである。
2) ラベル情報を完全に保存し,かつ
3) 典型的なデータ拡張技術と互換性がある。
実証的検証では,提案手法の有効性を2つの異なる設定 (\emph{upper-body} と \emph{full-body}) で検証し,最先端技術に対する高い競争力のある結果が得られた。
再現可能な研究パラダイムの下で、コードと経験的評価プロトコルは \url{https://github.com/Ehsan-Yaghoubi/reid-strong-baseline} で利用可能である。
関連論文リスト
- ContextSeg: Sketch Semantic Segmentation by Querying the Context with Attention [7.783971241874388]
本稿では、この問題を2段階に分けて扱うための、シンプルかつ高効率なアプローチであるContextSegについて述べる。
第1段階では、ストロークの形状と位置情報をよりよく符号化するために、オートエンコーダネットワークにおける余分な密度距離場を予測することを提案する。
第2段階では、全ストロークを単一のエンティティとして扱い、デフォルトのアテンション機構を備えた自動回帰変換器を用いて、同じ意味部分内でストロークのグループをラベル付けする。
論文 参考訳(メタデータ) (2023-11-28T10:53:55Z) - DecoupleNet: Decoupled Network for Domain Adaptive Semantic Segmentation [78.30720731968135]
セマンティックセグメンテーションにおける教師なしドメイン適応は、高価なピクセル単位のアノテーションへの依存を軽減するために提起されている。
我々は、ソースドメインのオーバーフィットを軽減し、最終的なモデルをセグメント化タスクに集中できるようにするDecoupleNetを提案する。
我々はまた、自己識別(SD)を推進し、擬似ラベルでより識別可能なターゲットドメイン特徴を学習するための補助分類器を導入した。
論文 参考訳(メタデータ) (2022-07-20T15:47:34Z) - Domain Adaptive Semantic Segmentation without Source Data [50.18389578589789]
モデルがソースドメイン上で事前学習されていることを前提として、ソースデータのないドメイン適応セマンティックセマンティックセマンティックセマンティクスについて検討する。
本稿では,この課題に対して,肯定的学習と否定的学習という2つの要素を用いた効果的な枠組みを提案する。
私たちのフレームワークは、パフォーマンスをさらに向上するために、他のメソッドに簡単に実装および組み込むことができます。
論文 参考訳(メタデータ) (2021-10-13T04:12:27Z) - DomainMix: Learning Generalizable Person Re-Identification Without Human
Annotations [89.78473564527688]
本稿では,ラベル付き合成データセットとラベル付き実世界のデータセットを用いてユニバーサルモデルをトレーニングする方法を示す。
このように、人間のアノテーションはもはや不要であり、大規模で多様な現実世界のデータセットにスケーラブルである。
実験結果から,提案手法は完全な人間のアノテーションで訓練されたアノテーションとほぼ同等であることがわかった。
論文 参考訳(メタデータ) (2020-11-24T08:15:53Z) - i-Mix: A Domain-Agnostic Strategy for Contrastive Representation
Learning [117.63815437385321]
対照的な表現学習を改善するために, 単純で効果的なドメインに依存しない正規化戦略i-Mixを提案する。
実験では、i-Mixはドメイン間の学習表現の質を一貫して改善することを示した。
論文 参考訳(メタデータ) (2020-10-17T23:32:26Z) - Semi-supervised Collaborative Filtering by Text-enhanced Domain
Adaptation [32.93934837792708]
半教師付き学習課題として、疎い暗黙のフィードバックを推奨する問題を考察する。
もっとも難しいケースにフォーカスします -- ユーザや項目の重複はありません。
我々は、潜在空間を整列させるためにアンカーポイントとして、ドメイン不変のテキスト特徴を採用する。
論文 参考訳(メタデータ) (2020-06-28T05:28:05Z) - Attentive WaveBlock: Complementarity-enhanced Mutual Networks for
Unsupervised Domain Adaptation in Person Re-identification and Beyond [97.25179345878443]
本稿では,新しい軽量モジュールであるAttentive WaveBlock (AWB)を提案する。
AWBは相互学習の二重ネットワークに統合され、相互学習の相補性を高め、擬似ラベルのノイズをさらに抑えることができる。
実験により, 提案手法は, 複数のUDA人物再識別タスクを大幅に改善し, 最先端の性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-06-11T15:40:40Z) - Phase Consistent Ecological Domain Adaptation [76.75730500201536]
意味的セグメンテーション(意味的セグメンテーション)の課題に焦点をあてる。そこでは、注釈付き合成データが多用されるが、実際のデータへのアノテートは困難である。
視覚心理学に触発された最初の基準は、2つの画像領域間の地図が位相保存であることである。
第2の基準は、照明剤や撮像センサーの特性に関わらず、その画像に現れる環境統計、またはシーン内の規則を活用することを目的としている。
論文 参考訳(メタデータ) (2020-04-10T06:58:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。