論文の概要: Top-DB-Net: Top DropBlock for Activation Enhancement in Person
Re-Identification
- arxiv url: http://arxiv.org/abs/2010.05435v1
- Date: Mon, 12 Oct 2020 03:49:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 07:18:14.225277
- Title: Top-DB-Net: Top DropBlock for Activation Enhancement in Person
Re-Identification
- Title(参考訳): Top-DB-Net: 人物再同定におけるアクティベーション向上のためのTop DropBlock
- Authors: Rodolfo Quispe and Helio Pedrini
- Abstract要約: Person Re-Identificationは、重複しないカメラのシステム間でクエリイメージのすべてのインスタンスを検索することを目的とした、難しいタスクである。
本研究では,Top-DB-Net(Top-DB-Net)という,Top DropBlock(Top DropBlock)に基づく手法を紹介する。
- 参考スコア(独自算出の注目度): 0.30458514384586405
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Person Re-Identification is a challenging task that aims to retrieve all
instances of a query image across a system of non-overlapping cameras. Due to
the various extreme changes of view, it is common that local regions that could
be used to match people are suppressed, which leads to a scenario where
approaches have to evaluate the similarity of images based on less informative
regions. In this work, we introduce the Top-DB-Net, a method based on Top
DropBlock that pushes the network to learn to focus on the scene foreground,
with special emphasis on the most task-relevant regions and, at the same time,
encodes low informative regions to provide high discriminability. The
Top-DB-Net is composed of three streams: (i) a global stream encodes rich image
information from a backbone, (ii) the Top DropBlock stream encourages the
backbone to encode low informative regions with high discriminative features,
and (iii) a regularization stream helps to deal with the noise created by the
dropping process of the second stream, when testing the first two streams are
used. Vast experiments on three challenging datasets show the capabilities of
our approach against state-of-the-art methods. Qualitative results demonstrate
that our method exhibits better activation maps focusing on reliable parts of
the input images.
- Abstract(参考訳): Person Re-Identificationは、重複しないカメラのシステム間でクエリイメージのすべてのインスタンスを検索することを目的とした、難しいタスクである。
様々な極端な視点の変化から、人間に合わせるために使用できる地域が抑圧されることが一般的であり、より情報に乏しい地域に基づいて画像の類似性を評価するアプローチのシナリオに繋がる。
本稿では,トップドロップブロックに基づく手法であるtop-db-netについて紹介する。この手法は,ネットワークにシーンの前景に焦点を合わせるように促し,最もタスク対応領域を強調すると同時に,低情報領域をエンコードし,高い識別性を提供する。
Top-DB-Netは3つのストリームで構成されています。
(i)グローバルストリームは、バックボーンからリッチな画像情報をエンコードする。
(ii)Top DropBlockストリームは、高い識別特性を持つ低情報領域を符号化するようバックボーンに促す。
(iii) 正規化ストリームは、第1の2つのストリームをテストする際に、第2のストリームの落下プロセスによって発生するノイズに対処するのに役立つ。
3つの挑戦的なデータセットに対するVast実験は、最先端の手法に対する我々のアプローチの能力を示している。
定性的な結果から,本手法は入力画像の信頼性の高い部分に焦点を当てた活性化マップを示す。
関連論文リスト
- SceneGraphLoc: Cross-Modal Coarse Visual Localization on 3D Scene Graphs [81.2396059480232]
SceneGraphLocはシーングラフ内の各ノード(つまりオブジェクトインスタンスを表す)に対する固定サイズの埋め込みを学習する。
画像を利用する場合、SceneGraphLocは、大規模な画像データベースに依存する最先端技術に近いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-03-30T20:25:16Z) - Weakly-supervised deepfake localization in diffusion-generated images [4.548755617115687]
本稿では,Xception ネットワークをバックボーンアーキテクチャとして用いた弱教師付きローカライズ問題を提案する。
本研究では,(局所スコアに基づく)最良動作検出法は,データセットやジェネレータのミスマッチよりも,より緩やかな監視に敏感であることを示す。
論文 参考訳(メタデータ) (2023-11-08T10:27:36Z) - A Triplet-loss Dilated Residual Network for High-Resolution
Representation Learning in Image Retrieval [0.0]
ローカライゼーションなどのいくつかのアプリケーションでは、画像検索が最初のステップとして使用される。
本論文では,トレーニング可能なパラメータが少ない,単純かつ効率的な画像検索システムを提案する。
提案手法は三重項損失を有する拡張残差畳み込みニューラルネットワークの利点である。
論文 参考訳(メタデータ) (2023-03-15T07:01:44Z) - Unleash the Potential of Image Branch for Cross-modal 3D Object
Detection [67.94357336206136]
画像分岐のポテンシャルを2つの側面から解き放つことを目的として,新しい3Dオブジェクト検出器UPIDetを提案する。
まず、UPIDetは正規化された局所座標写像推定と呼ばれる新しい2次元補助タスクを導入する。
第2に,イメージブランチのトレーニング目標から逆転する勾配によって,ポイントクラウドバックボーンの表現能力を向上できることを見出した。
論文 参考訳(メタデータ) (2023-01-22T08:26:58Z) - Deep Convolutional Pooling Transformer for Deepfake Detection [54.10864860009834]
本研究では,局所的・グローバル的に決定的な画像特徴を取り入れた深部畳み込み変換器を提案する。
具体的には,抽出した特徴を充実させ,有効性を高めるために,畳み込みプーリングと再アテンションを適用した。
提案手法は、内部実験と相互データセット実験の両方において、最先端のベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2022-09-12T15:05:41Z) - LODE: Deep Local Deblurring and A New Benchmark [106.80269193462712]
我々はBLur-Aware Deblurring Network(BladeNet)と呼ばれる新しいフレームワークを提案する。
ローカルブラー合成モジュールは局所的にぼやけたトレーニングペアを生成し、ローカルブラー知覚モジュールは局所的にぼやけた領域を自動的に捕捉し、Blar-guided Space Attentionモジュールは遅延ネットワークを空間的注意でガイドする。
我々は,REDS と LODE データセットの広範な実験を行い,BladeNet がPSNR を 2.5dB で改善し,SotAs を局所的に改善し,グローバルデブロアに匹敵する性能を維持していることを示す。
論文 参考訳(メタデータ) (2021-09-19T15:57:28Z) - Continual Learning for Image-Based Camera Localization [14.47046413243358]
連続学習環境における視覚的局所化の問題について検討する。
以上の結果から,非定常データも分類領域と同様,深層ネットワークにおいて視覚的局所化のための破滅的な忘れを生じさせることが示された。
本稿では,バッファリングプロセスにおける既存のサンプリング戦略を視覚的ローカライゼーションの問題に適応させる,カバレッジスコア(Buff-CS)に基づく新しいサンプリング手法を提案する。
論文 参考訳(メタデータ) (2021-08-20T11:18:05Z) - Multi-attentional Deepfake Detection [79.80308897734491]
ディープフェイクによる顔の偽造はインターネットに広まり、深刻な社会的懸念を引き起こしている。
新たなマルチアテンテーショナルディープフェイク検出ネットワークを提案する。
具体的には,1)ネットワークを異なる局所的部分へ配置するための複数の空間的注意ヘッド,2)浅い特徴の微妙なアーティファクトをズームするテクスチャ的特徴拡張ブロック,3)低レベルなテクスチャ特徴と高レベルなセマンティクス特徴をアグリゲートする,の3つの構成要素からなる。
論文 参考訳(メタデータ) (2021-03-03T13:56:14Z) - Re-rank Coarse Classification with Local Region Enhanced Features for
Fine-Grained Image Recognition [22.83821575990778]
そこで我々は,Top1の精度を向上させるため,TopN分類結果を局所的に拡張した埋め込み機能を用いて再評価した。
より効果的なセマンティクスグローバル機能を学ぶために、我々は、自動構築された階層的カテゴリ構造上のマルチレベル損失をデザインする。
本手法は,cub-200-2011,stanford cars,fgvc aircraftの3つのベンチマークで最新性能を実現する。
論文 参考訳(メタデータ) (2021-02-19T11:30:25Z) - Cross-Descriptor Visual Localization and Mapping [81.16435356103133]
視覚のローカライゼーションとマッピングは、Mixed Realityとロボティクスシステムの大部分を支える重要な技術である。
特徴表現の連続的な更新を必要とする局所化とマッピングのための3つの新しいシナリオを提案する。
我々のデータ駆動型アプローチは特徴記述子型に非依存であり、計算要求が低く、記述アルゴリズムの数と線形にスケールする。
論文 参考訳(メタデータ) (2020-12-02T18:19:51Z) - MCW-Net: Single Image Deraining with Multi-level Connections and Wide
Regional Non-local Blocks [6.007222067550804]
降雨画像の背景テクスチャを復元するために,マルチレベル接続と広域非局所ブロックネットワーク(MCW-Net)を提案する。
MCW-Netは、追加ブランチなしで情報利用を最大化することで、性能を向上させる。
人工降雨データセットと実世界の降雨データセットの実験結果は、提案モデルが既存の最先端モデルを大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2020-09-29T13:21:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。