論文の概要: Nighttime Person Re-Identification via Collaborative Enhancement Network
with Multi-domain Learning
- arxiv url: http://arxiv.org/abs/2312.16246v1
- Date: Mon, 25 Dec 2023 12:19:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-29 20:33:33.417275
- Title: Nighttime Person Re-Identification via Collaborative Enhancement Network
with Multi-domain Learning
- Title(参考訳): マルチドメイン学習を用いた協調強化ネットワークによる夜間人物再同定
- Authors: Andong Lu, Tianrui Zha, Chenglong Li, Jin Tang, Xiaofeng Wang, Bin Luo
- Abstract要約: 本稿では,並列フレームワークにおけるマルチレベル機能インタラクションを行うCENetという新しい協調型拡張ネットワークを提案する。
特にCENetは並列トランスフォーマーネットワークであり、設計された並列構造は、ライティング画像の品質がReID性能に与える影響を避けることができる。
- 参考スコア(独自算出の注目度): 25.569388978241495
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Prevalent nighttime ReID methods typically combine relighting networks and
ReID networks in a sequential manner, which not only restricts the ReID
performance by the quality of relighting images, but also neglects the
effective collaborative modeling between image relighting and person ReID
tasks. To handle these problems, we propose a novel Collaborative Enhancement
Network called CENet, which performs the multilevel feature interactions in a
parallel framework, for nighttime person ReID. In particular, CENet is a
parallel Transformer network, in which the designed parallel structure can
avoid the impact of the quality of relighting images on ReID performance. To
perform effective collaborative modeling between image relighting and person
ReID tasks, we integrate the multilevel feature interactions in CENet.
Specifically, we share the Transformer encoder to build the low-level feature
interaction, and then perform the feature distillation to transfer the
high-level features from image relighting to ReID. In addition, the sizes of
existing real-world nighttime person ReID datasets are small, and large-scale
synthetic ones exhibit substantial domain gaps with real-world data. To
leverage both small-scale real-world and large-scale synthetic training data,
we develop a multi-domain learning algorithm, which alternately utilizes both
kinds of data to reduce the inter-domain difference in the training of CENet.
Extensive experiments on two real nighttime datasets, \textit{Night600} and
\textit{RGBNT201$_{rgb}$}, and a synthetic nighttime ReID dataset are conducted
to validate the effectiveness of CENet. We will release the code and synthetic
dataset.
- Abstract(参考訳): 典型的な夜間ReID法は、リライトネットワークとReIDネットワークを逐次的に組み合わせて、リライト画像の品質によってReID性能を制限するだけでなく、画像リライトと人物ReIDタスク間の効果的な協調モデリングを無視する。
これらの問題に対処するため、夜間のReIDのための並列フレームワークでマルチレベル機能インタラクションを行うCENetと呼ばれる新しい協調型拡張ネットワークを提案する。
特にCENetは並列トランスフォーマーネットワークであり、設計された並列構造は、ライティング画像の品質がReID性能に与える影響を避けることができる。
画像リライトと人物ReIDタスクの効果的な協調モデリングを実現するため,CENetに多層特徴相互作用を統合する。
具体的には、低レベルの特徴相互作用を構築するためにトランスコーダを共有し、その特徴蒸留を行い、高レベルの特徴を画像のリライトからreidに転送する。
さらに、実世界の夜間人物ReIDデータセットのサイズは小さく、大規模な合成データセットは、実世界のデータとかなりのドメインギャップを示す。
実世界と大規模総合訓練データの両方を活用するために,両種類のデータを交互に活用し,cenetの訓練におけるドメイン間差を低減するマルチドメイン学習アルゴリズムを開発した。
CENetの有効性を検証するために,2つの実夜間データセット, \textit{Night600} と \textit{RGBNT201$_{rgb}$} と合成夜間ReIDデータセットの大規模な実験を行った。
コードと合成データセットをリリースします。
関連論文リスト
- Specularity Factorization for Low-Light Enhancement [2.7961648901433134]
本稿では,複数の潜伏成分からなる画像を扱う付加的な画像分解手法を提案する。
当社のモデル駆動型EM RSFNetは,最適化をネットワーク層に展開することで,これらの要因を推定する。
結果の因子は設計によって解釈可能であり、ネットワークを介して異なる画像強調タスクに融合したり、直接ユーザによって結合したりすることができる。
論文 参考訳(メタデータ) (2024-04-02T14:41:42Z) - Efficient Cloud-edge Collaborative Inference for Object
Re-identification [27.952445808987036]
我々は、ReIDシステムのためのクラウド-エッジ協調推論フレームワークを開拓した。
本稿では,クラウドサーバに所望の画像を返すために,分散対応相関モデルネットワーク(DaCM)を提案する。
DaCMは、タイムスタンプに暗黙的に含まれている空間的時間的相関関係をグラフ構造に埋め込んで、アップロードウィンドウのサイズを調整するためにクラウドに適用することができる。
論文 参考訳(メタデータ) (2024-01-04T02:56:50Z) - ViR: Towards Efficient Vision Retention Backbones [97.93707844681893]
視覚保持ネットワーク(ViR)と呼ばれる新しいコンピュータビジョンモデルを提案する。
ViRは並列および繰り返しの定式化を持ち、高速推論と並列トレーニングと競合性能の最適なバランスをとる。
我々は,様々なデータセットサイズと様々な画像解像度を用いた広範囲な実験により,ViRの有効性を検証した。
論文 参考訳(メタデータ) (2023-10-30T16:55:50Z) - Mutual Information-driven Triple Interaction Network for Efficient Image
Dehazing [54.168567276280505]
画像デハージングのための相互情報駆動型トリプルインタラクションネットワーク(MITNet)を提案する。
振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。
第2段階は位相誘導構造が洗練され、位相スペクトルの変換と微細化を学ぶことに尽力した。
論文 参考訳(メタデータ) (2023-08-14T08:23:58Z) - HALSIE: Hybrid Approach to Learning Segmentation by Simultaneously
Exploiting Image and Event Modalities [6.543272301133159]
イベントカメラは、非同期イベントストリームを生成するためにピクセルごとの強度の変化を検出する。
リアルタイム自律システムにおいて、正確なセマンティックマップ検索のための大きな可能性を秘めている。
イベントセグメンテーションの既存の実装は、サブベースのパフォーマンスに悩まされている。
本研究では,ハイブリット・エンド・エンド・エンドの学習フレームワークHALSIEを提案する。
論文 参考訳(メタデータ) (2022-11-19T17:09:50Z) - Lightweight Bimodal Network for Single-Image Super-Resolution via
Symmetric CNN and Recursive Transformer [27.51790638626891]
シングルイメージ・スーパーレゾリューション(SISR)は、ディープラーニングの開発において大きなブレークスルーを達成している。
そこで本研究では,SISRのための軽量バイモーダルネットワーク(LBNet)を提案する。
具体的には,局所特徴抽出と粗い画像再構成に有効なシンメトリCNNを設計する。
論文 参考訳(メタデータ) (2022-04-28T04:43:22Z) - FCL-GAN: A Lightweight and Real-Time Baseline for Unsupervised Blind
Image Deblurring [72.43250555622254]
本稿では,周波数領域の競合損失制約型軽量サイクルGANと呼ばれる,軽量でリアルタイムな非教師付きBIDベースラインを提案する。
FCL-GANは、画像領域制限がなく、画像解像度制限がなく、SOTAより25倍軽く、SOTAより5倍高速である。
いくつかの画像データセットの実験では、性能、モデルサイズ、参照時間の観点からFCL-GANの有効性が示されている。
論文 参考訳(メタデータ) (2022-04-16T15:08:03Z) - LEDNet: Joint Low-light Enhancement and Deblurring in the Dark [100.24389251273611]
共同低照度化とデブロアリングのための最初の大規模データセットを提示する。
LOL-Blurは12,000個の低ブルー/ノーマルシャープのペアを含み、異なるシナリオで様々な暗黒と動きのぼかしを持つ。
また,LEDNetと名付けられ,低照度化と劣化を両立させる有効なネットワークを提案する。
論文 参考訳(メタデータ) (2022-02-07T17:44:05Z) - Learning Deep Context-Sensitive Decomposition for Low-Light Image
Enhancement [58.72667941107544]
典型的なフレームワークは、照明と反射を同時に推定することであるが、特徴空間にカプセル化されたシーンレベルの文脈情報を無視する。
本研究では,空間スケールにおけるシーンレベルのコンテキスト依存を生かした,コンテキスト依存型分解ネットワークアーキテクチャを提案する。
チャネル数を減らして軽量なCSDNet(LiteCSDNet)を開発する。
論文 参考訳(メタデータ) (2021-12-09T06:25:30Z) - Multi-Stage Progressive Image Restoration [167.6852235432918]
本稿では、これらの競合する目標を最適にバランスできる新しい相乗的設計を提案する。
本提案では, 劣化した入力の復元関数を段階的に学習する多段階アーキテクチャを提案する。
MPRNetという名前の密接な相互接続型マルチステージアーキテクチャは、10のデータセットに対して強力なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2021-02-04T18:57:07Z) - Hybrid Backpropagation Parallel Reservoir Networks [8.944918753413827]
本稿では,貯水池のランダムな時間的特徴と深層ニューラルネットワークの読み出し能力と,バッチ正規化を併用した新しいハイブリッドネットワークを提案する。
我々の新しいネットワークはLSTMやGRUよりも優れていることを示す。
また, HBP-ESN M-Ring と呼ばれる新しいメタリング構造を組み込むことで, 1つの大きな貯水池に類似した性能を実現し, メモリ容量の最大化を図っている。
論文 参考訳(メタデータ) (2020-10-27T21:03:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。