Fugu-MT 論文翻訳(概要): Transformer for Object Re-Identification: A Survey

論文の概要: Transformer for Object Re-Identification: A Survey

arxiv url: http://arxiv.org/abs/2401.06960v1
Date: Sat, 13 Jan 2024 03:17:57 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-17 20:31:56.034920
Title: Transformer for Object Re-Identification: A Survey
Title（参考訳）: 物体再同定用変圧器:調査
Authors: Mang Ye, Shuoyi Chen, Chenyue Li, Wei-Shi Zheng, David Crandall, Bo Du
Abstract要約: 本稿では、TransformerベースのRe-IDの総合的なレビューと詳細な分析を行う。教師なしRe-IDのトレンドを考えると,新しいトランスフォーマーベースラインUntransReIDを提案する。この調査は、動物Re-IDの進歩を含む、幅広いRe-ID研究対象についてもカバーしている。
参考スコア（独自算出の注目度）: 73.10634142016542
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Object Re-Identification (Re-ID) aims to identify and retrieve specific objects from varying viewpoints. For a prolonged period, this field has been predominantly driven by deep convolutional neural networks. In recent years, the Transformer has witnessed remarkable advancements in computer vision, prompting an increasing body of research to delve into the application of Transformer in Re-ID. This paper provides a comprehensive review and in-depth analysis of the Transformer-based Re-ID. In categorizing existing works into Image/Video-Based Re-ID, Re-ID with limited data/annotations, Cross-Modal Re-ID, and Special Re-ID Scenarios, we thoroughly elucidate the advantages demonstrated by the Transformer in addressing a multitude of challenges across these domains. Considering the trending unsupervised Re-ID, we propose a new Transformer baseline, UntransReID, achieving state-of-the-art performance on both single-/cross modal tasks. Besides, this survey also covers a wide range of Re-ID research objects, including progress in animal Re-ID. Given the diversity of species in animal Re-ID, we devise a standardized experimental benchmark and conduct extensive experiments to explore the applicability of Transformer for this task to facilitate future research. Finally, we discuss some important yet under-investigated open issues in the big foundation model era, we believe it will serve as a new handbook for researchers in this field.
Abstract（参考訳）: オブジェクト再識別(Re-ID)は、さまざまな視点から特定のオブジェクトを特定し、検索することを目的としている。長期にわたって、この領域は主に深い畳み込みニューラルネットワークによって駆動されてきた。近年、トランスフォーマーはコンピュータビジョンの著しい進歩を目の当たりにしており、Re-IDにおけるトランスフォーマーの応用について研究が進められている。本稿では、TransformerベースのRe-IDの総合的なレビューと詳細な分析を行う。 Image/Video-based Re-ID, Re-ID with limited data/annotations, Cross-Modal Re-ID, Special Re-ID Scenarios に分類する際には, Transformer がこれらの領域にまたがるさまざまな課題に対処する上でのメリットを徹底的に解明する。教師なしRe-IDの傾向を考慮し、シングル/クロスモードのタスクで最先端のパフォーマンスを実現するために、新しいトランスフォーマーベースラインUntransReIDを提案する。この調査は、動物Re-IDの進歩を含む幅広いRe-ID研究対象もカバーしている。動物リidの種多様性を考えると,標準化された実験ベンチマークを考案し,今後の研究を促進するためにトランスフォーマーの適用性を検討するために広範な実験を行う。最後に、大きな基盤モデル時代において、重要かつ未解明のオープンな問題について議論し、この分野の研究者のための新しいハンドブックとして役立つと信じている。

関連論文リスト

PAT++: a cautionary tale about generative visual augmentation for Object Re-identification [0.0]
オブジェクト再識別のためのアイデンティティ保存画像生成の有効性を評価する。その結果、ドメインシフトやアイデンティティ定義機能の維持に失敗するなど、一貫したパフォーマンス劣化が見られた。これらの知見は、生成モデルの微粒化認識タスクへの転送可能性に関する仮定に挑戦する。
論文参考訳（メタデータ） (2025-07-19T15:01:05Z)
Towards Global Localization using Multi-Modal Object-Instance Re-Identification [23.764646800085977]
マルチモーダルRGBと深度情報を統合した新しい再同定トランスフォーマアーキテクチャを提案する。照明条件が異なったり散らかったりしたシーンにおけるReIDの改善を実演する。また、正確なカメラのローカライゼーションを可能にするReIDベースのローカライゼーションフレームワークを開発し、異なる視点で識別を行う。
論文参考訳（メタデータ） (2024-09-18T14:15:10Z)
Other Tokens Matter: Exploring Global and Local Features of Vision Transformers for Object Re-Identification [63.147482497821166]
我々はまず,ViTのグローバルおよびローカルな特徴の影響を探求し,高性能オブジェクトRe-IDのための新しいグローバルローカ変換器(GLTrans)を提案する。提案手法は,4つのオブジェクトRe-IDベンチマークにおいて優れた性能を実現する。
論文参考訳（メタデータ） (2024-04-23T12:42:07Z)
A Comprehensive Survey on Applications of Transformers for Deep Learning Tasks [60.38369406877899]
Transformerは、シーケンシャルデータ内のコンテキスト関係を理解するために自己認識メカニズムを使用するディープニューラルネットワークである。 Transformerモデルは、入力シーケンス要素間の長い依存関係を処理し、並列処理を可能にする。我々の調査では、トランスフォーマーベースのモデルのためのトップ5のアプリケーションドメインを特定します。
論文参考訳（メタデータ） (2023-06-11T23:13:51Z)
Object Detection with Transformers: A Review [11.255962936937744]
本報告では, 従来のDETRモデルにおいて提案された21の進歩について概説する。我々は、様々な検出変換器の比較分析を行い、その性能とネットワークアーキテクチャを評価した。この研究は、既存の課題に対処し、オブジェクト検出領域におけるトランスフォーマーの適用を探求する研究者の間で、さらなる関心を喚起することを期待している。
論文参考訳（メタデータ） (2023-06-07T16:13:38Z)
Transformers in Medical Imaging: A Survey [88.03790310594533]
トランスフォーマーはいくつかのコンピュータビジョン問題に適用され、最先端の結果が得られた。医療画像はまた、局所受容野を持つCNNと比較して、グローバルな文脈を捉えられるトランスフォーマーへの関心が高まっている。本稿では,最近提案された建築設計から未解決問題に至るまで,医療画像におけるトランスフォーマーの応用について概説する。
論文参考訳（メタデータ） (2022-01-24T18:50:18Z)
HAT: Hierarchical Aggregation Transformers for Person Re-identification [87.02828084991062]
我々は,CNNとトランスフォーマーの両方の利点を,高性能な画像ベース人物Re-IDに適用する。作業は、画像ベースのRe-IDのためのCNNとTransformerの両方の利点を初めて活用する。
論文参考訳（メタデータ） (2021-07-13T09:34:54Z)
Spatiotemporal Transformer for Video-based Person Re-identification [102.58619642363958]
我々は、強い学習能力にもかかわらず、バニラトランスフォーマーは過剰フィットのリスクの増加に苦しむことを示しています。そこで本研究では,合成ビデオデータからモデルを事前学習し,下流領域に伝達する新しいパイプラインを提案する。提案アルゴリズムは,3つの人気ビデオベース人物識別ベンチマークにおいて,精度向上を実現する。
論文参考訳（メタデータ） (2021-03-30T16:19:27Z)
TransReID: Transformer-based Object Re-Identification [20.02035310635418]
Vision Transformer (ViT) は、オブジェクト再識別(ReID)タスクのための純粋なトランスフォーマーベースのモデルである。いくつかの適応により、強いベースラインのViT-BoTは、ViTをバックボーンとして構成される。本稿では、TransReIDと呼ばれる純粋なトランスフォーマーフレームワークを提案し、これはReID研究に純粋なトランスフォーマーを用いた最初の研究である。
論文参考訳（メタデータ） (2021-02-08T17:33:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。