論文の概要: A Little Bit Attention Is All You Need for Person Re-Identification
- arxiv url: http://arxiv.org/abs/2302.14574v1
- Date: Tue, 28 Feb 2023 13:54:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-01 16:25:03.364657
- Title: A Little Bit Attention Is All You Need for Person Re-Identification
- Title(参考訳): 人の再識別に必要なのは、少しだけ注意が必要です。
- Authors: Markus Eisenbach, Jannik L\"ubberstedt, Dustin Aganian, Horst-Michael
Gross
- Abstract要約: 個人の再識別は、モバイルロボットが長期間にわたってユーザーを追跡する必要があるアプリケーションにおいて重要な役割を果たす。
モバイルロボット上でのディープラーニングに基づくリアルタイム特徴抽出は、計算資源が共有されている専用デバイス上で行われることが多い。
我々は,モバイルロボットアプリケーションでの利用を正当化するにははるかに高い推論コストが伴うことを示す。
- 参考スコア(独自算出の注目度): 10.458793007470515
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Person re-identification plays a key role in applications where a mobile
robot needs to track its users over a long period of time, even if they are
partially unobserved for some time, in order to follow them or be available on
demand. In this context, deep-learning based real-time feature extraction on a
mobile robot is often performed on special-purpose devices whose computational
resources are shared for multiple tasks. Therefore, the inference speed has to
be taken into account. In contrast, person re-identification is often improved
by architectural changes that come at the cost of significantly slowing down
inference. Attention blocks are one such example. We will show that some
well-performing attention blocks used in the state of the art are subject to
inference costs that are far too high to justify their use for mobile robotic
applications. As a consequence, we propose an attention block that only
slightly affects the inference speed while keeping up with much deeper networks
or more complex attention blocks in terms of re-identification accuracy. We
perform extensive neural architecture search to derive rules at which locations
this attention block should be integrated into the architecture in order to
achieve the best trade-off between speed and accuracy. Finally, we confirm that
the best performing configuration on a re-identification benchmark also
performs well on an indoor robotic dataset.
- Abstract(参考訳): 個人の再識別は、移動ロボットが長期間にわたってユーザーを追跡する必要があるアプリケーションにおいて重要な役割を担っている。
この文脈では,複数のタスクに対して計算資源を共有できる専用デバイス上で,モバイルロボットのディープラーニングに基づくリアルタイム特徴抽出を行うことが多い。
したがって、推論速度を考慮する必要がある。
対照的に、人の再識別は、推論を著しく遅くするコストがかかるアーキテクチャの変更によって改善されることが多い。
注意ブロックはそのような例である。
現状で使われている注意ブロックのいくつかは、モバイルロボットアプリケーションでの使用を正当化するにはあまりにも高い推論コストがかかっていることを示します。
その結果,再同定精度の面では,より深いネットワークやより複雑な注意ブロックに追随しながら,推論速度にわずかに影響する注意ブロックを提案する。
我々は、この注意ブロックをアーキテクチャに組み込むべき場所のルールを導出するために、広範囲のニューラルアーキテクチャ探索を行い、速度と精度の最良のトレードオフを達成する。
最後に、再識別ベンチマークにおける最適な構成が屋内ロボットデータセット上でも良好であることを確認した。
関連論文リスト
- Tiny Robotics Dataset and Benchmark for Continual Object Detection [6.4036245876073234]
本研究は,小型ロボットプラットフォームにおける物体検出システムの連続学習能力を評価するための新しいベンチマークを導入する。
i)TiROD(Tiny Robotics Object Detection)は、小さな移動ロボットを用いて収集された包括的なデータセットで、さまざまなドメインやクラスにわたるオブジェクト検出の適応性をテストするように設計されている。
論文 参考訳(メタデータ) (2024-09-24T16:21:27Z) - Robust Collaborative Perception without External Localization and Clock Devices [52.32342059286222]
複数のエージェントをまたいだ一貫した空間的時間的調整は、協調的な知覚の基礎である。
従来の手法は、ローカライゼーションとクロック信号を提供するために外部デバイスに依存している。
本稿では,様々なエージェントの知覚データに内在する幾何学的パターンを認識して整列する手法を提案する。
論文 参考訳(メタデータ) (2024-05-05T15:20:36Z) - PNAS-MOT: Multi-Modal Object Tracking with Pareto Neural Architecture Search [64.28335667655129]
複数の物体追跡は、自律運転において重要な課題である。
トラッキングの精度が向上するにつれて、ニューラルネットワークはますます複雑になり、レイテンシが高いため、実際の運転シナリオにおける実践的な応用に課題が生じる。
本稿では,ニューラル・アーキテクチャ・サーチ(NAS)手法を用いて追跡のための効率的なアーキテクチャを探索し,比較的高い精度を維持しつつ,低リアルタイム遅延を実現することを目的とした。
論文 参考訳(メタデータ) (2024-03-23T04:18:49Z) - Faster Attention Is What You Need: A Fast Self-Attention Neural Network
Backbone Architecture for the Edge via Double-Condensing Attention Condensers [71.40595908386477]
本稿では,2重対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向
結果のバックボーン(AttendNeXtと呼ぶ)は、組み込みARMプロセッサ上で大幅に高い推論スループットを実現する。
これらの有望な結果は、さまざまな効率的なアーキテクチャ設計と自己アテンション機構の探索が、TinyMLアプリケーションのための興味深い新しいビルディングブロックにつながることを実証している。
論文 参考訳(メタデータ) (2022-08-15T02:47:33Z) - Distortion-Aware Network Pruning and Feature Reuse for Real-time Video
Segmentation [49.17930380106643]
本稿では,リアルタイム視覚タスクのスキップ接続によるアーキテクチャの高速化を目的とした新しいフレームワークを提案する。
具体的には、各フレームの到着時に、前のフレームから特徴を変換し、特定の空間的ビンで再利用する。
次に、現在のフレームの領域におけるバックボーンネットワークの部分計算を行い、現在のフレームと前のフレームの時間差をキャプチャする。
論文 参考訳(メタデータ) (2022-06-20T07:20:02Z) - Scalable Vehicle Re-Identification via Self-Supervision [66.2562538902156]
自動車再同定は、都市規模の車両分析システムにおいて重要な要素の1つである。
車両再設計のための最先端のソリューションの多くは、既存のre-idベンチマークの精度向上に重点を置いており、計算の複雑さを無視することが多い。
推論時間に1つのネットワークのみを使用する自己教師型学習によって、シンプルで効果的なハイブリッドソリューションを提案する。
論文 参考訳(メタデータ) (2022-05-16T12:14:42Z) - YOLOpeds: Efficient Real-Time Single-Shot Pedestrian Detection for Smart
Camera Applications [2.588973722689844]
この研究は、スマートカメラアプリケーションにおけるディープラーニングに基づく歩行者検出の効率的な展開のために、精度と速度の良好なトレードオフを達成するという課題に対処する。
分離可能な畳み込みに基づいて計算効率の良いアーキテクチャを導入し、層間密結合とマルチスケール機能融合を提案する。
全体として、YOLOpedsは、既存のディープラーニングモデルよりも86%の速度で、毎秒30フレーム以上のリアルタイム持続的な操作を提供する。
論文 参考訳(メタデータ) (2020-07-27T09:50:11Z) - Real-Time Segmentation Networks should be Latency Aware [0.0]
「平均対合(mIoU)における平均対合(mIoU)の性能指標は、これらのネットワークがリアルタイムに運用する際の真の性能を推定するために必要な情報を完全には捉えていない。」
ネットワークが処理を完了したときの将来の入力フレームにマッチする将来の出力セグメンテーションマップを予測することを提案する。
論文 参考訳(メタデータ) (2020-04-06T11:41:31Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。