論文の概要: A Symbolic Temporal Pooling method for Video-based Person
Re-Identification
- arxiv url: http://arxiv.org/abs/2006.11416v1
- Date: Fri, 19 Jun 2020 21:52:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-19 05:00:00.999195
- Title: A Symbolic Temporal Pooling method for Video-based Person
Re-Identification
- Title(参考訳): ビデオに基づく人物再同定のための記号的時間プール法
- Authors: S V Aruna Kumar, Ehsan Yaghoubi and Hugo Proen\c{c}a
- Abstract要約: 映像に基づく人物再識別では、空間的特徴と時間的特徴の両方が効果的表現のための手がかりとして知られている。
本稿では,フレームレベルの特徴を分布値のシンボル形式で表現するシンボリック時間プーリング手法を提案する。
また、2つのシンボルオブジェクト間の類似性を推測する記号的三重項損失関数を導入する。
- 参考スコア(独自算出の注目度): 5.929956715430167
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In video-based person re-identification, both the spatial and temporal
features are known to provide orthogonal cues to effective representations.
Such representations are currently typically obtained by aggregating the
frame-level features using max/avg pooling, at different points of the models.
However, such operations also decrease the amount of discriminating information
available, which is particularly hazardous in case of poor separability between
the different classes. To alleviate this problem, this paper introduces a
symbolic temporal pooling method, where frame-level features are represented in
the distribution valued symbolic form, yielding from fitting an Empirical
Cumulative Distribution Function (ECDF) to each feature. Also, considering that
the original triplet loss formulation cannot be applied directly to this kind
of representations, we introduce a symbolic triplet loss function that infers
the similarity between two symbolic objects. Having carried out an extensive
empirical evaluation of the proposed solution against the state-of-the-art, in
four well known data sets (MARS, iLIDS-VID, PRID2011 and P-DESTRE), the
observed results point for consistent improvements in performance over the
previous best performing techniques.
- Abstract(参考訳): ビデオベースの人物再同定では、空間的特徴と時間的特徴の両方が効果的な表現に直交的手がかりを提供することが知られている。
このような表現は、一般的にはmax/avgプーリングを使用してフレームレベルの特徴をモデルの各点で集約することで得られる。
しかし、これらの操作は利用可能な識別情報の量も減少し、異なるクラス間の分離性が低い場合には特に危険である。
そこで本研究では,各特徴に経験的累積分布関数(ECDF)を組み込むことにより,フレームレベルの特徴を分布値のシンボル形式で表現する,シンボリック・テンポラル・プーリング手法を提案する。
また、元の三重項損失の定式化がこのような表現に直接適用できないことを考慮し、2つのシンボルオブジェクト間の類似性を推論する記号三重項損失関数を導入する。
4つのよく知られたデータセット (MARS, iLIDS-VID, PRID 2011, P-DESTRE) において, 提案手法の最先端に対する広範な実証評価を行った結果, 従来手法よりも一貫した性能向上が得られた。
関連論文リスト
- ChiroDiff: Modelling chirographic data with Diffusion Models [132.5223191478268]
チャーログラフィーデータのための強力なモデルクラスである「拡散確率モデル(Denoising Diffusion Probabilistic Models)」やDDPMを導入している。
我々のモデルは「ChiroDiff」と呼ばれ、非自己回帰的であり、全体論的概念を捉えることを学び、したがって高い時間的サンプリングレートに回復する。
論文 参考訳(メタデータ) (2023-04-07T15:17:48Z) - Score-based Continuous-time Discrete Diffusion Models [102.65769839899315]
連続時間マルコフ連鎖を介して逆過程が認知されるマルコフジャンププロセスを導入することにより、拡散モデルを離散変数に拡張する。
条件境界分布の単純なマッチングにより、偏りのない推定器が得られることを示す。
提案手法の有効性を,合成および実世界の音楽と画像のベンチマークで示す。
論文 参考訳(メタデータ) (2022-11-30T05:33:29Z) - Action Quality Assessment with Temporal Parsing Transformer [84.1272079121699]
行動品質評価(AQA)は、作業の理解と解決に重要である。
本稿では,時間的部分表現に包括的特徴を分解する時間的パーシング変換器を提案する。
提案手法は,3つの公開AQAベンチマークにおける先行研究よりもかなりのマージンで優れていた。
論文 参考訳(メタデータ) (2022-07-19T13:29:05Z) - Towards Robust and Adaptive Motion Forecasting: A Causal Representation
Perspective [72.55093886515824]
本稿では,3つの潜伏変数群からなる動的過程として,運動予測の因果的形式化を導入する。
我々は、因果グラフを近似するために、不変なメカニズムやスタイルの共創者の表現を分解するモジュラーアーキテクチャを考案する。
合成および実データを用いた実験結果から,提案した3つの成分は,学習した動き表現の頑健性と再利用性を大幅に向上することが示された。
論文 参考訳(メタデータ) (2021-11-29T18:59:09Z) - Spatio-Temporal Representation Factorization for Video-based Person
Re-Identification [55.01276167336187]
本稿では、re-IDのための時空間表現分解モジュール(STRF)を提案する。
STRFはフレキシブルな新しい計算ユニットであり、re-IDのための既存のほとんどの3D畳み込みニューラルネットワークアーキテクチャと併用することができる。
実験により、STRFは様々なベースラインアーキテクチャの性能を向上し、新しい最先端の成果を示す。
論文 参考訳(メタデータ) (2021-07-25T19:29:37Z) - Distribution Agnostic Symbolic Representations for Time Series
Dimensionality Reduction and Online Anomaly Detection [8.00114449574708]
本稿では,データ駆動型SAXに基づく2つのシンボル表現を提案する。
提案した表現は, 従来のSAX法の魅力を全て有している。
論文 参考訳(メタデータ) (2021-05-20T08:35:50Z) - Out-of-distribution Generalization via Partial Feature Decorrelation [72.96261704851683]
本稿では,特徴分解ネットワークと対象画像分類モデルとを協調的に最適化する,PFDL(Partial Feature Deorrelation Learning)アルゴリズムを提案する。
実世界のデータセットを用いた実験により,OOD画像分類データセットにおけるバックボーンモデルの精度が向上することを示した。
論文 参考訳(メタデータ) (2020-07-30T05:48:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。