論文の概要: Learning landmark guided embeddings for animal re-identification
- arxiv url: http://arxiv.org/abs/2001.02801v1
- Date: Thu, 9 Jan 2020 01:31:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-13 04:58:57.851125
- Title: Learning landmark guided embeddings for animal re-identification
- Title(参考訳): 動物再同定のための学習用ランドマーク埋め込み
- Authors: Olga Moskvyak, Frederic Maire, Feras Dayoub and Mahsa Baktashmotlagh
- Abstract要約: 身体のランドマーク情報を明示的に活用して埋め込み学習を改善することを提案する。
ボディランドマークは、信頼性ヒートマップとしてCNNの入力に提供される。
提案手法を,大規模合成データセットと小型実データセットで評価した。
- 参考スコア(独自算出の注目度): 15.356786390476591
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Re-identification of individual animals in images can be ambiguous due to
subtle variations in body markings between different individuals and no
constraints on the poses of animals in the wild. Person re-identification is a
similar task and it has been approached with a deep convolutional neural
network (CNN) that learns discriminative embeddings for images of people.
However, learning discriminative features for an individual animal is more
challenging than for a person's appearance due to the relatively small size of
ecological datasets compared to labelled datasets of person's identities. We
propose to improve embedding learning by exploiting body landmarks information
explicitly. Body landmarks are provided to the input of a CNN as confidence
heatmaps that can be obtained from a separate body landmark predictor. The
model is encouraged to use heatmaps by learning an auxiliary task of
reconstructing input heatmaps. Body landmarks guide a feature extraction
network to learn the representation of a distinctive pattern and its position
on the body. We evaluate the proposed method on a large synthetic dataset and a
small real dataset. Our method outperforms the same model without body
landmarks input by 26% and 18% on the synthetic and the real datasets
respectively. The method is robust to noise in input coordinates and can
tolerate an error in coordinates up to 10% of the image size.
- Abstract(参考訳): 画像中の個々の動物の再識別は、異なる個体間の微妙な体格変化のため、野生の動物のポーズに制約がないため、曖昧である。
人物の再識別は類似のタスクであり、人の画像に対する識別的埋め込みを学習する深層畳み込みニューラルネットワーク(CNN)によってアプローチされてきた。
しかし, 個体の識別的特徴の学習は, 個体の身長のラベル付きデータセットと比較すると, 生態的データセットのサイズが比較的小さいため, 見た目よりも困難である。
身体のランドマーク情報を明示的に活用して埋め込み学習を改善することを提案する。
ボディランドマークは、別個のボディランドマーク予測器から得られる信頼ヒートマップとしてCNNの入力に提供される。
このモデルは、入力ヒートマップを再構築する補助的なタスクを学ぶことで、ヒートマップの使用を奨励する。
ボディランドマークは特徴抽出ネットワークを誘導し、識別されたパターンとそのボディ上の位置の表現を学ぶ。
提案手法は,大規模合成データセットと小型実データを用いて評価する。
本手法は, 合成データと実データで, ボディランドマークを26%, 18%の差で入力することなく, 同一モデルを上回る。
この方法は入力座標におけるノイズに対して堅牢であり、画像サイズの最大10%の座標における誤差を許容することができる。
関連論文リスト
- Universal Bovine Identification via Depth Data and Deep Metric Learning [1.6605913858547239]
本稿では,個別の牛を正確に識別する深度のみの深度学習システムを提案する。
群れの大きさの増大は、農場における牛と人間の比率を歪め、個人を手動で監視することがより困難になる。
そこで本研究では,市販の3Dカメラの深度データを用いた牛の識別のための深度学習手法を提案する。
論文 参考訳(メタデータ) (2024-03-29T22:03:53Z) - Learning 3D Human Pose Estimation from Dozens of Datasets using a
Geometry-Aware Autoencoder to Bridge Between Skeleton Formats [80.12253291709673]
本稿では,アフィン結合型オートエンコーダ(ACAE)法を提案する。
このアプローチは、28人の人間のポーズデータセットを使って1つのモデルを監督する、極端なマルチデータセット体制にスケールします。
論文 参考訳(メタデータ) (2022-12-29T22:22:49Z) - Body Part-Based Representation Learning for Occluded Person
Re-Identification [102.27216744301356]
隠蔽人物再識別(ReID)とは,隠蔽人物画像と包括的人物画像とのマッチングを目的とした人物検索タスクである。
パートベースの手法は、微細な情報を提供し、部分的に見える人間の体を表現するのに適しているため、有益であることが示されている。
本稿では,BPBreIDという身体部分に基づくReIDモデルを提案する。
論文 参考訳(メタデータ) (2022-11-07T16:48:41Z) - PGGANet: Pose Guided Graph Attention Network for Person
Re-identification [0.0]
人物再識別(ReID)は、異なるカメラで撮影された画像から人物を回収することを目的としている。
局所的な特徴と人像のグローバルな特徴を併用することで、人物の検索に堅牢な特徴表現を与えることができることが証明されている。
本研究では,ポーズガイド付きグラフアテンションネットワーク,グローバル機能のための1つのブランチ,中粒体機能のための1つのブランチ,粒状キーポイント機能のための1つのブランチからなるマルチブランチアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-11-29T09:47:39Z) - Keypoint Message Passing for Video-based Person Re-Identification [106.41022426556776]
ビデオベースの人物再識別(re-ID)は、異なるカメラで捉えた人々のビデオスニペットをマッチングすることを目的とした、視覚監視システムにおいて重要な技術である。
既存の手法は主に畳み込みニューラルネットワーク(CNN)に基づいており、そのビルディングブロックは近隣のピクセルを一度に処理するか、あるいは3D畳み込みが時間情報のモデル化に使用される場合、人の動きによって生じるミスアライメントの問題に悩まされる。
本稿では,人間指向グラフ法を用いて,通常の畳み込みの限界を克服することを提案する。具体的には,人手指のキーポイントに位置する特徴を抽出し,時空間グラフとして接続する。
論文 参考訳(メタデータ) (2021-11-16T08:01:16Z) - Pose Recognition in the Wild: Animal pose estimation using Agglomerative
Clustering and Contrastive Learning [0.0]
我々は,複数の動物のポーズを非ラベルデータから認識できる新しいアーキテクチャを提案する。
私たちは、下層の解剖学ではなく、その視覚的行動に基づいて、動物の身体の部位を区別することができます。
論文 参考訳(メタデータ) (2021-11-16T07:00:31Z) - 3D Convolution Neural Network based Person Identification using Gait
cycles [0.0]
この研究では、歩行の特徴を個人を特定するために使用される。このステップには、物体の検出、背景の抽出、シルエット抽出、骨格化、これらの歩行の特徴に関する3D畳み込みニューラルネットワークのトレーニングが含まれる。
提案法は, 膝と大腿の角度, 股関節角度, 接触角度などの特徴を抽出するために, 下肢に焦点をあてる。
論文 参考訳(メタデータ) (2021-06-06T14:27:06Z) - Pretrained equivariant features improve unsupervised landmark discovery [69.02115180674885]
我々は、この課題を克服する2段階の教師なしアプローチを、強力なピクセルベースの特徴を初めて学習することによって定式化する。
本手法は,いくつかの難解なランドマーク検出データセットにおいて最先端の結果を生成する。
論文 参考訳(メタデータ) (2021-04-07T05:42:11Z) - Hidden Footprints: Learning Contextual Walkability from 3D Human Trails [70.01257397390361]
現在のデータセットは、人々がどこにいるか、どこにいるかを教えてくれません。
まず、画像間で人の観察を伝播させ、3D情報を利用して、私たちが「隠れ足跡」と呼ぶものを作成することで、有効なラベル付き歩行可能領域の集合を拡大する。
このようなスパースラベルのために設計されたトレーニング戦略を考案し、クラスバランスの分類損失と文脈逆転損失を組み合わせた。
論文 参考訳(メタデータ) (2020-08-19T23:19:08Z) - Whole-Body Human Pose Estimation in the Wild [88.09875133989155]
COCO-WholeBodyは、全体アノテーションでCOCOデータセットを拡張する。
これは人体全体に手動のアノテーションがある最初のベンチマークである。
ZoomNetという名前のシングルネットワークモデルは、完全な人体の階層構造を考慮するために考案された。
論文 参考訳(メタデータ) (2020-07-23T08:35:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。