論文の概要: Pose Recognition in the Wild: Animal pose estimation using Agglomerative
Clustering and Contrastive Learning
- arxiv url: http://arxiv.org/abs/2111.08259v1
- Date: Tue, 16 Nov 2021 07:00:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-18 01:55:04.106456
- Title: Pose Recognition in the Wild: Animal pose estimation using Agglomerative
Clustering and Contrastive Learning
- Title(参考訳): 野生におけるポス認識:アグロメリッククラスタリングとコントラスト学習を用いた動物ポーズ推定
- Authors: Samayan Bhattacharya, Sk Shahnawaz
- Abstract要約: 我々は,複数の動物のポーズを非ラベルデータから認識できる新しいアーキテクチャを提案する。
私たちは、下層の解剖学ではなく、その視覚的行動に基づいて、動物の身体の部位を区別することができます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Animal pose estimation has recently come into the limelight due to its
application in biology, zoology, and aquaculture. Deep learning methods have
effectively been applied to human pose estimation. However, the major
bottleneck to the application of these methods to animal pose estimation is the
unavailability of sufficient quantities of labeled data. Though there are ample
quantities of unlabelled data publicly available, it is economically
impractical to label large quantities of data for each animal. In addition, due
to the wide variety of body shapes in the animal kingdom, the transfer of
knowledge across domains is ineffective. Given the fact that the human brain is
able to recognize animal pose without requiring large amounts of labeled data,
it is only reasonable that we exploit unsupervised learning to tackle the
problem of animal pose recognition from the available, unlabelled data. In this
paper, we introduce a novel architecture that is able to recognize the pose of
multiple animals fromunlabelled data. We do this by (1) removing background
information from each image and employing an edge detection algorithm on the
body of the animal, (2) Tracking motion of the edge pixels and performing
agglomerative clustering to segment body parts, (3) employing contrastive
learning to discourage grouping of distant body parts together. Hence we are
able to distinguish between body parts of the animal, based on their visual
behavior, instead of the underlying anatomy. Thus, we are able to achieve a
more effective classification of the data than their human-labeled
counterparts. We test our model on the TigDog and WLD (WildLife Documentary)
datasets, where we outperform state-of-the-art approaches by a significant
margin. We also study the performance of our model on other public data to
demonstrate the generalization ability of our model.
- Abstract(参考訳): 動物のポーズ推定は最近、生物学、動物学、養殖に応用されているため、石灰化している。
深層学習法は人間のポーズ推定に効果的に適用されている。
しかし、動物ポーズ推定へのこれらの手法の適用における大きなボトルネックは、十分な量のラベル付きデータの利用不可能である。
一般公開されているデータの量は少ないが、動物ごとに大量のデータをラベル付けすることは経済的には不可能である。
また、動物界では体形が多様であるため、ドメイン間での知識の移動は非効率である。
人間の脳が大量のラベル付きデータを必要とせずに動物のポーズを認識できるという事実を考えると、動物ポーズ認識の問題に対処するために教師なし学習を利用することは理にかなっている。
本稿では,複数の動物のポーズを非競合データから認識できる新しいアーキテクチャを提案する。
我々は,(1)画像から背景情報を除去し,動物体にエッジ検出アルゴリズムを用いて,(2)エッジピクセルのトラッキング動作と,(3)身体部分の集合的クラスタリングを行い,(3)遠方部分の集団化を阻止するコントラスト学習を利用する。
したがって、基礎となる解剖学ではなく、動物の視覚行動に基づいて、動物の身体部位を区別することができる。
したがって、人間のラベルが付けられたデータよりも、より効果的なデータの分類が達成できる。
我々は、TigDogとWLD(WildLife Documentary)データセットでモデルをテストする。
また,モデルの性能を他の公開データで検証し,モデルの一般化能力を示す。
関連論文リスト
- PoseBench: Benchmarking the Robustness of Pose Estimation Models under Corruptions [57.871692507044344]
ポース推定は、単眼画像を用いて人や動物の解剖学的キーポイントを正確に同定することを目的としている。
現在のモデルは一般的に、クリーンなデータに基づいてトレーニングされ、テストされる。
実世界の腐敗に対するポーズ推定モデルの堅牢性を評価するためのベンチマークであるPoseBenchを紹介する。
論文 参考訳(メタデータ) (2024-06-20T14:40:17Z) - Multimodal Foundation Models for Zero-shot Animal Species Recognition in
Camera Trap Images [57.96659470133514]
モーションアクティベートカメラトラップは、世界中の野生生物を追跡・監視するための効率的なツールである。
教師付き学習技術は、そのような画像を分析するためにうまく展開されているが、そのような訓練には専門家のアノテーションが必要である。
コストのかかるラベル付きデータへの依存を減らすことは、人間の労働力を大幅に減らした大規模野生生物追跡ソリューションを開発する上で、大きな可能性を秘めている。
論文 参考訳(メタデータ) (2023-11-02T08:32:00Z) - Of Mice and Pose: 2D Mouse Pose Estimation from Unlabelled Data and
Synthetic Prior [0.7499722271664145]
そこで本稿では, 合成合成経験的ポーズを用いた2次元マウスのポーズ推定手法を提案する。
本手法はマウスの四肢構造に適応し,合成3次元マウスモデルから2次元ポーズの経験的先行を生成できる。
新しいマウスビデオデータセットの実験では,ポーズ予測を手作業で得られた真実と比較することにより,提案手法の性能を評価する。
論文 参考訳(メタデータ) (2023-07-25T09:31:55Z) - Mine yOur owN Anatomy: Revisiting Medical Image Segmentation with Extremely Limited Labels [54.58539616385138]
我々は、Mine yOur owN Anatomy (MONA) と呼ばれる、新しい半教師付き2次元医用画像セグメンテーションフレームワークを紹介する。
まず、先行研究では、すべてのピクセルがモデルトレーニングに等しく重要であると論じており、我々はこの1つだけで意味のある解剖学的特徴を定義できないことを経験的に観察している。
第2に,医療画像を解剖学的特徴の集合に分解できるモデルを構築する。
論文 参考訳(メタデータ) (2022-09-27T15:50:31Z) - Prior-Aware Synthetic Data to the Rescue: Animal Pose Estimation with
Very Limited Real Data [18.06492246414256]
そこで本研究では,対象動物からの実際の画像のみを必要とする四足歩行におけるポーズ推定のためのデータ効率のよい戦略を提案する。
ImageNetのような一般的な画像データセットに事前トレーニングされた重み付きバックボーンネットワークを微調整することで、ターゲット動物のポーズデータに対する高い需要を軽減できることが確認された。
そこで我々はPASynと呼ばれる先行認識型合成動物データ生成パイプラインを導入し,ロバストポーズ推定に不可欠な動物のポーズデータを増やした。
論文 参考訳(メタデータ) (2022-08-30T01:17:50Z) - SyDog: A Synthetic Dog Dataset for Improved 2D Pose Estimation [3.411873646414169]
SyDogは、地面に真実のポーズとバウンディングボックス座標を含む犬の合成データセットである。
我々は、SyDogで訓練されたポーズ推定モデルが、実データで純粋に訓練されたモデルよりも優れたパフォーマンスを実現することを実証した。
論文 参考訳(メタデータ) (2021-07-31T14:34:40Z) - Unsupervised Shape and Pose Disentanglement for 3D Meshes [49.431680543840706]
本研究では,非教師付き環境において,非教師付き形状とポーズ表現を学習するための,シンプルで効果的なアプローチを提案する。
自己整合性と相互整合性の制約を組み合わせて、登録メッシュからポーズと空間の形状を学ぶ。
ポーズ転送や形状検索などのタスクを通じて,学習した表現の有用性を示す。
論文 参考訳(メタデータ) (2020-07-22T11:00:27Z) - Transferring Dense Pose to Proximal Animal Classes [83.84439508978126]
より一般的な対象検出器やセグメンタなどと同様に、密集したポーズ認識に存在する知識を、他のクラスにおける密集したポーズ認識の問題に移すことが可能であることを示す。
我々は、人間と幾何学的に整合した新しい動物のためのDensePoseモデルを確立することでこれを行う。
また、クラスチンパンジーにDensePoseの方法でラベル付けされた2つのベンチマークデータセットを導入し、アプローチを評価するためにそれらを使用します。
論文 参考訳(メタデータ) (2020-02-28T21:43:53Z) - Deformation-aware Unpaired Image Translation for Pose Estimation on
Laboratory Animals [56.65062746564091]
我々は,神経回路が行動をどのようにオーケストレーションするかを研究するために,手動による監督を使わずに,神経科学モデル生物のポーズを捉えることを目的としている。
我々の重要な貢献は、未完成の画像翻訳フレームワークにおける外観、形状、ポーズの明示的で独立したモデリングである。
ショウジョウバエ(ハエ)、線虫(線虫)、ダニオ・レリオ(ゼブラフィッシュ)のポーズ推定精度の向上を実証した。
論文 参考訳(メタデータ) (2020-01-23T15:34:11Z) - Learning landmark guided embeddings for animal re-identification [15.356786390476591]
身体のランドマーク情報を明示的に活用して埋め込み学習を改善することを提案する。
ボディランドマークは、信頼性ヒートマップとしてCNNの入力に提供される。
提案手法を,大規模合成データセットと小型実データセットで評価した。
論文 参考訳(メタデータ) (2020-01-09T01:31:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。