論文の概要: AP-10K: A Benchmark for Animal Pose Estimation in the Wild
- arxiv url: http://arxiv.org/abs/2108.12617v1
- Date: Sat, 28 Aug 2021 10:23:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-31 14:42:59.312112
- Title: AP-10K: A Benchmark for Animal Pose Estimation in the Wild
- Title(参考訳): AP-10K:野生における動物行動推定のベンチマーク
- Authors: Hang Yu, Yufei Xu, Jing Zhang, Wei Zhao, Ziyu Guan, Dacheng Tao
- Abstract要約: 一般的な動物のポーズ推定のための,最初の大規模ベンチマークであるAP-10Kを提案する。
AP-10Kは動物23種と60種から収集・濾過された10,015枚からなる。
その結果、様々な動物種からの学習の精度と一般化能力の両面での優位性に関する実験的な証拠が得られた。
- 参考スコア(独自算出の注目度): 83.17759850662826
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate animal pose estimation is an essential step towards understanding
animal behavior, and can potentially benefit many downstream applications, such
as wildlife conservation. Previous works only focus on specific animals while
ignoring the diversity of animal species, limiting the generalization ability.
In this paper, we propose AP-10K, the first large-scale benchmark for general
animal pose estimation, to facilitate the research in animal pose estimation.
AP-10K consists of 10,015 images collected and filtered from 23 animal families
and 60 species following the taxonomic rank and high-quality keypoint
annotations labeled and checked manually. Based on AP-10K, we benchmark
representative pose estimation models on the following three tracks: (1)
supervised learning for animal pose estimation, (2) cross-domain transfer
learning from human pose estimation to animal pose estimation, and (3) intra-
and inter-family domain generalization for unseen animals. The experimental
results provide sound empirical evidence on the superiority of learning from
diverse animals species in terms of both accuracy and generalization ability.
It opens new directions for facilitating future research in animal pose
estimation. AP-10k is publicly available at
https://github.com/AlexTheBad/AP10K.
- Abstract(参考訳): 正確な動物のポーズ推定は動物の行動を理解するための重要なステップであり、野生生物保護のような下流の多くの応用に利益をもたらす可能性がある。
以前の研究は特定の動物にのみ焦点をあて、動物種の多様性を無視して一般化能力を制限する。
本稿では,動物ポーズ推定における研究を容易にするために,動物ポーズ推定のための最初の大規模ベンチマークであるAP-10Kを提案する。
AP-10Kは、23の動物科と60の種から収集・フィルタリングされた10,015の画像と、手動でラベル付けされた高品質なキーポイントアノテーションから構成されている。
ap-10kに基づいて,(1)動物のポーズ推定のための教師付き学習,(2)人的ポーズ推定から動物的ポーズ推定へのクロスドメイン・トランスファー学習,(3)目に見えない動物の家族内および家族間ドメインの一般化,の3つのトラックで代表的なポーズ推定モデルをベンチマークした。
実験結果は, 精度と一般化能力の両方の観点から, 多様な動物種からの学習の優位性に関する実験的な証拠を提供する。
動物のポーズ推定の将来の研究を促進するための新しい方向を開く。
AP-10kはhttps://github.com/AlexTheBad/AP10Kで公開されている。
関連論文リスト
- PoseBench: Benchmarking the Robustness of Pose Estimation Models under Corruptions [57.871692507044344]
ポース推定は、単眼画像を用いて人や動物の解剖学的キーポイントを正確に同定することを目的としている。
現在のモデルは一般的に、クリーンなデータに基づいてトレーニングされ、テストされる。
実世界の腐敗に対するポーズ推定モデルの堅牢性を評価するためのベンチマークであるPoseBenchを紹介する。
論文 参考訳(メタデータ) (2024-06-20T14:40:17Z) - APTv2: Benchmarking Animal Pose Estimation and Tracking with a
Large-scale Dataset and Beyond [27.50166679588048]
APTv2は動物のポーズ推定と追跡のための大規模ベンチマークのパイオニアである。
ビデオクリップは2,749本で、30種の動物から抽出・収集されている。
我々は,84,611種の動物インスタンスに対して高品質なキーポイントと追跡アノテーションを提供する。
論文 参考訳(メタデータ) (2023-12-25T04:49:49Z) - MammalNet: A Large-scale Video Benchmark for Mammal Recognition and
Behavior Understanding [38.3767550066302]
MammalNetは、哺乳類の分類誘導アノテーションとその共通の行動を含む大規模な動物行動データセットである。
計539時間の18Kビデオが含まれており、これは現存する最大の動物行動データセットの10倍の大きさだ。
MammalNet上では,標準動物と行動認識,合成低ショット動物と行動認識,行動検出の3つのベンチマークを作成した。
論文 参考訳(メタデータ) (2023-06-01T11:45:33Z) - CLAMP: Prompt-based Contrastive Learning for Connecting Language and
Animal Pose [70.59906971581192]
本稿では,言語とAniMal Poseを効果的に接続するための,新しいプロンプトベースのコントラスト学習手法を提案する。
CLAMPは、ネットワークトレーニング中にテキストプロンプトを動物のキーポイントに適応させることでギャップを埋めようとしている。
実験結果から, 教師付き, 少数ショット, ゼロショット設定下での最先端性能が得られた。
論文 参考訳(メタデータ) (2022-06-23T14:51:42Z) - APT-36K: A Large-scale Benchmark for Animal Pose Estimation and Tracking [77.87449881852062]
APT-36Kは動物のポーズ推定と追跡のための最初の大規模ベンチマークである。
このビデオは、30種の動物から収集・フィルタリングされた2,400のビデオクリップと、各ビデオの15フレームで構成されており、合計で36,000フレームとなっている。
我々は,(1)ドメイン内およびドメイン間移動学習環境下での単一フレームでの動物ポーズ推定,(2)未確認動物に対する種間ドメイン一般化テスト,(3)動物追跡による動物ポーズ推定の3つのモデルについて,いくつかの代表的モデルをベンチマークした。
論文 参考訳(メタデータ) (2022-06-12T07:18:36Z) - Animal Kingdom: A Large and Diverse Dataset for Animal Behavior
Understanding [4.606145900630665]
大規模で多様なデータセットであるAnimal Kingdomを作成し、複数の注釈付きタスクを提供します。
私たちのデータセットには、関連する動物行動セグメントをローカライズする50時間のアノテーション付きビデオが含まれています。
本研究では,未確認新種動物を用いた行動認識の一般的な特徴と特定の特徴を学習する協調行動認識(CARe)モデルを提案する。
論文 参考訳(メタデータ) (2022-04-18T02:05:15Z) - A Unified Framework for Domain Adaptive Pose Estimation [70.54942818742]
本稿では,ドメイン適応型ポーズ推定問題によく対応できる統一フレームワークを提案する。
提案手法は,ヒトのポーズ推定における既存のベースラインを最大4.5ポイント(pp),手ポーズ推定を最大7.4pp,動物ポーズ推定を最大4.8pp,羊3.3ppで上回る。
論文 参考訳(メタデータ) (2022-04-01T02:47:31Z) - Pose Recognition in the Wild: Animal pose estimation using Agglomerative
Clustering and Contrastive Learning [0.0]
我々は,複数の動物のポーズを非ラベルデータから認識できる新しいアーキテクチャを提案する。
私たちは、下層の解剖学ではなく、その視覚的行動に基づいて、動物の身体の部位を区別することができます。
論文 参考訳(メタデータ) (2021-11-16T07:00:31Z) - Transferring Dense Pose to Proximal Animal Classes [83.84439508978126]
より一般的な対象検出器やセグメンタなどと同様に、密集したポーズ認識に存在する知識を、他のクラスにおける密集したポーズ認識の問題に移すことが可能であることを示す。
我々は、人間と幾何学的に整合した新しい動物のためのDensePoseモデルを確立することでこれを行う。
また、クラスチンパンジーにDensePoseの方法でラベル付けされた2つのベンチマークデータセットを導入し、アプローチを評価するためにそれらを使用します。
論文 参考訳(メタデータ) (2020-02-28T21:43:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。