論文の概要: Panoptic animal pose estimators are zero-shot performers
- arxiv url: http://arxiv.org/abs/2203.07436v1
- Date: Mon, 14 Mar 2022 18:46:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-16 15:09:05.123557
- Title: Panoptic animal pose estimators are zero-shot performers
- Title(参考訳): 写真動物ポーズ推定器はゼロショットパフォーマーです
- Authors: Shaokai Ye and Alexander Mathis and Mackenzie Weygandt Mathis
- Abstract要約: SuperAnimal-modelは、データセットに分散したキーポイントを予測でき、ゼロショットのパフォーマンスが強い。
これらのモデルはImageNet-dモデルより優れている。
- 参考スコア(独自算出の注目度): 66.76373973868095
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Animal pose estimation is critical in applications ranging from life science
research, agriculture, to veterinary medicine. Compared to human pose
estimation, the performance of animal pose estimation is limited by the size of
available datasets and the generalization of a model across datasets. Typically
different keypoints are labeled regardless of whether the species are the same
or not, leaving animal pose datasets to have disjoint or partially overlapping
keypoints. As a consequence, a model cannot be used as a plug-and-play solution
across datasets. This reality motivates us to develop panoptic animal pose
estimation models that are able to predict keypoints defined in all datasets.
In this work we propose a simple yet effective way to merge differentially
labeled datasets to obtain the largest quadruped and lab mouse pose dataset.
Using a gradient masking technique, so called SuperAnimal-models are able to
predict keypoints that are distributed across datasets and exhibit strong
zero-shot performance. The models can be further improved by (pseudo) labeled
fine-tuning. These models outperform ImageNet-initialized models.
- Abstract(参考訳): 動物のポーズ推定は、生命科学研究、農業、獣医学など様々な応用において重要である。
ヒトのポーズ推定と比較して、動物ポーズ推定のパフォーマンスは利用可能なデータセットのサイズとデータセット間のモデルの一般化によって制限される。
通常、異なるキーポイントは、種が同じかどうかに関わらずラベル付けされ、動物のポーズデータセットは、キーポイントと不一致または部分的に重なり合う。
その結果、データセット間のプラグアンドプレイソリューションとしてモデルを使用することはできない。
この現実は、すべてのデータセットで定義されたキーポイントを予測できる、単眼動物ポーズ推定モデルを開発する動機となります。
本研究では, 微分ラベル付きデータセットをマージして, 最大四足歩行およびラボマウスポーズデータセットを得るための, 単純かつ効果的な手法を提案する。
勾配マスキング技術を使用することで、いわゆるSuperAnimal-modelは、データセットに分散したキーポイントを予測し、強力なゼロショットパフォーマンスを示すことができる。
モデルは(擬似)微調整によってさらに改善することができる。
これらのモデルは ImageNet-initialized モデルより優れている。
関連論文リスト
- A Model Generalization Study in Localizing Indoor Cows with COw LOcalization (COLO) dataset [0.0]
本研究は,牛肉検出用YOLOv8モデルとYOLOv9モデルの屋内フリーストール納屋環境における一般化能力について検討した。
1)照明条件やカメラアングルの変化によりモデル一般化が等しく影響を受けること,(2)高次モデル複雑性はより優れた一般化性能を保証すること,(3)関連するタスクで訓練されたカスタム初期重み付き微調整は検出タスクに常に利点をもたらすこと,の3つの主要な仮説を考察する。
論文 参考訳(メタデータ) (2024-07-29T18:49:58Z) - PoseBench: Benchmarking the Robustness of Pose Estimation Models under Corruptions [57.871692507044344]
ポース推定は、単眼画像を用いて人や動物の解剖学的キーポイントを正確に同定することを目的としている。
現在のモデルは一般的に、クリーンなデータに基づいてトレーニングされ、テストされる。
実世界の腐敗に対するポーズ推定モデルの堅牢性を評価するためのベンチマークであるPoseBenchを紹介する。
論文 参考訳(メタデータ) (2024-06-20T14:40:17Z) - From Forest to Zoo: Great Ape Behavior Recognition with ChimpBehave [0.0]
ChimpBehaveは動物園で飼育されているチンパンジーの2時間以上のビデオ(約193,000フレーム)を特徴とする新しいデータセットだ。
ChimpBehaveは、アクション認識のためのバウンディングボックスやビヘイビアラベルに細心の注意を払ってアノテートする。
我々は、最先端のCNNベースの行動認識モデルを用いてデータセットをベンチマークする。
論文 参考訳(メタデータ) (2024-05-30T13:11:08Z) - Model Selection with Model Zoo via Graph Learning [45.30615308692713]
本稿では,グラフ学習問題としてモデル選択を再構成する新しいフレームワークであるTransferGraphを紹介する。
我々は,TransferGraphが本質的なモデル-データセット関係を捕捉し,予測性能と実際の微調整結果との相関性を最大32%向上させる効果を,最先端の手法と比較した。
論文 参考訳(メタデータ) (2024-04-05T09:50:00Z) - Hyper-Representations for Pre-Training and Transfer Learning [2.9678808525128813]
我々は、生成的使用のためのハイパー表現を拡張して、事前学習として新しいモデルウェイトをサンプリングする。
以上の結果から, モデル動物園からハイパー表現による新しいモデルへの知識集約の可能性が示唆された。
論文 参考訳(メタデータ) (2022-07-22T09:01:21Z) - X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。
両世界の力を生かすために,我々は新しいX-モデルを提案する。
X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文 参考訳(メタデータ) (2021-10-09T13:56:48Z) - STAR: Sparse Transformer-based Action Recognition [61.490243467748314]
本研究は,空間的次元と時間的次元に細かな注意を払っている新しいスケルトンに基づく人間行動認識モデルを提案する。
実験により、トレーニング可能なパラメータをはるかに少なくし、トレーニングや推論の高速化を図りながら、モデルが同等のパフォーマンスを達成できることが示されている。
論文 参考訳(メタデータ) (2021-07-15T02:53:11Z) - Zoo-Tuning: Adaptive Transfer from a Zoo of Models [82.9120546160422]
Zoo-Tuningは、事前訓練されたモデルのパラメータをターゲットタスクに適応的に転送することを学ぶ。
我々は、強化学習、画像分類、顔のランドマーク検出など、様々なタスクに対するアプローチを評価した。
論文 参考訳(メタデータ) (2021-06-29T14:09:45Z) - Deformation-aware Unpaired Image Translation for Pose Estimation on
Laboratory Animals [56.65062746564091]
我々は,神経回路が行動をどのようにオーケストレーションするかを研究するために,手動による監督を使わずに,神経科学モデル生物のポーズを捉えることを目的としている。
我々の重要な貢献は、未完成の画像翻訳フレームワークにおける外観、形状、ポーズの明示的で独立したモデリングである。
ショウジョウバエ(ハエ)、線虫(線虫)、ダニオ・レリオ(ゼブラフィッシュ)のポーズ推定精度の向上を実証した。
論文 参考訳(メタデータ) (2020-01-23T15:34:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。