論文の概要: Incremental Learning for Animal Pose Estimation using RBF k-DPP
- arxiv url: http://arxiv.org/abs/2110.13598v1
- Date: Tue, 26 Oct 2021 11:55:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-27 14:54:37.937123
- Title: Incremental Learning for Animal Pose Estimation using RBF k-DPP
- Title(参考訳): RBF k-DPPを用いた動物行動推定のためのインクリメンタルラーニング
- Authors: Gaurav Kumar Nayak, Het Shah, Anirban Chakraborty
- Abstract要約: 動物のポーズ推定は、動物における高いクラス間およびクラス内変動のため、人間のポーズよりも困難である。
このようなセットで訓練されたモデルは、通常、新しい動物カテゴリーではうまく機能しない。
動物ポッド推定のためのインクリメンタルラーニング」の新たな課題を提案する。
- 参考スコア(独自算出の注目度): 19.347558051611838
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pose estimation is the task of locating keypoints for an object of interest
in an image. Animal Pose estimation is more challenging than estimating human
pose due to high inter and intra class variability in animals. Existing works
solve this problem for a fixed set of predefined animal categories. Models
trained on such sets usually do not work well with new animal categories.
Retraining the model on new categories makes the model overfit and leads to
catastrophic forgetting. Thus, in this work, we propose a novel problem of
"Incremental Learning for Animal Pose Estimation". Our method uses an exemplar
memory, sampled using Determinantal Point Processes (DPP) to continually adapt
to new animal categories without forgetting the old ones. We further propose a
new variant of k-DPP that uses RBF kernel (termed as "RBF k-DPP") which gives
more gain in performance over traditional k-DPP. Due to memory constraints, the
limited number of exemplars along with new class data can lead to class
imbalance. We mitigate it by performing image warping as an augmentation
technique. This helps in crafting diverse poses, which reduces overfitting and
yields further improvement in performance. The efficacy of our proposed
approach is demonstrated via extensive experiments and ablations where we
obtain significant improvements over state-of-the-art baseline methods.
- Abstract(参考訳): ポーズ推定は、画像に興味のある対象のキーポイントを特定するタスクである。
動物のポーズ推定は、動物における種間および種内変動が高いため、人間のポーズを推定するよりも難しい。
既存の研究は、あらかじめ定義された動物カテゴリーの固定された集合に対してこの問題を解決する。
このようなセットでトレーニングされたモデルは、通常、新しい動物カテゴリではうまく機能しない。
新しいカテゴリでモデルを再トレーニングすることで、モデルが過度に適合し、破滅的な忘れることになる。
そこで本研究では,「動物のポーズ推定のためのインクリメンタルラーニング」という新しい問題を提案する。
提案手法は,DPP(Determinantal Point Processes)を用いてサンプル化したメモリを用いて,古いものを忘れずに新しい動物カテゴリーに継続的に適応する。
さらに,従来のk-DPPよりも性能が向上するRBFカーネル(RBF k-DPP)を用いたk-DPPの新たな変種を提案する。
メモリの制約のため、新しいクラスのデータとともに、限られた数の例がクラス不均衡を引き起こす可能性がある。
画像ウォーピングを補足技術として行うことで緩和する。
これは多彩なポーズの作成に役立ち、過剰フィッティングを減らし、パフォーマンスをさらに向上させる。
提案手法の有効性は,最先端のベースライン法よりも大幅に向上した,広範囲な実験と改善によって実証された。
関連論文リスト
- CAT: Contrastive Adapter Training for Personalized Image Generation [4.093428697109545]
コントラスト適応訓練(Contrastive Adapter Training, CAT)を提案し, CAT損失を応用してアダプタトレーニングを強化する。
提案手法は,モデルがアダプタを開始する際に,ベースモデルの本来の知識の保存を容易にする。
論文 参考訳(メタデータ) (2024-04-11T08:36:13Z) - PoseMatcher: One-shot 6D Object Pose Estimation by Deep Feature Matching [51.142988196855484]
本稿では,PoseMatcherを提案する。
3ビューシステムに基づくオブジェクトと画像のマッチングのための新しいトレーニングパイプラインを作成します。
PoseMatcherは、画像とポイントクラウドの異なる入力モダリティに対応できるように、IO-Layerを導入します。
論文 参考訳(メタデータ) (2023-04-03T21:14:59Z) - TTA-COPE: Test-Time Adaptation for Category-Level Object Pose Estimation [86.80589902825196]
TTA-COPEと呼ばれるカテゴリレベルのオブジェクトポーズ推定のためのテスト時間適応法を提案する。
ポーズ認識信頼度を用いて、自己学習損失を伴うポーズアンサンブルアプローチを設計する。
当社のアプローチでは,テストデータを逐次的かつオンライン的に処理し,実行時にソースドメインにアクセスする必要はない。
論文 参考訳(メタデータ) (2023-03-29T14:34:54Z) - Semi-Supervised 2D Human Pose Estimation Driven by Position
Inconsistency Pseudo Label Correction Module [74.80776648785897]
i) 大規模モデルと軽量モデルの間で対話的なトレーニングを行う場合, 大規模モデルのガイドに擬似的な軽量モデルラベルを用いる。
位置整合性擬似ラベル補正モジュール(SSPCM)により駆動される半教師付き2次元ポーズ推定フレームワークを提案する。
学生モデルの性能向上のために,擬似キーポイント認識に基づく半教師付きカットオクルードを用いて,より硬く効果的なサンプルを生成する。
論文 参考訳(メタデータ) (2023-03-08T02:57:05Z) - CATRE: Iterative Point Clouds Alignment for Category-level Object Pose
Refinement [52.41884119329864]
カテゴリーレベルのオブジェクトポーズとサイズ精細化器 CATRE は、点雲からのポーズ推定を反復的に強化し、正確な結果が得られる。
提案手法は,REAL275,CAMERA25,LMのベンチマークを85.32Hzまで高速化する。
論文 参考訳(メタデータ) (2022-07-17T05:55:00Z) - SuperAnimal pretrained pose estimation models for behavioral analysis [42.206265576708255]
行動の定量化は神経科学、獣医学、動物保護活動など様々な応用において重要である。
我々は、SuperAnimalと呼ばれる新しい手法で統一基盤モデルを開発するための一連の技術革新を提案する。
論文 参考訳(メタデータ) (2022-03-14T18:46:57Z) - Overcoming Catastrophic Forgetting in Incremental Few-Shot Learning by
Finding Flat Minima [23.97486216731355]
本稿では,いくつかの例で新たなカテゴリを継続的に認識するモデルを必要とする,漸進的な数ショット学習について考察する。
我々の研究は、既存の手法が、漸進学習においてよく知られた、破滅的な忘れ込みにひどく悩まされていることを示唆している。
そこで本研究では,基礎訓練対象関数の平坦な局所最小値の探索を行い,新しいタスクに基づいて平坦な領域内のモデルパラメータを微調整する。
論文 参考訳(メタデータ) (2021-10-30T14:00:40Z) - Towards Fine-grained Image Classification with Generative Adversarial
Networks and Facial Landmark Detection [0.0]
GANベースのデータ拡張を使用して、余分なデータセットインスタンスを生成します。
近年の視覚変換器 (ViT) モデルを用いて, きめ細かい画像分類の精度を評価し, 評価を行った。
論文 参考訳(メタデータ) (2021-08-28T06:32:42Z) - Self-Supervised Pretraining and Controlled Augmentation Improve Rare
Wildlife Recognition in UAV Images [9.220908533011068]
本稿では,自己指導型プレトレーニングに頼って,必要なトレーニングデータの量を削減する手法を提案する。
MoCo, CLD, および幾何拡張の組み合わせは, ImageNet 上で事前学習された従来のモデルよりも大きなマージンで優れていることを示す。
論文 参考訳(メタデータ) (2021-08-17T12:14:28Z) - Bilevel Online Adaptation for Out-of-Domain Human Mesh Reconstruction [94.25865526414717]
本稿では,事前に訓練されたヒトメッシュ再構築モデルをドメイン外ストリーミングビデオに適応させるという新たな問題を検討する。
重みプローブと重み更新の2つのステップに全体多対象の最適化プロセスを分割するBilevel Online Adaptationを提案します。
BOAが2つのヒューマンメッシュ再構築ベンチマークで最先端の結果をもたらすことを実証する。
論文 参考訳(メタデータ) (2021-03-30T15:47:58Z) - Transferring Dense Pose to Proximal Animal Classes [83.84439508978126]
より一般的な対象検出器やセグメンタなどと同様に、密集したポーズ認識に存在する知識を、他のクラスにおける密集したポーズ認識の問題に移すことが可能であることを示す。
我々は、人間と幾何学的に整合した新しい動物のためのDensePoseモデルを確立することでこれを行う。
また、クラスチンパンジーにDensePoseの方法でラベル付けされた2つのベンチマークデータセットを導入し、アプローチを評価するためにそれらを使用します。
論文 参考訳(メタデータ) (2020-02-28T21:43:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。