論文の概要: Categorical Keypoint Positional Embedding for Robust Animal Re-Identification
- arxiv url: http://arxiv.org/abs/2412.00818v1
- Date: Sun, 01 Dec 2024 14:09:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:45:39.374200
- Title: Categorical Keypoint Positional Embedding for Robust Animal Re-Identification
- Title(参考訳): ロバスト動物再同定のためのカテゴリー的キーポイント位置埋め込み
- Authors: Yuhao Lin, Lingqiao Liu, Javen Shi,
- Abstract要約: 動物再同定(ReID)は生態学研究において欠かせない道具となっている。
ヒトのReIDとは異なり、動物のポーズの多様性の高さ、環境条件の多様性、動物データに事前訓練されたモデルを直接適用できないことなど、動物ReIDは重大な課題に直面している。
本研究は,1つの注釈付き事前学習拡散モデルを用いたキーポイント伝搬機構を導入する。
- 参考スコア(独自算出の注目度): 22.979350771097966
- License:
- Abstract: Animal re-identification (ReID) has become an indispensable tool in ecological research, playing a critical role in tracking population dynamics, analyzing behavioral patterns, and assessing ecological impacts, all of which are vital for informed conservation strategies. Unlike human ReID, animal ReID faces significant challenges due to the high variability in animal poses, diverse environmental conditions, and the inability to directly apply pre-trained models to animal data, making the identification process across species more complex. This work introduces an innovative keypoint propagation mechanism, which utilizes a single annotated image and a pre-trained diffusion model to propagate keypoints across an entire dataset, significantly reducing the cost of manual annotation. Additionally, we enhance the Vision Transformer (ViT) by implementing Keypoint Positional Encoding (KPE) and Categorical Keypoint Positional Embedding (CKPE), enabling the ViT to learn more robust and semantically-aware representations. This provides more comprehensive and detailed keypoint representations, leading to more accurate and efficient re-identification. Our extensive experimental evaluations demonstrate that this approach significantly outperforms existing state-of-the-art methods across four wildlife datasets. The code will be publicly released.
- Abstract(参考訳): 動物再同定(ReID)は、生態学研究において欠かせない道具となり、個体群動態の追跡、行動パターンの分析、生態学的影響の評価において重要な役割を担っている。
ヒトのReIDとは異なり、動物のポーズの多様性の高さ、環境条件の多様性、動物データに事前訓練されたモデルを直接適用できないこと、そして種間の識別プロセスがより複雑になるため、動物ReIDは重大な課題に直面している。
本研究は,1つの注釈付き画像と事前学習した拡散モデルを用いて,データセット全体にわたってキーポイントを伝播させ,手動アノテーションのコストを大幅に削減する,革新的なキーポイント伝搬機構を導入する。
さらに、KPE(Keypoint Positional Encoding)とCKPE(Categorical Keypoint Positional Embedding)を実装してビジョントランスフォーマー(ViT)を強化し、ViTがより堅牢でセマンティックな表現を学習できるようにする。
これにより、より包括的で詳細なキーポイント表現が提供され、より正確で効率的な再識別が可能になる。
実験により,本手法は野生生物の4つのデータセットにまたがって,既存の最先端手法を著しく上回っていることが示された。
コードは公開されます。
関連論文リスト
- Meta-Feature Adapter: Integrating Environmental Metadata for Enhanced Animal Re-identification [7.272706868932979]
環境メタデータをCLIPなどの視覚言語基盤モデルに統合する軽量モジュールを提案する。
提案手法は,環境メタデータを自然言語記述に翻訳し,メタデータを意識したテキスト埋め込みにエンコードし,これらの埋め込みを画像特徴に組み込む。
論文 参考訳(メタデータ) (2025-01-23T04:14:59Z) - Keypoint Abstraction using Large Models for Object-Relative Imitation Learning [78.92043196054071]
多様なタスクや環境にまたがる新しいオブジェクト構成やインスタンスへの一般化は、ロボット工学において重要な課題である。
キーポイントに基づく表現は、本質的なオブジェクトキャプチャ機能のための簡潔な表現として有効であることが証明されている。
本稿では,タスク関連およびクロスインスタンス整合性キーポイントの自動生成に,大規模な事前学習型視覚言語モデルを活用するフレームワークであるKALMを提案する。
論文 参考訳(メタデータ) (2024-10-30T17:37:31Z) - Adaptive High-Frequency Transformer for Diverse Wildlife Re-Identification [33.0352672906987]
Wildlife ReIDは視覚技術を利用して、異なるシナリオで野生動物の特定の個人を特定する。
野生生物ReIDのための統合された多種多種汎用フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-09T15:16:30Z) - Open-Vocabulary Animal Keypoint Detection with Semantic-feature Matching [74.75284453828017]
Open-Vocabulary Keypoint Detection (OVKD)タスクは、任意の種類のキーポイントを特定するためにテキストプロンプトを使用するように設計されている。
セマンティック・フェールマッチング(KDSM)を用いた開語彙キーポイント検出(Open-Vocabulary Keypoint Detection)という新しいフレームワークを開発した。
このフレームワークは視覚と言語モデルを組み合わせて、言語機能とローカルキーポイント視覚機能との相互作用を作成する。
論文 参考訳(メタデータ) (2023-10-08T07:42:41Z) - CLAMP: Prompt-based Contrastive Learning for Connecting Language and
Animal Pose [70.59906971581192]
本稿では,言語とAniMal Poseを効果的に接続するための,新しいプロンプトベースのコントラスト学習手法を提案する。
CLAMPは、ネットワークトレーニング中にテキストプロンプトを動物のキーポイントに適応させることでギャップを埋めようとしている。
実験結果から, 教師付き, 少数ショット, ゼロショット設定下での最先端性能が得られた。
論文 参考訳(メタデータ) (2022-06-23T14:51:42Z) - SuperAnimal pretrained pose estimation models for behavioral analysis [42.206265576708255]
行動の定量化は神経科学、獣医学、動物保護活動など様々な応用において重要である。
我々は、SuperAnimalと呼ばれる新しい手法で統一基盤モデルを開発するための一連の技術革新を提案する。
論文 参考訳(メタデータ) (2022-03-14T18:46:57Z) - Persistent Animal Identification Leveraging Non-Visual Markers [71.14999745312626]
乱雑なホームケージ環境下で各マウスにユニークな識別子を時間をかけて発見し提供することを目的としている。
これは、(i)各マウスの視覚的特徴の区別の欠如、(ii)一定の閉塞を伴うシーンの密閉性のため、非常に難しい問題である。
本手法は, この動物識別問題に対して77%の精度を達成し, 動物が隠れているときの急激な検出を拒否することができる。
論文 参考訳(メタデータ) (2021-12-13T17:11:32Z) - A Novel Dataset for Keypoint Detection of quadruped Animals from Images [9.820186342227252]
AwA Poseは、画像から四足動物をキーポイントで検出するための新しいデータセットである。
我々は、異なるキーポイント検出タスクのための最先端のディープラーニングモデルでデータセットをベンチマークした。
論文 参考訳(メタデータ) (2021-08-31T16:40:09Z) - Fine-grained Species Recognition with Privileged Pooling: Better Sample
Efficiency Through Supervised Attention [26.136331738529243]
トレーニングデータに対するキーポイントアノテーションの形式で特権情報を利用する教師付き画像分類手法を提案する。
我々の主な動機は、生物多様性モデリングのような生態学的応用のための動物種の認識である。
3つの異なる動物種のデータセットを用いた実験では、特権プールを持つ深層ネットワークがより効率的に小さなトレーニングセットを利用でき、より一般化できることが示されている。
論文 参考訳(メタデータ) (2020-03-20T10:03:01Z) - Transferring Dense Pose to Proximal Animal Classes [83.84439508978126]
より一般的な対象検出器やセグメンタなどと同様に、密集したポーズ認識に存在する知識を、他のクラスにおける密集したポーズ認識の問題に移すことが可能であることを示す。
我々は、人間と幾何学的に整合した新しい動物のためのDensePoseモデルを確立することでこれを行う。
また、クラスチンパンジーにDensePoseの方法でラベル付けされた2つのベンチマークデータセットを導入し、アプローチを評価するためにそれらを使用します。
論文 参考訳(メタデータ) (2020-02-28T21:43:53Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。