論文の概要: Self-supervised Learning on Camera Trap Footage Yields a Strong Universal Face Embedder
- arxiv url: http://arxiv.org/abs/2507.10552v1
- Date: Mon, 14 Jul 2025 17:59:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-15 20:53:35.157543
- Title: Self-supervised Learning on Camera Trap Footage Yields a Strong Universal Face Embedder
- Title(参考訳): カメラトラップフットジュの自己教師型学習は、強い普遍的な顔埋め込みを実現する
- Authors: Vladimir Iashin, Horace Lee, Dan Schofield, Andrew Zisserman,
- Abstract要約: 本研究では、未ラベルのカメラトラップ映像から堅牢なチンパンジー顔の埋め込みを学習するための、完全な自己教師型アプローチを提案する。
私たちは、自動的に採掘された顔作物にビジョントランスフォーマーを訓練し、IDラベルを不要にします。
この研究は、生物多様性モニタリングにおける自己教師型学習の可能性を強調し、スケーラブルで非侵襲的な集団研究の道を開く。
- 参考スコア(独自算出の注目度): 48.03572115000886
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Camera traps are revolutionising wildlife monitoring by capturing vast amounts of visual data; however, the manual identification of individual animals remains a significant bottleneck. This study introduces a fully self-supervised approach to learning robust chimpanzee face embeddings from unlabeled camera-trap footage. Leveraging the DINOv2 framework, we train Vision Transformers on automatically mined face crops, eliminating the need for identity labels. Our method demonstrates strong open-set re-identification performance, surpassing supervised baselines on challenging benchmarks such as Bossou, despite utilising no labelled data during training. This work underscores the potential of self-supervised learning in biodiversity monitoring and paves the way for scalable, non-invasive population studies.
- Abstract(参考訳): カメラトラップは膨大な量の視覚データを収集することで野生生物の監視に革命をもたらしていますが、個々の動物を手動で識別することは大きなボトルネックとして残っています。
本研究では、未ラベルのカメラトラップ映像から堅牢なチンパンジー顔の埋め込みを学習するための、完全な自己教師型アプローチを提案する。
DINOv2フレームワークを活用して、自動マイニングされた顔作物にビジョントランスフォーマーをトレーニングし、IDラベルの必要性を排除します。
本手法は,トレーニング中にラベル付きデータを利用することなく,Bossouなどのベンチマークの教師付きベースラインを超越した,オープンセットの再識別性能を示す。
この研究は、生物多様性モニタリングにおける自己教師型学習の可能性を強調し、スケーラブルで非侵襲的な集団研究の道を開く。
関連論文リスト
- Wildlife Target Re-Identification Using Self-supervised Learning in Non-Urban Settings [0.0]
野生生物の再同定は、異なる観察で同じ種の個体をマッチングすることを目的としている。
現在のSOTA(State-of-the-art)モデルは、個々の分類のための教師付きモデルを訓練するためにクラスラベルに依存している。
本研究では,野生生物の再同定のための自己教師型学習(SSL)について検討する。
論文 参考訳(メタデータ) (2025-07-03T07:56:54Z) - Multimodal Foundation Models for Zero-shot Animal Species Recognition in
Camera Trap Images [57.96659470133514]
モーションアクティベートカメラトラップは、世界中の野生生物を追跡・監視するための効率的なツールである。
教師付き学習技術は、そのような画像を分析するためにうまく展開されているが、そのような訓練には専門家のアノテーションが必要である。
コストのかかるラベル付きデータへの依存を減らすことは、人間の労働力を大幅に減らした大規模野生生物追跡ソリューションを開発する上で、大きな可能性を秘めている。
論文 参考訳(メタデータ) (2023-11-02T08:32:00Z) - Free-ATM: Exploring Unsupervised Learning on Diffusion-Generated Images
with Free Attention Masks [64.67735676127208]
テキストと画像の拡散モデルは、画像認識の恩恵を受ける大きな可能性を示している。
有望ではあるが、拡散生成画像の教師なし学習に特化した調査は不十分である。
上記フリーアテンションマスクをフル活用することで、カスタマイズされたソリューションを導入する。
論文 参考訳(メタデータ) (2023-08-13T10:07:46Z) - Unsupervised Learning of Accurate Siamese Tracking [68.58171095173056]
分類枝と回帰枝の両方で時間対応を学習できる新しい教師なし追跡フレームワークを提案する。
トラッカーは、トラッカーネットやLaSOTのような大規模データセット上で、教師なしの手法と同等の性能を発揮する。
論文 参考訳(メタデータ) (2022-04-04T13:39:43Z) - WhoAmI: An Automatic Tool for Visual Recognition of Tiger and Leopard
Individuals in the Wild [3.1708876837195157]
我々は,動物を識別し,動物の種類を特定し,2種の個体を識別する自動アルゴリズムを開発した。
本研究では,南インドのジャングルに記録されたカメラトラップ画像のデータセットに対するアプローチの有効性を示す。
論文 参考訳(メタデータ) (2020-06-17T16:17:46Z) - Visual Identification of Individual Holstein-Friesian Cattle via Deep
Metric Learning [8.784100314325395]
ホルシュタイン・フリーズ産の牛は、チューリングの反応拡散系から生じたものと類似した、個々の特性の白黒のコートパターンを視覚的に示す。
この研究は、畳み込みニューラルネットワークとディープメトリック学習技術を介して、個々のホルシュタイン・フリース人の視覚的検出と生体認証を自動化するために、これらの自然なマーキングを利用する。
論文 参考訳(メタデータ) (2020-06-16T14:41:55Z) - Automatic Detection and Recognition of Individuals in Patterned Species [4.163860911052052]
我々は,異なるパターンの個体の自動検出と認識のための枠組みを開発する。
我々は最近提案したFaster-RCNNオブジェクト検出フレームワークを用いて画像中の動物を効率的に検出する。
我々は,シマウマおよびジャガー画像の認識システムを評価し,他のパターンの種への一般化を示す。
論文 参考訳(メタデータ) (2020-05-06T15:29:21Z) - Self-supervised Equivariant Attention Mechanism for Weakly Supervised
Semantic Segmentation [93.83369981759996]
本稿では,自己監督同変注意機構(SEAM)を提案する。
本手法は,完全教師付きセマンティックセグメンテーションにおいて,同値が暗黙の制約であることを示す。
本稿では,ネットワーク学習のための自己スーパービジョンを提供するために,様々な変換画像から予測されたCAMの整合性正則化を提案する。
論文 参考訳(メタデータ) (2020-04-09T14:57:57Z) - Automatic image-based identification and biomass estimation of
invertebrates [70.08255822611812]
時間を要する分類と分類は、どれだけの昆虫を処理できるかに強い制限を課す。
我々は、人間の専門家による分類と識別の標準的な手動アプローチを、自動画像ベース技術に置き換えることを提案する。
分類タスクには最先端のResnet-50とInceptionV3 CNNを使用する。
論文 参考訳(メタデータ) (2020-02-05T21:38:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。