論文の概要: Animal Re-Identification on Microcontrollers
- arxiv url: http://arxiv.org/abs/2512.08198v1
- Date: Tue, 09 Dec 2025 03:09:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:07.792294
- Title: Animal Re-Identification on Microcontrollers
- Title(参考訳): マイクロコントローラの動物再同定
- Authors: Yubo Chen, Di Zhao, Yun Sing Koh, Talia Xu,
- Abstract要約: カメラによる動物再同定は、大規模な屋外環境における野生生物のモニタリングと家畜の精密管理を支援することができる。
ほとんどのAnimal Re-IDモデルはワークステーションやサーバ用に設計されており、小さなメモリと低解像度の入力を持つデバイスには大きすぎる。
そこで本研究では,大規模教員による簡単な知識蒸留は,メモリと入力解像度が制約された場合に限られた利益をもたらすことを示すオンデバイス・フレームワークを提案する。
- 参考スコア(独自算出の注目度): 13.780361742050436
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Camera-based animal re-identification (Animal Re-ID) can support wildlife monitoring and precision livestock management in large outdoor environments with limited wireless connectivity. In these settings, inference must run directly on collar tags or low-power edge nodes built around microcontrollers (MCUs), yet most Animal Re-ID models are designed for workstations or servers and are too large for devices with small memory and low-resolution inputs. We propose an on-device framework. First, we characterise the gap between state-of-the-art Animal Re-ID models and MCU-class hardware, showing that straightforward knowledge distillation from large teachers offers limited benefit once memory and input resolution are constrained. Second, guided by this analysis, we design a high-accuracy Animal Re-ID architecture by systematically scaling a CNN-based MobileNetV2 backbone for low-resolution inputs. Third, we evaluate the framework with a real-world dataset and introduce a data-efficient fine-tuning strategy to enable fast adaptation with just three images per animal identity at a new site. Across six public Animal Re-ID datasets, our compact model achieves competitive retrieval accuracy while reducing model size by over two orders of magnitude. On a self-collected cattle dataset, the deployed model performs fully on-device inference with only a small accuracy drop and unchanged Top-1 accuracy relative to its cluster version. We demonstrate that practical, adaptable Animal Re-ID is achievable on MCU-class devices, paving the way for scalable deployment in real field environments.
- Abstract(参考訳): カメラによる動物再識別(Animal Re-ID)は、無線接続が制限された大規模な屋外環境での野生生物のモニタリングと家畜の精密管理を支援することができる。
これらの設定では、推論はマイクロコントローラ(MCU)を中心に構築されたカラータグやローパワーエッジノードで直接実行される必要があるが、ほとんどのAnimal Re-IDモデルはワークステーションやサーバ用に設計されており、メモリが小さく、低解像度の入力を持つデバイスには大きすぎる。
デバイス上でのフレームワークを提案する。
まず、最先端のAnimal Re-IDモデルとMCUクラスのハードウェアとのギャップを特徴付け、メモリと入力解像度が制限されると、大規模教師による簡単な知識蒸留が限られた利益をもたらすことを示す。
次に,CNNベースのMobileNetV2バックボーンを低解像度入力のために体系的にスケーリングすることで,高精度なAnimal Re-IDアーキテクチャを設計する。
第3に,本フレームワークを実世界のデータセットを用いて評価し,動物ひとり当たりの画像がわずか3枚で高速に適応できるように,データ効率の良い微調整戦略を導入する。
6つの公開Animal Re-IDデータセットにまたがって,我々のコンパクトモデルでは,モデルサイズを2桁以上削減しながら,競争的検索精度を実現している。
自己収集された牛のデータセットでは、デプロイされたモデルは、小さな精度の低下とクラスタのバージョンに対するTop-1の正確性の変更のみで、デバイス上の完全な推論を実行する。
実用的で適応可能なAnimal Re-IDは、MCUクラスのデバイス上で実現可能であることを実証し、実地環境におけるスケーラブルなデプロイメントの道を開いた。
関連論文リスト
- Detect Anything via Next Point Prediction [51.55967987350882]
Rex-Omniは最先端の物体認識性能を実現する3BスケールのMLLMである。
COCOやLVISのようなベンチマークでは、Rex-Omniは回帰ベースのモデルに匹敵するパフォーマンスを得る。
論文 参考訳(メタデータ) (2025-10-14T17:59:54Z) - AniMer+: Unified Pose and Shape Estimation Across Mammalia and Aves via Family-Aware Transformer [26.738709781346678]
スケーラブルなAniMerフレームワークの拡張バージョンであるAniMer+を紹介します。
AniMer+の重要なイノベーションは、その高容量、家族対応ビジョントランス(ViT)である。
CtrlAni3D for quadrupeds と CtrlAVES3D for birds の2つの大規模な合成データセットを生成した。
論文 参考訳(メタデータ) (2025-08-01T03:53:03Z) - MetaWild: A Multimodal Dataset for Animal Re-Identification with Environmental Metadata [12.66570183161988]
本稿では,既存の視覚言語モデル(VLM)に基づくAnimal ReID手法に組み込む軽量モジュールを提案する。
MetaWildの実験では、ベースラインReIDモデルとMFAを組み合わせることでメタデータを組み込むことで、パフォーマンスが一貫して向上することが示された。
論文 参考訳(メタデータ) (2025-01-23T04:14:59Z) - Recurrence over Video Frames (RoVF) for the Re-identification of Meerkats [4.512615837610558]
本稿では、Perceiverアーキテクチャに基づく繰り返しヘッドを用いて、ビデオクリップから埋め込みを反復的に構築するRecurrence over Video Frames (RoVF)という手法を提案する。
我々は、ウェリントン動物園で収集されたミーアカットのデータセット上で、DINOv2トランスフォーマーアーキテクチャに基づいて、この手法と様々なモデルを検証した。
提案手法は,最高の DINOv2 モデル (42%$) よりも高い 49%$ のトップ1再同定精度を実現する。
論文 参考訳(メタデータ) (2024-06-18T18:44:19Z) - Universal Bovine Identification via Depth Data and Deep Metric Learning [1.6605913858547239]
本稿では,個別の牛を正確に識別する深度のみの深度学習システムを提案する。
群れの大きさの増大は、農場における牛と人間の比率を歪め、個人を手動で監視することがより困難になる。
そこで本研究では,市販の3Dカメラの深度データを用いた牛の識別のための深度学習手法を提案する。
論文 参考訳(メタデータ) (2024-03-29T22:03:53Z) - Object-based (yet Class-agnostic) Video Domain Adaptation [78.34712426922519]
我々はODAPT(Object-based (yet Class-Agnostic) Video Domain Adaptation)を提案する。
ODAPTは、既存のアクション認識システムを新しいドメインに適応するための、シンプルで効果的なフレームワークである。
我々のモデルは、Epic-Kitchensのキッチン間で適応する場合の+6.5の増加と、Epic-KitchensとEGTEAデータセット間の適応率の+3.1の増加を実現している。
論文 参考訳(メタデータ) (2023-11-29T01:17:38Z) - Efficient Adaptive Human-Object Interaction Detection with
Concept-guided Memory [64.11870454160614]
概念誘導メモリ(ADA-CM)を用いた適応型HOI検出器を提案する。
ADA-CMには2つの操作モードがある。最初のモードでは、トレーニング不要のパラダイムで新しいパラメータを学習することなくチューニングできる。
提案手法は, HICO-DET と V-COCO のデータセットに対して, より少ないトレーニング時間で, 最新技術による競合的な結果を得る。
論文 参考訳(メタデータ) (2023-09-07T13:10:06Z) - SuperAnimal pretrained pose estimation models for behavioral analysis [42.206265576708255]
行動の定量化は神経科学、獣医学、動物保護活動など様々な応用において重要である。
我々は、SuperAnimalと呼ばれる新しい手法で統一基盤モデルを開発するための一連の技術革新を提案する。
論文 参考訳(メタデータ) (2022-03-14T18:46:57Z) - Coarse-to-fine Animal Pose and Shape Estimation [67.39635503744395]
単一画像から3次元動物メッシュを再構成する粗大なアプローチを提案する。
粗い推定段階はまずSMALモデルのポーズ、形状、翻訳パラメータを推定する。
次に、推定メッシュをグラフ畳み込みネットワーク(GCN)によって開始点として使用し、精製段階における頂点毎の変形を予測する。
論文 参考訳(メタデータ) (2021-11-16T01:27:20Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。