論文の概要: Beyond Humans: Multispecies Animal Face Recognition Using Transfer Learning
- arxiv url: http://arxiv.org/abs/2606.09353v1
- Date: Mon, 08 Jun 2026 11:27:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.942232
- Title: Beyond Humans: Multispecies Animal Face Recognition Using Transfer Learning
- Title(参考訳): 人間を超えて:トランスファーラーニングを用いた多種動物顔認識
- Authors: Maria De Marsico, Anil K. Jain, Annalaura Miglino,
- Abstract要約: 個体認識は、失われたペットや盗まれたペットの探索、絶滅危惧種の個体の追跡、混雑した農場での動物の認識に有用である。
現代の認識技術は主に物理デバイス(例えばマイクロチップ)を使用し、しばしば非実用的で適用が難しい。
例えば、食品業界で健康な動物に病気の動物を代用する場合のように、非侵襲的であり、遠くで働くことができ、偽造が困難である。
- 参考スコア(独自算出の注目度): 11.067807430004416
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Individual animal recognition can be useful in the search for lost or stolen pets, the tracking of individuals of endangered species, and the recognition of animals in crowded farms. Present recognition techniques mostly use physical devices, e.g., microchips, often impractical and difficult to apply. These could be replaced by remote recognition via the animal's face; if accurate enough, it provides several advantages: it is non-invasive, can work at a distance, and is difficult to counterfeit, as, for instance, in the case of substituting sick animals for healthy ones in the food industry. The few existing datasets with sufficient per-subject images annotated with a single animal identity are not large enough to train current deep learning architectures. We rather investigate the possibility of transfer learning, exploiting pre-trained network models as backbones. Our experiments compared FaceNet, which is specifically trained on large databases of human faces, with the Vision Transformer (ViT) pre-trained on ImageNet, i.e., on object categories. We used three face datasets of very different animals: dogs, primates (lemurs, golden monkeys, and chimpanzees), and cattle. We report the results and, for each dataset, compare them with the state of the art (SOTA) ad hoc-trained deep networks. The capture conditions differ among the three datasets. Image quality (resolution, motion blur, diverse poses, etc.) decreases from dogs to cattle to primates. The best performance was achieved with dogs, where ViT reached a mean verification accuracy of 96.85% and a Rank-1 Identification Rate of 84.34%. The results for endangered primates are still encouraging, but performance varies across animal classes and tasks (verification or identification), and does not always outperform SOTA. For cattle, the ViT results outperform SOTA, while FaceNet is still competitive.
- Abstract(参考訳): 個体認識は、失われたペットや盗まれたペットの探索、絶滅危惧種の個体の追跡、混雑した農場での動物の認識に有用である。
現代の認識技術は、主に物理デバイス(例えばマイクロチップ)を使用し、しばしば非実用的で適用が難しい。
例えば、食品業界で健康な動物に病気の動物を代用する場合のように、非侵襲的であり、遠くで働くことができ、偽造が困難である。
単一動物のアイデンティティを付加した十分なオブジェクト単位のイメージを持つ数少ない既存のデータセットは、現在のディープラーニングアーキテクチャをトレーニングするのに十分な大きさではない。
むしろ、トレーニング済みのネットワークモデルをバックボーンとして活用して、転送学習の可能性について検討する。
我々の実験では、人間の顔の大規模なデータベースで特別に訓練されたFaceNetと、ImageNetで事前訓練されたViT(Vision Transformer)、すなわちオブジェクトカテゴリのFaceNetを比較した。
私たちは、犬、霊長類(レミュール、ゴールデンモンキー、チンパンジー)、牛の3つの顔のデータセットを使用しました。
結果を報告し、各データセットについて、最先端(SOTA)アドホックトレーニングディープネットワークと比較する。
捕獲条件は3つのデータセットによって異なる。
画像の品質(解像度、動きのぼけ、多様なポーズなど)は、犬から牛、霊長類へと低下する。
最高の成績は犬で達成され、ViTの平均精度は96.85%、ランク1の識別率は84.34%に達した。
絶滅危惧種の結果は依然として奨励されているが、パフォーマンスは動物クラスやタスク(検証や識別)によって異なり、常にSOTAを上回っているとは限らない。
牛の場合、ViTはSOTAを上回り、FaceNetはいまだに競争力がある。
関連論文リスト
- PetFace: A Large-Scale Dataset and Benchmark for Animal Identification [2.3020018305241337]
動物顔識別のための包括的リソースであるPetFaceデータセットを紹介する。
PetFaceには、13の動物科の257,484個体と、実験動物とペット動物の両方を含む319種の品種が含まれている。
我々は、見知らぬ個人に対する再識別や、見つからない個人に対する検証を含むベンチマークを提供する。
論文 参考訳(メタデータ) (2024-07-18T14:28:31Z) - Learning Human Action Recognition Representations Without Real Humans [66.61527869763819]
そこで本研究では,仮想人間を含む合成データを用いて,実世界の映像を活用してモデルを事前学習するベンチマークを提案する。
次に、このデータに基づいて学習した表現を、下流行動認識ベンチマークの様々なセットに転送可能であるかを評価する。
私たちのアプローチは、以前のベースラインを最大5%上回ります。
論文 参考訳(メタデータ) (2023-11-10T18:38:14Z) - Multi-Domain Norm-referenced Encoding Enables Data Efficient Transfer
Learning of Facial Expression Recognition [62.997667081978825]
本稿では,表情認識における伝達学習のための生物学的メカニズムを提案する。
提案アーキテクチャでは,人間の脳が,頭部形状の異なる表情を自然に認識する方法について解説する。
本モデルでは, FERGデータセットの分類精度92.15%を極端に高いデータ効率で達成する。
論文 参考訳(メタデータ) (2023-04-05T09:06:30Z) - Extreme Image Transformations Affect Humans and Machines Differently [0.0]
最近の人工ニューラルネットワーク(ANN)では、霊長類ニューラルネットと人間のパフォーマンスデータの側面をモデル化している。
神経生理学的な知見にインスパイアされた新しい画像変換のセットを導入し、物体認識タスクにおいて人間とANNを評価する。
機械は、特定の変換のために人間よりも優れた性能を示し、人間にとって容易な他者と同等の性能を発揮するのに苦労する。
論文 参考訳(メタデータ) (2022-11-30T18:12:53Z) - Portuguese Man-of-War Image Classification with Convolutional Neural
Networks [58.720142291102135]
ポルトガルマン・オブ・ウォー(ポルトガル語: Man-of-war、PMW)は、長い触手を持つゼラチン質の生物である。
本稿では,InstagramのソーシャルメディアからPMW画像を認識するための畳み込みニューラルネットワークの利用について報告する。
論文 参考訳(メタデータ) (2022-07-04T03:06:45Z) - A Competitive Method for Dog Nose-print Re-identification [46.94755073943372]
本稿では,CVPR 2022ペット生体認証における犬の鼻指紋認証(Re-ID)課題について提案する。
複数のモデルが組み合わされ、テストセット上で86.67%のAUCが得られる。
論文 参考訳(メタデータ) (2022-05-31T16:26:46Z) - Ultrafast Image Categorization in Biology and Neural Models [0.0]
生態学的に人間に関係のある2つの独立したタスクについて,標準VGG 16 CNNを再訓練した。
ネットワークの再トレーニングは、精神物理学的なタスクで報告されたのに匹敵する、人間のようなパフォーマンスのレベルを達成することを示す。
論文 参考訳(メタデータ) (2022-05-07T11:19:40Z) - Overcoming the Domain Gap in Neural Action Representations [60.47807856873544]
3Dポーズデータは、手動で介入することなく、マルチビュービデオシーケンスから確実に抽出できる。
本稿では,ニューラルアクション表現の符号化を,ニューラルアクションと行動拡張のセットと共に導くために使用することを提案する。
ドメインギャップを減らすために、トレーニングの間、同様の行動をしているように見える動物間で神経と行動のデータを取り替える。
論文 参考訳(メタデータ) (2021-12-02T12:45:46Z) - Pose Recognition in the Wild: Animal pose estimation using Agglomerative
Clustering and Contrastive Learning [0.0]
我々は,複数の動物のポーズを非ラベルデータから認識できる新しいアーキテクチャを提案する。
私たちは、下層の解剖学ではなく、その視覚的行動に基づいて、動物の身体の部位を区別することができます。
論文 参考訳(メタデータ) (2021-11-16T07:00:31Z) - Transferring Dense Pose to Proximal Animal Classes [83.84439508978126]
より一般的な対象検出器やセグメンタなどと同様に、密集したポーズ認識に存在する知識を、他のクラスにおける密集したポーズ認識の問題に移すことが可能であることを示す。
我々は、人間と幾何学的に整合した新しい動物のためのDensePoseモデルを確立することでこれを行う。
また、クラスチンパンジーにDensePoseの方法でラベル付けされた2つのベンチマークデータセットを導入し、アプローチを評価するためにそれらを使用します。
論文 参考訳(メタデータ) (2020-02-28T21:43:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。