論文の概要: CNN Based Flank Predictor for Quadruped Animal Species
- arxiv url: http://arxiv.org/abs/2406.13588v1
- Date: Wed, 19 Jun 2024 14:24:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-21 19:24:08.020244
- Title: CNN Based Flank Predictor for Quadruped Animal Species
- Title(参考訳): CNNを用いた四足動物用フランク予測器
- Authors: Vanessa Suessle, Marco Heurich, Colleen T. Downs, Andreas Weinmann, Elke Hergenroether,
- Abstract要約: 我々は、画像中の4つの哺乳類の視覚的な側面を予測する側面予測器を訓練する。
発達したモデルは、未知の環境と未知の環境において、異なる未知の四つ組種の異なるシナリオで評価された。
EfficientNetV2のバックボーンで訓練された最良のモデルは、複雑な生息地において未知の種であるlynxに対して88.70%の精度を達成した。
- 参考スコア(独自算出の注目度): 1.502956022927019
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The bilateral asymmetry of flanks of animals with visual body marks that uniquely identify an individual, complicates tasks like population estimations. Automatically generated additional information on the visible side of the animal would improve the accuracy for individual identification. In this study we used transfer learning on popular CNN image classification architectures to train a flank predictor that predicts the visible flank of quadruped mammalian species in images. We automatically derived the data labels from existing datasets originally labeled for animal pose estimation. We trained the models in two phases with different degrees of retraining. The developed models were evaluated in different scenarios of different unknown quadruped species in known and unknown environments. As a real-world scenario, we used a dataset of manually labeled Eurasian lynx (Lynx lynx) from camera traps in the Bavarian Forest National Park to evaluate the model. The best model, trained on an EfficientNetV2 backbone, achieved an accuracy of 88.70 % for the unknown species lynx in a complex habitat.
- Abstract(参考訳): 視覚的な体格を持つ動物の側面の左右の非対称性は、個体をユニークに識別し、人口推定のようなタスクを複雑にする。
動物の視界上の情報を自動的に生成すると、個人識別の精度が向上する。
本研究では、一般的なCNN画像分類アーキテクチャを用いたトランスファーラーニングを用いて、画像中の四重化哺乳類の視線側面を予測する側面予測器を訓練した。
動物ポーズ推定のためにラベル付けされた既存のデータセットから,データラベルを自動的に抽出する。
モデルのトレーニングは2段階に分けて行いました。
発達したモデルは、未知の環境と未知の環境において、異なる未知の四つ組種の異なるシナリオで評価された。
実世界のシナリオとして、バイエルン森林国立公園のカメラトラップから手動でEurasian lynx(Lynx lynx)とラベル付けしたデータセットを用いて、モデルを評価した。
EfficientNetV2のバックボーンで訓練された最良のモデルは、複雑な生息地において未知の種であるlynxに対して88.70%の精度を達成した。
関連論文リスト
- Animal Identification with Independent Foreground and Background Modeling [21.917582794820095]
本研究では,個々の動物の視覚的識別において,背景と前景をしっかりと活用する手法を提案する。
実験では、Segment Anythingのようなメソッドと独立のフォアグラウンドとバックグラウンド関連のモデリングで簡単に分離できることが示され、結果が改善された。
論文 参考訳(メタデータ) (2024-08-23T09:19:34Z) - PoseBench: Benchmarking the Robustness of Pose Estimation Models under Corruptions [57.871692507044344]
ポース推定は、単眼画像を用いて人や動物の解剖学的キーポイントを正確に同定することを目的としている。
現在のモデルは一般的に、クリーンなデータに基づいてトレーニングされ、テストされる。
実世界の腐敗に対するポーズ推定モデルの堅牢性を評価するためのベンチマークであるPoseBenchを紹介する。
論文 参考訳(メタデータ) (2024-06-20T14:40:17Z) - LD-SDM: Language-Driven Hierarchical Species Distribution Modeling [9.620416509546471]
我々は,世界規模の存在のみのデータを用いた種分布モデリングの問題に焦点をあてる。
種間の強い暗黙の関係を捉えるため,大きな言語モデルを用いて,種の分類学的階層を符号化した。
そこで本研究では,種分布モデルの評価が可能な近接認識評価指標を提案する。
論文 参考訳(メタデータ) (2023-12-13T18:11:37Z) - Multimodal Foundation Models for Zero-shot Animal Species Recognition in
Camera Trap Images [57.96659470133514]
モーションアクティベートカメラトラップは、世界中の野生生物を追跡・監視するための効率的なツールである。
教師付き学習技術は、そのような画像を分析するためにうまく展開されているが、そのような訓練には専門家のアノテーションが必要である。
コストのかかるラベル付きデータへの依存を減らすことは、人間の労働力を大幅に減らした大規模野生生物追跡ソリューションを開発する上で、大きな可能性を秘めている。
論文 参考訳(メタデータ) (2023-11-02T08:32:00Z) - Of Mice and Pose: 2D Mouse Pose Estimation from Unlabelled Data and
Synthetic Prior [0.7499722271664145]
そこで本稿では, 合成合成経験的ポーズを用いた2次元マウスのポーズ推定手法を提案する。
本手法はマウスの四肢構造に適応し,合成3次元マウスモデルから2次元ポーズの経験的先行を生成できる。
新しいマウスビデオデータセットの実験では,ポーズ予測を手作業で得られた真実と比較することにより,提案手法の性能を評価する。
論文 参考訳(メタデータ) (2023-07-25T09:31:55Z) - Spatial Implicit Neural Representations for Global-Scale Species Mapping [72.92028508757281]
ある種が観察された場所の集合を考えると、その種がどこにいても存在しないかを予測するためのモデルを構築することが目的である。
従来の手法は、新たな大規模クラウドソースデータセットを活用するのに苦労している。
本研究では,47k種の地理的範囲を同時に推定するために,空間入射ニューラル表現(SINR)を用いる。
論文 参考訳(メタデータ) (2023-06-05T03:36:01Z) - Towards automatic detection of wildlife trade using machine vision
models [0.0]
現在、取引の重要な部分はインターネット、特にデジタルマーケットプレースやソーシャルメディアで行われている。
そこで我々は,市販のエキゾチックなペットのイメージを自動的に識別する目的で,Deep Neural Networksに基づくマシンビジョンモデルを開発した。
5つの異なるアーキテクチャ、3つのトレーニング方法、2つのタイプのデータセットを組み合わせた24のニューラルネットモデルをトレーニングしました。
論文 参考訳(メタデータ) (2022-05-23T14:11:16Z) - Coarse-to-fine Animal Pose and Shape Estimation [67.39635503744395]
単一画像から3次元動物メッシュを再構成する粗大なアプローチを提案する。
粗い推定段階はまずSMALモデルのポーズ、形状、翻訳パラメータを推定する。
次に、推定メッシュをグラフ畳み込みネットワーク(GCN)によって開始点として使用し、精製段階における頂点毎の変形を予測する。
論文 参考訳(メタデータ) (2021-11-16T01:27:20Z) - Transferring Dense Pose to Proximal Animal Classes [83.84439508978126]
より一般的な対象検出器やセグメンタなどと同様に、密集したポーズ認識に存在する知識を、他のクラスにおける密集したポーズ認識の問題に移すことが可能であることを示す。
我々は、人間と幾何学的に整合した新しい動物のためのDensePoseモデルを確立することでこれを行う。
また、クラスチンパンジーにDensePoseの方法でラベル付けされた2つのベンチマークデータセットを導入し、アプローチを評価するためにそれらを使用します。
論文 参考訳(メタデータ) (2020-02-28T21:43:53Z) - Deformation-aware Unpaired Image Translation for Pose Estimation on
Laboratory Animals [56.65062746564091]
我々は,神経回路が行動をどのようにオーケストレーションするかを研究するために,手動による監督を使わずに,神経科学モデル生物のポーズを捉えることを目的としている。
我々の重要な貢献は、未完成の画像翻訳フレームワークにおける外観、形状、ポーズの明示的で独立したモデリングである。
ショウジョウバエ(ハエ)、線虫(線虫)、ダニオ・レリオ(ゼブラフィッシュ)のポーズ推定精度の向上を実証した。
論文 参考訳(メタデータ) (2020-01-23T15:34:11Z) - Learning landmark guided embeddings for animal re-identification [15.356786390476591]
身体のランドマーク情報を明示的に活用して埋め込み学習を改善することを提案する。
ボディランドマークは、信頼性ヒートマップとしてCNNの入力に提供される。
提案手法を,大規模合成データセットと小型実データセットで評価した。
論文 参考訳(メタデータ) (2020-01-09T01:31:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。