論文の概要: Multi-Object Tracking Consistently Improves Wildlife Inference
- arxiv url: http://arxiv.org/abs/2605.16672v1
- Date: Fri, 15 May 2026 22:13:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:46.903049
- Title: Multi-Object Tracking Consistently Improves Wildlife Inference
- Title(参考訳): マルチオブジェクトトラッキングは、野生生物の推論を継続的に改善する
- Authors: Mufhumudzi Muthivhi, Jiahao Huo, Fredrik Gustafsson, Terence L. van Zyl,
- Abstract要約: 本研究では,野生生物分類モデルから推定された予測を増大させるため,カメラトラップデータの時間的特性を利用する。
我々は、連続するフレーム間で検出をリンクするために、複数の標準マルチオブジェクト追跡(MOT)モデルを採用する。
融合確率スコアは、ノイズによる誤分類をオーバーライドする単一のコンセンサスクラスラベル推定を生成する。
- 参考スコア(独自算出の注目度): 4.13115026589334
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Camera traps have become a common tool for wildlife monitoring efforts in ecological research and biodiversity conservation. Wildlife classification models have benefited from the increase in wildlife visual data. These models reach high levels of accuracy on curated, high-quality datasets. However, their performance remains sensitive to real-world environmental constraints. They often produce inconsistent predictions when performing inference on temporally coherent sequences. The predicted label for a single individual shifts rapidly between frames. This study exploits the temporal nature of camera-trap data to augment inferred predictions from a wildlife classification model. Specifically, we adopt several standard Multi-Object Tracking (MOT) models to link detections across consecutive frames. The curated trajectories are used to fuse the softmax class probabilities. The fused probability score produces a single consensus class label estimate that overrides misclassifications caused by noise. The analysis of the experimental results shows that our proposed strategy improves over a standalone classifier over all datasets and for each metric. Specifically, the best-performing MOT models gain a weighted F1-Score of 5.1%, 3.1% and 2.0% over the classifier across three MOT datasets.
- Abstract(参考訳): カメラトラップは、生態研究や生物多様性保全における野生生物モニタリングの一般的なツールとなっている。
野生生物分類モデルは、野生生物の視覚データの増加の恩恵を受けている。
これらのモデルは、キュレートされた高品質データセット上で高いレベルの精度に達する。
しかし、その性能は実際の環境制約に敏感である。
時間的コヒーレントなシーケンスで推論を行うとき、しばしば矛盾した予測を生成する。
予測された個々のラベルは、フレーム間で急速にシフトする。
本研究では,野生生物分類モデルから推定された予測を増大させるため,カメラトラップデータの時間的特性を利用する。
具体的には、連続するフレーム間の検出をリンクするために、複数の標準マルチオブジェクト追跡(MOT)モデルを採用する。
硬化した軌道はソフトマックスクラスの確率を融合するために使用される。
融合確率スコアは、ノイズによる誤分類をオーバーライドする単一のコンセンサスクラスラベル推定を生成する。
実験結果から,提案手法は,すべてのデータセットおよび各メトリックに対して,スタンドアロンの分類器よりも改善されていることが示された。
特に、最高のパフォーマンスのMOTモデルは、3つのMOTデータセットで分類器よりも5.1%、3.1%、2.0%の重み付きF1スコアを得る。
関連論文リスト
- Toward Optimal Sampling Rate Selection and Unbiased Classification for Precise Animal Activity Recognition [10.741458442311362]
個人ビヘイビア・アウェア・ネットワーク (IBA-Net) は、個人ビヘイビア・アウェア・ネットワーク (IBA-Net) である。
IBA-Netは複数のサンプリングレートからデータを抽出し、様々な動物の行動に合わせてカスタマイズされた特徴をキャプチャする。
我々は,ヤギ,牛,馬の行動認識に関する3つの公開データセットの実験を行った。
論文 参考訳(メタデータ) (2026-04-01T06:02:58Z) - Zero-Shot Wildlife Sorting Using Vision Transformers: Evaluating Clustering and Continuous Similarity Ordering [0.0]
カメラトラップは何百万もの野生生物の画像を生成するが、多くのデータセットには既存の分類器にはない種が含まれている。
本研究は、自己監督型視覚変換器を用いて、ラベルなし野生生物画像の整理のためのゼロショットアプローチを評価する。
論文 参考訳(メタデータ) (2025-10-16T11:59:18Z) - PoseBench: Benchmarking the Robustness of Pose Estimation Models under Corruptions [57.871692507044344]
ポース推定は、単眼画像を用いて人や動物の解剖学的キーポイントを正確に同定することを目的としている。
現在のモデルは一般的に、クリーンなデータに基づいてトレーニングされ、テストされる。
実世界の腐敗に対するポーズ推定モデルの堅牢性を評価するためのベンチマークであるPoseBenchを紹介する。
論文 参考訳(メタデータ) (2024-06-20T14:40:17Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - t-RAIN: Robust generalization under weather-aliasing label shift attacks [0.0]
自動車のマルチウェザー分類におけるラベルシフトの影響を解析する。
大規模生成モデルを用いた合成データ拡張のための類似度マッピング手法としてt-RAINを提案する。
本稿では,82.69 AP (雪) と62.31 AP (霧) が最適である実地および合成気象領域の歩行者検出結果について述べる。
論文 参考訳(メタデータ) (2023-05-15T02:05:56Z) - OOD-CV-v2: An extended Benchmark for Robustness to Out-of-Distribution
Shifts of Individual Nuisances in Natural Images [59.51657161097337]
OOD-CV-v2は、ポーズ、形状、テクスチャ、コンテキスト、気象条件の10のオブジェクトカテゴリのアウト・オブ・ディストリビューションの例を含むベンチマークデータセットである。
この新たなデータセットに加えて、一般的なベースライン手法を用いた広範な実験にも貢献する。
論文 参考訳(メタデータ) (2023-04-17T20:39:25Z) - Better May Not Be Fairer: A Study on Subgroup Discrepancy in Image
Classification [73.87160347728314]
CIFAR10とCIFAR100のテストセットを各画像の背景色に基づいてサブグループにアノテートすることで、自然背景色が刺激的な特徴としてどのように機能するかを検討する。
全体としての人間レベルの精度は、一貫したサブグループ性能を保証せず、この現象はImageNetで事前訓練されたモデルやデータ拡張後のモデルでも継続している。
実験の結果,FlowAugはCIFAR10/100およびCIFAR10/100-C上で,他のDA法よりも一貫したサブグループ結果が得られることがわかった。
論文 参考訳(メタデータ) (2022-12-16T18:51:10Z) - SuperAnimal pretrained pose estimation models for behavioral analysis [42.206265576708255]
行動の定量化は神経科学、獣医学、動物保護活動など様々な応用において重要である。
我々は、SuperAnimalと呼ばれる新しい手法で統一基盤モデルを開発するための一連の技術革新を提案する。
論文 参考訳(メタデータ) (2022-03-14T18:46:57Z) - Ensembles of Vision Transformers as a New Paradigm for Automated
Classification in Ecology [0.0]
データ効率のよい画像変換器(DeiTs)のアンサンブルが従来のSOTA(SOTA)よりも大幅に優れていたことを示す。
テストしたすべてのデータセットに対して、新しいSOTAを実現し、以前のSOTAの18.48%から87.50%の誤差を削減した。
論文 参考訳(メタデータ) (2022-03-03T14:16:22Z) - X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。
両世界の力を生かすために,我々は新しいX-モデルを提案する。
X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文 参考訳(メタデータ) (2021-10-09T13:56:48Z) - Evaluating Prediction-Time Batch Normalization for Robustness under
Covariate Shift [81.74795324629712]
我々は予測時間バッチ正規化と呼び、共変量シフト時のモデル精度とキャリブレーションを大幅に改善する。
予測時間バッチ正規化は、既存の最先端アプローチに相補的な利点をもたらし、ロバスト性を向上させることを示します。
この手法は、事前トレーニングと併用して使用すると、さまざまな結果が得られるが、より自然なタイプのデータセットシフトでは、パフォーマンスが良くないようだ。
論文 参考訳(メタデータ) (2020-06-19T05:08:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。