論文の概要: Adaptive High-Frequency Transformer for Diverse Wildlife Re-Identification
- arxiv url: http://arxiv.org/abs/2410.06977v1
- Date: Fri, 25 Oct 2024 14:13:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-31 23:17:37.981680
- Title: Adaptive High-Frequency Transformer for Diverse Wildlife Re-Identification
- Title(参考訳): 広帯域野生生物再同定のための適応高周波変圧器
- Authors: Chenyue Li, Shuoyi Chen, Mang Ye,
- Abstract要約: Wildlife ReIDは視覚技術を利用して、異なるシナリオで野生動物の特定の個人を特定する。
野生生物ReIDのための統合された多種多種汎用フレームワークを提案する。
- 参考スコア(独自算出の注目度): 33.0352672906987
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Wildlife ReID involves utilizing visual technology to identify specific individuals of wild animals in different scenarios, holding significant importance for wildlife conservation, ecological research, and environmental monitoring. Existing wildlife ReID methods are predominantly tailored to specific species, exhibiting limited applicability. Although some approaches leverage extensively studied person ReID techniques, they struggle to address the unique challenges posed by wildlife. Therefore, in this paper, we present a unified, multi-species general framework for wildlife ReID. Given that high-frequency information is a consistent representation of unique features in various species, significantly aiding in identifying contours and details such as fur textures, we propose the Adaptive High-Frequency Transformer model with the goal of enhancing high-frequency information learning. To mitigate the inevitable high-frequency interference in the wilderness environment, we introduce an object-aware high-frequency selection strategy to adaptively capture more valuable high-frequency components. Notably, we unify the experimental settings of multiple wildlife datasets for ReID, achieving superior performance over state-of-the-art ReID methods. In domain generalization scenarios, our approach demonstrates robust generalization to unknown species.
- Abstract(参考訳): 野生生物ReIDは、視覚技術を利用して異なるシナリオで野生動物の特定の個人を特定することを含み、野生生物の保護、生態研究、環境モニタリングにおいて重要な役割を担っている。
現存する野生生物のReID法は、主に特定の種に適合し、限定的な適用性を示す。
広く研究されているReID技術を活用するアプローチもあるが、野生生物がもたらす固有の課題に対処するのに苦労している。
そこで本稿では,野生生物ReIDのための統合された多種共通フレームワークを提案する。
高周波情報は多種多様な特徴を一貫した表現であり,輪郭や毛皮のテクスチャなどの細部を識別する上で重要な役割を担っていることを考慮し,高周波情報学習の促進を目的とした適応型高周波トランスフォーマーモデルを提案する。
荒野環境における必然的な高周波干渉を軽減するため,我々は,より価値のある高周波成分を適応的に捉えるために,オブジェクト対応の高周波選択戦略を導入する。
特に、ReIDのための複数の野生生物データセットの実験的設定を統一し、最先端のReID手法よりも優れた性能を実現する。
ドメイン一般化のシナリオでは、未知種への堅牢な一般化を示す。
関連論文リスト
- Towards Context-Rich Automated Biodiversity Assessments: Deriving AI-Powered Insights from Camera Trap Data [0.06819010383838325]
カメラトラップは生態研究において大きな新しい機会を提供する。
現在の自動画像解析手法は、影響のある保存結果をサポートするために必要な文脈的豊かさを欠いていることが多い。
本稿では、深層学習に基づく視覚と言語モデルを組み合わせて、カメラトラップのデータを用いた生態報告を改善するための統合的なアプローチを提案する。
論文 参考訳(メタデータ) (2024-11-21T15:28:52Z) - Generalization in birdsong classification: impact of transfer learning methods and dataset characteristics [2.6740633963478095]
大規模な鳥音分類における伝達学習の有効性について検討する。
実験により, 微調整蒸留と知識蒸留の双方で高い性能が得られた。
動物音コミュニティにおけるより包括的なラベリングの実践を提唱する。
論文 参考訳(メタデータ) (2024-09-21T11:33:12Z) - Understanding the Impact of Training Set Size on Animal Re-identification [36.37275024049744]
本研究では,種特異的な特徴,特に個体内変異が,訓練データ要求に顕著な影響を及ぼすことを示す。
ローカル機能とエンド・ツー・エンドの学習ベースのアプローチの利点を実証する。
論文 参考訳(メタデータ) (2024-05-24T23:15:52Z) - Addressing the Elephant in the Room: Robust Animal Re-Identification with Unsupervised Part-Based Feature Alignment [44.86310789545717]
動物型Re-IDは野生生物の保護に不可欠だが、人間型Re-IDと比較すると独特な課題に直面している。
本研究では,学習段階と評価段階の背景を体系的に除去する手法を提案することにより,背景バイアスに対処する。
本手法は,ATRW,YakReID-103,ELPephantsの3種の動物Re-IDデータセットにおいて優れた結果が得られる。
論文 参考訳(メタデータ) (2024-05-22T16:08:06Z) - An Open-World, Diverse, Cross-Spatial-Temporal Benchmark for Dynamic Wild Person Re-Identification [58.5877965612088]
人物再識別(ReID)は、データ駆動のディープラーニング技術のおかげで大きな進歩を遂げました。
既存のベンチマークデータセットには多様性がなく、これらのデータに基づいてトレーニングされたモデルは、動的なワイルドシナリオに対してうまく一般化できない。
OWDと呼ばれる新しいOpen-World, Diverse, Cross-Spatial-Temporalデータセットを開発した。
論文 参考訳(メタデータ) (2024-03-22T11:21:51Z) - Reviving the Context: Camera Trap Species Classification as Link Prediction on Multimodal Knowledge Graphs [31.22129440376567]
カメラトラップ画像に関連付けられた構造化コンテキストを利用して,カメラトラップにおける種分類タスクの分布外一般化を促進する。
野生動物の写真は、捕獲された時間と場所の詳細と、動物種に関する構造化された生物学的知識に関連付けられる。
マルチモーダル知識グラフにおけるリンク予測として種分類を変換する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-31T23:32:03Z) - Multimodal Foundation Models for Zero-shot Animal Species Recognition in
Camera Trap Images [57.96659470133514]
モーションアクティベートカメラトラップは、世界中の野生生物を追跡・監視するための効率的なツールである。
教師付き学習技術は、そのような画像を分析するためにうまく展開されているが、そのような訓練には専門家のアノテーションが必要である。
コストのかかるラベル付きデータへの依存を減らすことは、人間の労働力を大幅に減らした大規模野生生物追跡ソリューションを開発する上で、大きな可能性を秘めている。
論文 参考訳(メタデータ) (2023-11-02T08:32:00Z) - Wild Face Anti-Spoofing Challenge 2023: Benchmark and Results [73.98594459933008]
顔認証システム(FAS)は、顔認識システムの完全性を保護するための重要なメカニズムである。
この制限は、公開可能なFASデータセットの不足と多様性の欠如に起因する可能性がある。
制約のない環境で収集された大規模で多様なFASデータセットであるWild Face Anti-Spoofingデータセットを紹介した。
論文 参考訳(メタデータ) (2023-04-12T10:29:42Z) - Out-of-Domain Robustness via Targeted Augmentations [90.94290420322457]
領域外一般化のためのデータ拡張設計の原理を考察する。
線形設定に関する理論的解析により動機付けを行い,対象拡大を提案する。
その結果,OOD性能は3.2~15.2ポイント向上した。
論文 参考訳(メタデータ) (2023-02-23T08:59:56Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。