論文の概要: Temporal Flow Mask Attention for Open-Set Long-Tailed Recognition of
Wild Animals in Camera-Trap Images
- arxiv url: http://arxiv.org/abs/2208.14625v1
- Date: Wed, 31 Aug 2022 04:15:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-01 13:03:19.539360
- Title: Temporal Flow Mask Attention for Open-Set Long-Tailed Recognition of
Wild Animals in Camera-Trap Images
- Title(参考訳): カメラトトラップ画像における野生動物のオープンセット長期認識のための時流マスク注意
- Authors: Jeongsoo Kim, Sangmin Woo, Byeongjun Park, Changick Kim
- Abstract要約: 本稿では,時間的フローマスク注意ネットワークを提案し,オープンセットの長周期認識問題に対処する。
我々は,光フローモジュールを用いて時系列フレームの時間的特徴を抽出し,注意残差ブロックを用いて情報表現を学習する。
メタ埋め込み技術を適用することで、オープンセット長尾認識における手法の性能が向上することを示す。
- 参考スコア(独自算出の注目度): 21.473296246163443
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Camera traps, unmanned observation devices, and deep learning-based image
recognition systems have greatly reduced human effort in collecting and
analyzing wildlife images. However, data collected via above apparatus exhibits
1) long-tailed and 2) open-ended distribution problems. To tackle the open-set
long-tailed recognition problem, we propose the Temporal Flow Mask Attention
Network that comprises three key building blocks: 1) an optical flow module, 2)
an attention residual module, and 3) a meta-embedding classifier. We extract
temporal features of sequential frames using the optical flow module and learn
informative representation using attention residual blocks. Moreover, we show
that applying the meta-embedding technique boosts the performance of the method
in open-set long-tailed recognition. We apply this method on a Korean
Demilitarized Zone (DMZ) dataset. We conduct extensive experiments, and
quantitative and qualitative analyses to prove that our method effectively
tackles the open-set long-tailed recognition problem while being robust to
unknown classes.
- Abstract(参考訳): カメラトラップ、無人観測装置、ディープラーニングベースの画像認識システムは、野生動物画像の収集と分析における人間の労力を大幅に削減した。
しかし 上記装置で収集したデータは
1)長い尾と
2) 開放分布問題
オープンセットのロングテール認識問題に取り組むために,3つのキービルディングブロックからなるテンポラルフローマスクアテンションネットワークを提案する。
1)光フローモジュール、
2) 注意残余モジュール,及び
3)メタ埋め込み分類器。
光フローモジュールを用いて逐次フレームの時間的特徴を抽出し,注意残差ブロックを用いて情報表現を学習する。
さらに,メタ埋め込み技術の適用により,オープンセット長周期認識における手法の性能が向上することを示す。
この手法を韓国非武装地帯(dmz)データセットに適用する。
提案手法が未知のクラスに頑健なまま,オープンセットのロングテール認識問題に効果的に取り組むことを証明するため,広範囲な実験と定量的・定性的な分析を行った。
関連論文リスト
- Improving Object Detection for Time-Lapse Imagery Using Temporal Features in Wildlife Monitoring [0.5580662655439501]
時間経過シーケンスの単一フレームにおける対象検出器の性能は,前フレームからの時間的特徴を含めることで向上できることを示す。
シーンの静止要素と非静止要素をキャプチャする2つの追加空間特徴チャネルを統合することで、時間情報を活用する手法を提案する。
論文 参考訳(メタデータ) (2024-12-20T20:37:09Z) - Flow-Attention-based Spatio-Temporal Aggregation Network for 3D Mask
Detection [12.160085404239446]
本稿では,FASTENと呼ばれる新しい3次元マスク検出フレームワークを提案する。
ネットワークが大きな動きの細部に集中するように調整することで、余分な時間的特徴干渉を排除できる。
FASTENは5フレームの入力しか必要とせず、データ内評価とクロスデータセット評価の両方で8つの競合より優れている。
論文 参考訳(メタデータ) (2023-10-25T11:54:21Z) - Free-ATM: Exploring Unsupervised Learning on Diffusion-Generated Images
with Free Attention Masks [64.67735676127208]
テキストと画像の拡散モデルは、画像認識の恩恵を受ける大きな可能性を示している。
有望ではあるが、拡散生成画像の教師なし学習に特化した調査は不十分である。
上記フリーアテンションマスクをフル活用することで、カスタマイズされたソリューションを導入する。
論文 参考訳(メタデータ) (2023-08-13T10:07:46Z) - Motion-inductive Self-supervised Object Discovery in Videos [99.35664705038728]
本稿では,連続的なRGBフレームの処理モデルを提案し,層状表現を用いて任意のフレーム間の光の流れを推定する。
3つの公開ビデオセグメンテーションデータセットにおいて,従来の最先端手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-10-01T08:38:28Z) - Active Gaze Control for Foveal Scene Exploration [124.11737060344052]
本研究では,葉型カメラを用いた人間とロボットが現場を探索する方法をエミュレートする手法を提案する。
提案手法は,同数の視線シフトに対してF1スコアを2~3ポイント増加させる。
論文 参考訳(メタデータ) (2022-08-24T14:59:28Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Learnable Multi-level Frequency Decomposition and Hierarchical Attention
Mechanism for Generalized Face Presentation Attack Detection [7.324459578044212]
顔提示攻撃検知(PAD)は多くの注目を集めており、顔認識システムを保護する上で重要な役割を果たしている。
両ストリーム畳み込みニューラルネットワーク(CNN)フレームワークを提案する。
ステップワイドアブレーション研究において提案したPAD法の設計を実証した。
論文 参考訳(メタデータ) (2021-09-16T13:06:43Z) - Detection of Deepfake Videos Using Long Distance Attention [73.6659488380372]
既存のほとんどの検出方法は、問題をバニラ二項分類問題として扱う。
本稿では,偽顔と実顔の相違が非常に微妙であるため,特にきめ細かな分類問題として扱われる。
大域的な視点で空間的・時間的偽の痕跡を捉えるための2つの要素を持つ時空間モデルを提案する。
論文 参考訳(メタデータ) (2021-06-24T08:33:32Z) - Self-Supervised Multi-Frame Monocular Scene Flow [61.588808225321735]
自己監督学習に基づくマルチフレーム一眼的シーンフローネットワークを導入。
自己監督学習に基づく単眼的シーンフロー法における最新の精度を観察する。
論文 参考訳(メタデータ) (2021-05-05T17:49:55Z) - Automatic Detection and Recognition of Individuals in Patterned Species [4.163860911052052]
我々は,異なるパターンの個体の自動検出と認識のための枠組みを開発する。
我々は最近提案したFaster-RCNNオブジェクト検出フレームワークを用いて画像中の動物を効率的に検出する。
我々は,シマウマおよびジャガー画像の認識システムを評価し,他のパターンの種への一般化を示す。
論文 参考訳(メタデータ) (2020-05-06T15:29:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。