論文の概要: MHAFF: Multi-Head Attention Feature Fusion of CNN and Transformer for Cattle Identification
- arxiv url: http://arxiv.org/abs/2501.05209v1
- Date: Thu, 09 Jan 2025 13:00:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-10 13:59:05.352147
- Title: MHAFF: Multi-Head Attention Feature Fusion of CNN and Transformer for Cattle Identification
- Title(参考訳): MHAFF:牛の識別のためのCNNとトランスフォーマーのマルチヘッド注意機能融合
- Authors: Rabin Dulal, Lihong Zheng, Muhammad Ashad Kabir,
- Abstract要約: 本研究は,牛の識別において,MHAFF(Multi-Head Attention Feature Fusion)と呼ばれる新しいアプローチを導入する。
MHAFFは、その独自性を保ちながら、異なるタイプのハウジング機能間の関係をキャプチャする。
実験により、MHAFFは2つの公開された牛のデータセットの精度において、追加および連結技術および既存の牛の識別方法よりも優れた性能を示した。
- 参考スコア(独自算出の注目度): 1.2908381408981724
- License:
- Abstract: Convolutional Neural Networks (CNNs) have drawn researchers' attention to identifying cattle using muzzle images. However, CNNs often fail to capture long-range dependencies within the complex patterns of the muzzle. The transformers handle these challenges. This inspired us to fuse the strengths of CNNs and transformers in muzzle-based cattle identification. Addition and concatenation have been the most commonly used techniques for feature fusion. However, addition fails to preserve discriminative information, while concatenation results in an increase in dimensionality. Both methods are simple operations and cannot discover the relationships or interactions between fusing features. This research aims to overcome the issues faced by addition and concatenation. This research introduces a novel approach called Multi-Head Attention Feature Fusion (MHAFF) for the first time in cattle identification. MHAFF captures relations between the different types of fusing features while preserving their originality. The experiments show that MHAFF outperformed addition and concatenation techniques and the existing cattle identification methods in accuracy on two publicly available cattle datasets. MHAFF demonstrates excellent performance and quickly converges to achieve optimum accuracy of 99.88% and 99.52% in two cattle datasets simultaneously.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)は、銃口画像を用いた牛の識別に研究者の注意を引き付けている。
しかし、CNNは銃口の複雑なパターンの中で長距離の依存関係をキャプチャできないことが多い。
トランスフォーマーはこれらの課題に対処します。
これによって私たちは、銃口をベースとした牛の識別において、CNNとトランスフォーマーの強みを融合させました。
付加と結合は、機能融合の最も一般的な技術である。
しかし、付加は識別情報の保存に失敗し、連結は次元の増大をもたらす。
どちらの手法も単純な操作であり、融合する特徴間の関係や相互作用を発見できない。
本研究は,追加と連結が直面する課題を克服することを目的としている。
本研究は、牛の識別において初めてMHAFF(Multi-Head Attention Feature Fusion)と呼ばれる新しいアプローチを導入する。
MHAFFは、その独自性を保ちながら、異なるタイプのハウジング機能間の関係をキャプチャする。
実験の結果、MHAFFは2種類の牛のデータセットの精度において、追加・連結技術および既存の牛の識別方法よりも優れた性能を示した。
MHAFFは優れた性能を示し、2頭の牛のデータセットで99.88%と99.52%の最適な精度を達成するために迅速に収束する。
関連論文リスト
- Multi-scale Quaternion CNN and BiGRU with Cross Self-attention Feature Fusion for Fault Diagnosis of Bearing [5.3598912592106345]
深層学習は断層診断(FD)に著しい進歩をもたらした
マルチスケール畳み込み畳み込みニューラルネットワーク(MQCNN)、双方向ゲートリカレントユニット(BiG)、クロス自己注意機能融合(CSAFF)を統合した新しいFDモデルを提案する。
論文 参考訳(メタデータ) (2024-05-25T07:55:02Z) - Mutual-Guided Dynamic Network for Image Fusion [51.615598671899335]
画像融合のための新しい相互誘導動的ネットワーク(MGDN)を提案する。
5つのベンチマークデータセットによる実験結果から,提案手法は4つの画像融合タスクにおいて既存手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-08-24T03:50:37Z) - AMatFormer: Efficient Feature Matching via Anchor Matching Transformer [34.08771267009364]
本稿では,特徴マッチング問題に対する効率的なアンカーマッチング変換器 (AMatFormer) を提案する。
AMatFormerには2つの主な側面がある。 まず、主にアンカー機能に対して自己/クロスアテンションを実行し、これらのアンカー機能をメッセージボトルネックとして活用する。
いくつかのベンチマークの実験では、提案したAMatFormerマッチング手法の有効性と効率が示されている。
論文 参考訳(メタデータ) (2023-05-30T16:54:10Z) - FF2: A Feature Fusion Two-Stream Framework for Punctuation Restoration [27.14686854704104]
句読点復元のためのFeature Fusion two-stream framework (FF2)を提案する。
具体的には、あるストリームは、事前訓練された言語モデルを利用してセマンティック機能をキャプチャし、別の補助モジュールは、手元にある機能をキャプチャする。
追加データなしでは、人気のあるベンチマークIWSLTの実験結果はFF2が新しいSOTA性能を達成することを実証している。
論文 参考訳(メタデータ) (2022-11-09T06:18:17Z) - MIXER: Multiattribute, Multiway Fusion of Uncertain Pairwise Affinities [45.00178262932004]
本稿では,不確実なペア親和性を直接処理できるマルチウェイ融合アルゴリズムを提案する。
最初のペア関係を必要とする既存の作業とは対照的に、我々のMIXERアルゴリズムはペア親和性によって提供される付加情報を活用することにより精度を向上する。
論文 参考訳(メタデータ) (2022-10-15T19:19:57Z) - Multi-scale Feature Aggregation for Crowd Counting [84.45773306711747]
マルチスケール特徴集約ネットワーク(MSFANet)を提案する。
MSFANetは、ショートアグリゲーション(ShortAgg)とスキップアグリゲーション(SkipAgg)の2つの機能アグリゲーションモジュールで構成されている。
論文 参考訳(メタデータ) (2022-08-10T10:23:12Z) - HAT: Hierarchical Aggregation Transformers for Person Re-identification [87.02828084991062]
我々は,CNNとトランスフォーマーの両方の利点を,高性能な画像ベース人物Re-IDに適用する。
作業は、画像ベースのRe-IDのためのCNNとTransformerの両方の利点を初めて活用する。
論文 参考訳(メタデータ) (2021-07-13T09:34:54Z) - Semantic Correspondence with Transformers [68.37049687360705]
本稿では,変換器を用いたコストアグリゲーション(CAT)を提案し,意味論的に類似した画像間の密接な対応を見出す。
初期相関マップと多レベルアグリゲーションを曖昧にするための外観親和性モデリングを含む。
提案手法の有効性を示す実験を行い,広範囲にわたるアブレーション研究を行った。
論文 参考訳(メタデータ) (2021-06-04T14:39:03Z) - Unveiling Anomalous Edges and Nominal Connectivity of Attributed
Networks [53.56901624204265]
本研究では、相補的な強さを持つ2つの異なる定式化を用いて、属性グラフの異常なエッジを明らかにする。
まず、グラフデータマトリックスを低ランクとスパースコンポーネントに分解することで、パフォーマンスを著しく向上させる。
第2は、乱れのないグラフを頑健に復元することにより、第1のスコープを広げ、異常識別性能を高める。
論文 参考訳(メタデータ) (2021-04-17T20:00:40Z) - Transformer Tracking [76.96796612225295]
相関は追跡分野において、特に人気のあるシャム系トラッカーにおいて重要な役割を果たす。
本研究は,注意のみを用いてテンプレートと検索領域を効果的に結合した,新しい注意型特徴融合ネットワークを提案する。
実験により、TransTは6つの挑戦的なデータセットで非常に有望な結果が得られます。
論文 参考訳(メタデータ) (2021-03-29T09:06:55Z) - Domain Siamese CNNs for Sparse Multispectral Disparity Estimation [15.065764374430783]
そこで本研究では,異なるスペクトルの画像間の不均一性を推定できる新しいCNNアーキテクチャを提案する。
LITIV 2014およびLITIV 2018データセットを用いて実験を行った。
論文 参考訳(メタデータ) (2020-04-30T20:29:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。