論文の概要: Pig behavior dataset and Spatial-temporal perception and enhancement networks based on the attention mechanism for pig behavior recognition
- arxiv url: http://arxiv.org/abs/2503.09378v1
- Date: Wed, 12 Mar 2025 13:27:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-13 15:40:09.169704
- Title: Pig behavior dataset and Spatial-temporal perception and enhancement networks based on the attention mechanism for pig behavior recognition
- Title(参考訳): 豚行動認識の注意機構に基づく豚行動データセットと時空間知覚と強化ネットワーク
- Authors: Fangzheng Qi, Zhenjie Hou, En Lin, Xing Li, iuzhen Liang, Xinwen Zhou,
- Abstract要約: 本研究は,13頭のブタの行動を含むデータセットを提案する。
ネットワークは、時間知覚ネットワークと時間特徴強調ネットワークとから構成される。
本論文で確立したデータセットにおいて,提案モデルではMAPスコアが75.92%に達し,従来モデルよりも8.17%向上した。
- 参考スコア(独自算出の注目度): 7.705420069449437
- License:
- Abstract: The recognition of pig behavior plays a crucial role in smart farming and welfare assurance for pigs. Currently, in the field of pig behavior recognition, the lack of publicly available behavioral datasets not only limits the development of innovative algorithms but also hampers model robustness and algorithm optimization.This paper proposes a dataset containing 13 pig behaviors that significantly impact welfare.Based on this dataset, this paper proposes a spatial-temporal perception and enhancement networks based on the attention mechanism to model the spatiotemporal features of pig behaviors and their associated interaction areas in video data. The network is composed of a spatiotemporal perception network and a spatiotemporal feature enhancement network. The spatiotemporal perception network is responsible for establishing connections between the pigs and the key regions of their behaviors in the video data. The spatiotemporal feature enhancement network further strengthens the important spatial features of individual pigs and captures the long-term dependencies of the spatiotemporal features of individual behaviors by remodeling these connections, thereby enhancing the model's perception of spatiotemporal changes in pig behaviors. Experimental results demonstrate that on the dataset established in this paper, our proposed model achieves a MAP score of 75.92%, which is an 8.17% improvement over the best-performing traditional model. This study not only improces the accuracy and generalizability of individual pig behavior recognition but also provides new technological tools for modern smart farming. The dataset and related code will be made publicly available alongside this paper.
- Abstract(参考訳): 豚の行動認識は、豚のスマート農業と福祉保証において重要な役割を担っている。
現在、豚行動認識の分野では、革新的なアルゴリズムの開発だけでなく、ハマーモデルによる堅牢性やアルゴリズムの最適化にも限界があるが、本稿では、福祉に大きく影響する13の豚行動を含むデータセットを提案し、本データセットに基づいて、映像データにおける豚行動の時空間的特徴と関連する相互作用領域のモデル化に基づく空間的時間的知覚と強化ネットワークを提案する。
ネットワークは、時空間知覚ネットワークと時空間特徴強調ネットワークとから構成される。
時空間知覚ネットワークは、ビデオデータの中でブタと行動の重要領域との間の接続を確立する役割を担っている。
この時空間的特徴増強ネットワークは、個々の豚の重要な空間的特徴をさらに強化し、これらの関係を再構築することにより、個々の行動の時空間的特徴の長期的依存性を捉え、それによってブタの行動における時空間的変化に対するモデルの知覚を高める。
実験結果から,提案モデルではMAPスコアが75.92%であり,従来のモデルよりも8.17%向上していることがわかった。
本研究は,豚の行動認識の精度と一般化性を損なうだけでなく,近代的スマート農業のための新しい技術ツールも提供する。
データセットと関連するコードは、この論文と共に公開されます。
関連論文リスト
- Progressive Conservative Adaptation for Evolving Target Domains [76.9274842289221]
従来のドメイン適応は、典型的には、ソースドメインから定常ターゲットドメインに知識を転送する。
このような対象データに対する復元と適応は、時間とともに計算とリソース消費をエスカレートする。
我々は、進歩的保守的適応(PCAda)と呼ばれる、単純で効果的なアプローチを提案する。
論文 参考訳(メタデータ) (2024-02-07T04:11:25Z) - Real-Time Cattle Interaction Recognition via Triple-stream Network [3.3843451892622576]
牛の局在化ネットワークは、検出されたすべての牛から高品質な相互作用提案を出力する。
インタラクション認識ネットワークは、それらをトリプルストリームアーキテクチャでインタラクション認識ネットワークにフィードする。
論文 参考訳(メタデータ) (2022-09-06T06:31:09Z) - Skeletal Human Action Recognition using Hybrid Attention based Graph
Convolutional Network [3.261599248682793]
相対的距離と相対的角度情報に基づいて局所的注意マップをグローバルに拡張する適応型空間的注意層を提案する。
我々は,頭部,手,足を結ぶ新しい初期グラフ隣接行列を設計し,行動認識精度の点で目に見える改善点を示す。
提案モデルは,日常生活における人間活動の分野における大規模かつ挑戦的な2つのデータセットを用いて評価する。
論文 参考訳(メタデータ) (2022-07-12T12:22:21Z) - Beyond the Gates of Euclidean Space: Temporal-Discrimination-Fusions and
Attention-based Graph Neural Network for Human Activity Recognition [5.600003119721707]
ウェアラブルデバイスによるヒューマンアクティビティ認識(HAR)は、フィットネストラッキング、ウェルネススクリーニング、生活支援など多くの応用により、大きな関心を集めている。
従来のディープラーニング(DL)は、HARドメインのアートパフォーマンスの状態を規定している。
提案手法はグラフニューラルネットワーク(GNN)を用いて,入力表現を構造化し,サンプル間の関係性を利用する手法である。
論文 参考訳(メタデータ) (2022-06-10T03:04:23Z) - Dual-stream spatiotemporal networks with feature sharing for monitoring
animals in the home cage [0.9937939233206224]
ネットワーク全体で定期的にストリームを共同で共有する機能共有アプローチを導入する。
我々は、インセプションベースのネットワークのアンサンブルを用いて、86.47%の予測精度を実現する。
今後,非教師付き異常検出領域における行動分類における共有の有効性について検討する。
論文 参考訳(メタデータ) (2022-06-01T16:32:25Z) - Data-driven emergence of convolutional structure in neural networks [83.4920717252233]
識別タスクを解くニューラルネットワークが、入力から直接畳み込み構造を学習できることを示す。
データモデルを慎重に設計することにより、このパターンの出現は、入力の非ガウス的、高次局所構造によって引き起こされることを示す。
論文 参考訳(メタデータ) (2022-02-01T17:11:13Z) - Overcoming the Domain Gap in Contrastive Learning of Neural Action
Representations [60.47807856873544]
神経科学の基本的な目標は、神経活動と行動の関係を理解することである。
我々は,ハエが自然に生み出す行動からなる新しいマルチモーダルデータセットを作成した。
このデータセットと新しい拡張セットは、神経科学における自己教師あり学習手法の適用を加速することを約束します。
論文 参考訳(メタデータ) (2021-11-29T15:27:51Z) - Efficient Modelling Across Time of Human Actions and Interactions [92.39082696657874]
3つの畳み込みニューラルネットワーク(CNND)における現在の固定サイズの時間的カーネルは、入力の時間的変動に対処するために改善できると主張している。
我々は、アーキテクチャの異なるレイヤにまたがる機能の違いを強化することで、アクションのクラス間でどのようにうまく対処できるかを研究する。
提案手法は、いくつかのベンチマークアクション認識データセットで評価され、競合する結果を示す。
論文 参考訳(メタデータ) (2021-10-05T15:39:11Z) - Vision-based Behavioral Recognition of Novelty Preference in Pigs [1.837722971703011]
研究データの行動スコアリングは、ドメイン固有のメトリクスを抽出するために重要であるが、人間の労働力を用いて膨大な量の情報を分析する能力にボトルネックがある。
ディープラーニングは、このボトルネックを緩和するための重要な進歩として広く見なされている。
我々は,手動スコアリングのプロセスを緩和するために,ディープラーニングを活用できる分野を1つ同定する。
論文 参考訳(メタデータ) (2021-06-23T06:10:34Z) - Progressive Spatio-Temporal Bilinear Network with Monte Carlo Dropout
for Landmark-based Facial Expression Recognition with Uncertainty Estimation [93.73198973454944]
提案手法の性能は, 広く使用されている3つのデータセットで評価される。
ビデオベースの最先端の手法に匹敵するが、複雑さははるかに少ない。
論文 参考訳(メタデータ) (2021-06-08T13:40:30Z) - Muti-view Mouse Social Behaviour Recognition with Deep Graphical Model [124.26611454540813]
マウスの社会的行動分析は神経変性疾患の治療効果を評価する貴重なツールである。
マウスの社会行動の豊かな記述を創出する可能性から、ネズミの観察にマルチビュービデオ記録を使用することは、ますます注目を集めている。
本稿では,ビュー固有のサブ構造とビュー共有サブ構造を協調的に学習する,新しい多視点潜在意識・動的識別モデルを提案する。
論文 参考訳(メタデータ) (2020-11-04T18:09:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。