論文の概要: When Multi-Sensor Fusion Fails to Generalize: Cattle Posture Classification Under Animal-Level and Temporal Distribution Shift
- arxiv url: http://arxiv.org/abs/2606.24986v1
- Date: Tue, 23 Jun 2026 14:24:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 17:05:30.082443
- Title: When Multi-Sensor Fusion Fails to Generalize: Cattle Posture Classification Under Animal-Level and Temporal Distribution Shift
- Title(参考訳): 多センサフュージョンが一般化に失敗したとき--動物レベルおよび時間分布シフト下における牛の姿勢分類
- Authors: Leutrim Uka, Severino Pinto, Gundula Hoffmann, Marina M. -C. Höhne,
- Abstract要約: 首輪加速度計,ラムボルスセンサ,環境計測を用いた自動姿勢分類の堅牢性を評価した。
疲労解析の結果, 予測性能が低下しても, 放射能と環境変数に持続的依存が認められた。
- 参考スコア(独自算出の注目度): 4.350116685056747
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated cattle posture-classification systems frequently report near-perfect accuracy, yet their robustness under realistic deployment conditions remains largely unknown. In particular, it is unclear whether multimodal sensor fusion improves generalisation or leads models to rely on context-specific signals that fail under distribution shift. Here, we evaluate the robustness of automated posture classification (lying versus standing) using collar accelerometers, rumen-bolus sensors, and environmental measurements collected from a pasture-based beef cattle herd across two consecutive years (2024-2025). XGBoost served as the primary model, with Logistic Regression, Random Forest, and Long Short-Term Memory networks evaluated as comparative baselines. Model robustness was assessed under progressively more stringent evaluation protocols, ranging from conventional random train-test splits to leave-one-animal-out validation and cross-year evaluation on an independent cohort of previously unseen animals recorded one year later. While multimodal models achieved strong within-year performance (macro-F1 0.94), the performance declined substantially under cross-year evaluation (macro-F1 0.49). Explainability analysis revealed persistent reliance on rumen-bolus activity and environmental variables even when predictive performance deteriorated. Distribution-shift diagnostics further confirmed substantial differences in feature distributions between recording years. Our findings demonstrate that commonly used evaluation protocols can substantially overestimate real-world performance and that multimodal sensor fusion may reduce, rather than improve, robustness under temporal distribution shift. More broadly, the results highlight that benchmark accuracy alone is insufficient to assess deployment readiness and underscore the need for robustness-centred evaluation in livestock-monitoring research.
- Abstract(参考訳): 自動姿勢分類システムは、ほぼ完全な精度をしばしば報告するが、現実的な展開条件下での堅牢性はほとんど不明である。
特に、マルチモーダルセンサフュージョンが一般化を改善したのか、あるいは分布シフト時に失敗するコンテキスト特異的信号に依存しているのかは不明確である。
そこで本研究では,2年連続(2024~2025年)で飼育された牧畜牛の姿勢自動分類(立位と立位)のロバスト性について検討した。
XGBoostは、ロジスティック回帰、ランダムフォレスト、Long Short-Term Memory Networkを比較ベースラインとして評価し、主要なモデルとして機能した。
モデルロバスト性は、従来のランダムな列車試験の分割から1年後に記録された未確認動物の独立したコホートに対する1年間の検証まで、徐々に厳密な評価プロトコルの下で評価された。
マルチモーダルモデルは年内性能(macro-F1 0.94)に優れていたが、クロス年次評価(macro-F1 0.49)では性能が大幅に低下した。
説明可能性分析の結果, 予測性能が低下しても, 反響活動と環境変数に持続的依存が認められた。
分布変化診断により,記録年数と特徴量に有意な差が認められた。
本研究は, 実世界の性能を著しく過大評価し, 時間分布シフトによる堅牢性の向上よりも, マルチモーダルセンサの融合を低減できることを示した。
より広範に、ベンチマークの精度だけでは、展開の準備性を評価するには不十分であり、家畜モニタリング研究における堅牢性中心評価の必要性を浮き彫りにしている。
関連論文リスト
- Adversarial Vulnerability Under Temporal Concept Drift: A Longitudinal Study of Android Malware Detection [10.05900892533264]
われわれは,10年以上にわたるAndroidアプリケーションにおいて,長手なドリフト認識による敵の堅牢性の評価を行った。
クリーンパフォーマンスの計測、ASR(Adversarial Accuracy)、ASR(Attack Success Rate)、時間リンクメトリクスの導入などを行う。
その結果, 時間的分離は, 評価された移動型特徴空間設定下での対向ロバスト性低下と関連していることがわかった。
論文 参考訳(メタデータ) (2026-05-22T13:29:45Z) - Reasoning or Memorization? Unreliable Results of Reinforcement Learning Due to Data Contamination [67.67725938962798]
大規模なWebスケールコーパスの事前トレーニングは、広く使用されているベンチマークでデータ汚染の影響を受けやすいQwen2.5が残る。
我々はRandomCalculationと呼ばれる任意の長さと難易度を持つ完全クリーンな算術問題を生成するジェネレータを導入する。
精度の高い報酬信号のみがベースモデルの性能境界を超える安定した改善をもたらすことを示す。
論文 参考訳(メタデータ) (2025-07-14T17:55:15Z) - A multi-head deep fusion model for recognition of cattle foraging events using sound and movement signals [0.2450783418670958]
この研究は、音響信号と慣性信号の融合に基づくディープニューラルネットワークを導入する。
このモデルの主な利点は、それぞれから独立して特徴の自動抽出による信号の組み合わせである。
論文 参考訳(メタデータ) (2025-05-15T11:55:16Z) - GREAT Score: Global Robustness Evaluation of Adversarial Perturbation using Generative Models [60.48306899271866]
GREATスコア(GREAT Score)と呼ばれる新しいフレームワークを提案する。
我々は,ロバストベンチにおける攻撃ベースモデルと比較し,高い相関性を示し,GREATスコアのコストを大幅に削減した。
GREAT Scoreは、プライバシーに敏感なブラックボックスモデルのリモート監査に使用することができる。
論文 参考訳(メタデータ) (2023-04-19T14:58:27Z) - Semi-Supervised Deep Regression with Uncertainty Consistency and
Variational Model Ensembling via Bayesian Neural Networks [31.67508478764597]
我々は,半教師付き回帰,すなわち不確実連続変分モデル組立(UCVME)に対する新しいアプローチを提案する。
整合性損失は不確実性評価を著しく改善し,不整合回帰の下では,高品質な擬似ラベルをより重要視することができる。
実験の結果,本手法は様々なタスクにおける最先端の代替手段よりも優れており,フルラベルを用いた教師付き手法と競合する可能性が示唆された。
論文 参考訳(メタデータ) (2023-02-15T10:40:51Z) - Generalizability of Adversarial Robustness Under Distribution Shifts [57.767152566761304]
本研究は, 実証的, 証明された敵対的堅牢性間の相互作用と, ドメインの一般化を両立させるための第一歩を踏み出した。
複数のドメインでロバストモデルをトレーニングし、その正確性とロバスト性を評価する。
本研究は, 現実の医療応用をカバーするために拡張され, 敵の増大は, クリーンデータ精度に最小限の影響を伴って, 強靭性の一般化を著しく促進する。
論文 参考訳(メタデータ) (2022-09-29T18:25:48Z) - Semantic Self-adaptation: Enhancing Generalization with a Single Sample [45.111358665370524]
セマンティックセグメンテーションのための自己適応型アプローチを提案する。
整合正則化を用いて畳み込み層のパラメータを入力画像に微調整する。
実験により, 自己適応は訓練時のモデル正規化の確立した実践を補完する可能性が示唆された。
論文 参考訳(メタデータ) (2022-08-10T12:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。