論文の概要: Temporal Shift -- Multi-Objective Loss Function for Improved Anomaly
Fall Detection
- arxiv url: http://arxiv.org/abs/2311.02863v1
- Date: Mon, 6 Nov 2023 04:29:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-07 15:25:05.962639
- Title: Temporal Shift -- Multi-Objective Loss Function for Improved Anomaly
Fall Detection
- Title(参考訳): 時間シフト --多目的損失関数による異常転倒検出の改善
- Authors: Stefan Denkovski, Shehroz S. Khan, Alex Mihailidis
- Abstract要約: 逐次フレームのウィンドウ内における将来のフレームと再構成フレームの両方を予測することを目的とした,Temporal Shiftと呼ばれる多目的損失関数を提案する。
異なるモデル間での大幅な改善により、このアプローチは広く採用され、フォール検出以外の他の設定での異常検出機能を改善する可能性がある。
- 参考スコア(独自算出の注目度): 3.813649699234981
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Falls are a major cause of injuries and deaths among older adults worldwide.
Accurate fall detection can help reduce potential injuries and additional
health complications. Different types of video modalities can be used in a home
setting to detect falls, including RGB, Infrared, and Thermal cameras. Anomaly
detection frameworks using autoencoders and their variants can be used for fall
detection due to the data imbalance that arises from the rarity and diversity
of falls. However, the use of reconstruction error in autoencoders can limit
the application of networks' structures that propagate information. In this
paper, we propose a new multi-objective loss function called Temporal Shift,
which aims to predict both future and reconstructed frames within a window of
sequential frames. The proposed loss function is evaluated on a
semi-naturalistic fall detection dataset containing multiple camera modalities.
The autoencoders were trained on normal activities of daily living (ADL)
performed by older adults and tested on ADLs and falls performed by young
adults. Temporal shift shows significant improvement to a baseline 3D
Convolutional autoencoder, an attention U-Net CAE, and a multi-modal neural
network. The greatest improvement was observed in an attention U-Net model
improving by 0.20 AUC ROC for a single camera when compared to reconstruction
alone. With significant improvement across different models, this approach has
the potential to be widely adopted and improve anomaly detection capabilities
in other settings besides fall detection.
- Abstract(参考訳): 転倒は、世界中の高齢者の怪我と死亡の主な原因である。
正確な転倒検出は、潜在的な怪我と追加の健康合併症を軽減するのに役立つ。
ホーム設定では、RGB、赤外線、サーマルカメラなど、さまざまなタイプのビデオモダリティを使用してフォールを検出することができる。
オートエンコーダとその変種を用いた異常検出フレームワークは、フォールの希少性と多様性から生じるデータ不均衡により、フォール検出に使用できる。
しかし、オートエンコーダにおける再構成エラーの使用は、情報を伝達するネットワーク構造の適用を制限することができる。
本稿では,シーケンシャルフレームのウィンドウ内における将来のフレームと再構成フレームの両方を予測することを目的とした,時間シフトと呼ばれる新しい多目的損失関数を提案する。
提案する損失関数は,複数のカメラモードを含む半自然的転倒検出データセット上で評価される。
オートエンコーダは,高齢者が行う日常生活の正常活動(adl)を訓練し,若年成人が行うadlおよび転倒実験を行った。
時間シフトは、ベースラインの3次元畳み込みオートエンコーダ、注意のu-net cae、マルチモーダルニューラルネットワークに著しい改善を示している。
最大の改善は、1台のカメラで1台のリコンストラクションのみと比較して0.20 AUC ROC改善したU-Netモデルで観測された。
異なるモデルにまたがる大幅な改善により、このアプローチは広く採用され、転倒検出以外の設定で異常検出機能を改善する可能性がある。
関連論文リスト
- Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Deep Learning-based Fall Detection Algorithm Using Ensemble Model of
Coarse-fine CNN and GRU Networks [7.624051346741515]
本研究では,大小の畳み込みニューラルネットワークとゲートリカレントユニットを組み合わせたアンサンブルモデルを提案する。
提案したモデルは、それぞれ92.54%、96.13%、94.26%のリコール、精度、Fスコアを達成する。
論文 参考訳(メタデータ) (2023-04-13T08:30:46Z) - Making Reconstruction-based Method Great Again for Video Anomaly
Detection [64.19326819088563]
ビデオの異常検出は重要な問題だが、難しい問題だ。
既存の再構成に基づく手法は、昔ながらの畳み込みオートエンコーダに依存している。
連続フレーム再構築のための新しいオートエンコーダモデルを提案する。
論文 参考訳(メタデータ) (2023-01-28T01:57:57Z) - Are we certain it's anomalous? [57.729669157989235]
時系列における異常検出は、高度に非線形な時間的相関のため、異常は稀であるため、複雑なタスクである。
本稿では,異常検出(HypAD)におけるハイパボリック不確実性の新しい利用法を提案する。
HypADは自己指導で入力信号を再構築する。
論文 参考訳(メタデータ) (2022-11-16T21:31:39Z) - Self-Supervised Masked Convolutional Transformer Block for Anomaly
Detection [122.4894940892536]
本稿では, 自己監督型マスク型畳み込み変圧器ブロック (SSMCTB) について述べる。
本研究では,従来の自己教師型予測畳み込み抑止ブロック(SSPCAB)を3次元マスク付き畳み込み層,チャンネルワイドアテンション用トランスフォーマー,およびハマーロスに基づく新たな自己教師型目標を用いて拡張する。
論文 参考訳(メタデータ) (2022-09-25T04:56:10Z) - Multi Visual Modality Fall Detection Dataset [4.00152916049695]
転倒は、世界中の高齢者の怪我による死亡の主な原因の1つだ。
効果的なフォールの検出は、合併症や怪我のリスクを減らすことができる。
しかし、通常のRGBカメラは照明条件やプライバシーの懸念によって影響を受ける。
論文 参考訳(メタデータ) (2022-06-25T21:54:26Z) - Memory-augmented Adversarial Autoencoders for Multivariate Time-series
Anomaly Detection with Deep Reconstruction and Prediction [4.033624665609417]
本稿では,時系列の非教師付き異常検出手法であるMemAAEを提案する。
2つの補完的プロキシタスク、再構築と予測を共同でトレーニングすることにより、複数のタスクによる異常検出が優れた性能を得ることを示す。
MemAAEは4つの公開データセットで総合F1スコアの0.90を達成し、最高のベースラインである0.02を上回っている。
論文 参考訳(メタデータ) (2021-10-15T18:29:05Z) - Robust Unsupervised Video Anomaly Detection by Multi-Path Frame
Prediction [61.17654438176999]
本稿では,フレーム予測と適切な設計による新規で頑健な非教師付きビデオ異常検出手法を提案する。
提案手法は,CUHK Avenueデータセット上で88.3%のフレームレベルAUROCスコアを得る。
論文 参考訳(メタデータ) (2020-11-05T11:34:12Z) - Motion and Region Aware Adversarial Learning for Fall Detection with
Thermal Imaging [8.110295985047278]
転倒検知のためのホームベースのカメラシステムは、しばしば人々のプライバシーを危険にさらす。
転倒はめったに起こらないため、クラス不均衡によるアルゴリズムの学習は簡単ではない。
熱画像を用いた対向フレームワーク内での転倒検出を異常検出として定式化する。
論文 参考訳(メタデータ) (2020-04-17T17:17:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。