論文の概要: Anomaly Detection Using Computer Vision: A Comparative Analysis of Class Distinction and Performance Metrics
- arxiv url: http://arxiv.org/abs/2503.19100v1
- Date: Mon, 24 Mar 2025 19:36:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-26 16:51:52.505937
- Title: Anomaly Detection Using Computer Vision: A Comparative Analysis of Class Distinction and Performance Metrics
- Title(参考訳): コンピュータビジョンを用いた異常検出:クラス判別と性能指標の比較分析
- Authors: Md. Barkat Ullah Tusher, Shartaz Khan Akash, Amirul Islam Showmik,
- Abstract要約: 本研究は,OpenCVとディープラーニング技術を組み合わせたクラス区別と性能評価に焦点を当てた。
この制度は、権限のある人(管理者)、侵入者、非人間的存在の3つの階級を効果的に区別する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This paper showcases an experimental study on anomaly detection using computer vision. The study focuses on class distinction and performance evaluation, combining OpenCV with deep learning techniques while employing a TensorFlow-based convolutional neural network for real-time face recognition and classification. The system effectively distinguishes among three classes: authorized personnel (admin), intruders, and non-human entities. A MobileNetV2-based deep learning model is utilized to optimize real-time performance, ensuring high computational efficiency without compromising accuracy. Extensive dataset preprocessing, including image augmentation and normalization, enhances the models generalization capabilities. Our analysis demonstrates classification accuracies of 90.20% for admin, 98.60% for intruders, and 75.80% for non-human detection, while maintaining an average processing rate of 30 frames per second. The study leverages transfer learning, batch normalization, and Adam optimization to achieve stable and robust learning, and a comparative analysis of class differentiation strategies highlights the impact of feature extraction techniques and training methodologies. The results indicate that advanced feature selection and data augmentation significantly enhance detection performance, particularly in distinguishing human from non-human scenes. As an experimental study, this research provides critical insights into optimizing deep learning-based surveillance systems for high-security environments and improving the accuracy and efficiency of real-time anomaly detection.
- Abstract(参考訳): 本稿では,コンピュータビジョンを用いた異常検出実験について述べる。
この研究は、クラス区別と性能評価に焦点を当て、リアルタイムの顔認識と分類にTensorFlowベースの畳み込みニューラルネットワークを使用しながら、OpenCVとディープラーニング技術を組み合わせる。
この制度は、権限のある人(管理者)、侵入者、非人間的存在の3つの階級を効果的に区別する。
MobileNetV2ベースのディープラーニングモデルを用いて、リアルタイム性能を最適化し、精度を損なうことなく高い計算効率を確保する。
画像の拡張と正規化を含む大規模なデータセット前処理は、モデルの一般化機能を強化する。
本分析では, 管理者が90.20%, 侵入者が98.60%, 非人的検出が75.80%, 平均処理速度が30フレーム/秒であった。
本研究は, 伝達学習, バッチ正規化, およびアダム最適化を利用して, 安定かつ堅牢な学習を実現する。
その結果,高度な特徴選択とデータ拡張により検出性能が著しく向上することが示唆された。
本研究では,高セキュリティ環境におけるディープラーニングに基づく監視システムの最適化と,リアルタイム異常検出の精度と効率向上に関する重要な知見を提供する。
関連論文リスト
- L-WISE: Boosting Human Visual Category Learning Through Model-Based Image Selection and Enhancement [12.524893323311108]
画像の摂動は、人間が真実のクラスを正確に報告する能力を高めることができることを示す。
本研究では,人間の視覚的学習を,テスト時に人間の分類精度を向上させる方法で強化することを提案する。
論文 参考訳(メタデータ) (2024-12-12T23:57:01Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - Contrastive-Adversarial and Diffusion: Exploring pre-training and fine-tuning strategies for sulcal identification [3.0398616939692777]
対人学習、コントラスト学習、拡散認知学習、通常の再構成学習といった技術が標準となっている。
この研究は、ニューラルネットワークの学習プロセスを強化するために、事前学習技術と微調整戦略の利点を解明することを目的としている。
論文 参考訳(メタデータ) (2024-05-29T15:44:51Z) - Efficient Transferability Assessment for Selection of Pre-trained Detectors [63.21514888618542]
本稿では,事前学習対象検出器の効率的な伝達性評価について検討する。
我々は、事前訓練された検出器の大規模で多様な動物園を含む検出器転送性ベンチマークを構築した。
実験により,本手法は伝達性の評価において,他の最先端手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-03-14T14:23:23Z) - Efficient human-in-loop deep learning model training with iterative
refinement and statistical result validation [0.0]
本稿では,超音波イメージング機械学習パイプラインのデータクリーニングに必要なセグメンテーションを作成する方法を紹介する。
本研究では、自動生成したトレーニングデータと人間の視覚的チェックを高速に活用し、時間とコストを低く保ちながら、モデルの精度を向上させる4段階の手法を提案する。
本手法は、静的PHIを含む背景データを除去し、心臓超音波セグメンテーションタスクで実演する。
論文 参考訳(メタデータ) (2023-04-03T13:56:01Z) - Revisiting Classifier: Transferring Vision-Language Models for Video
Recognition [102.93524173258487]
ダウンストリームタスクのためのタスク非依存の深層モデルから知識を伝達することは、コンピュータビジョン研究において重要なトピックである。
本研究では,映像分類作業における知識の伝達に着目した。
予測された言語モデルを用いて、効率的な翻訳学習のための適切なセマンティックターゲットを生成する。
論文 参考訳(メタデータ) (2022-07-04T10:00:47Z) - How Facial Features Convey Attention in Stationary Environments [0.0]
本研究は,視覚的特徴が認知と疲労の予測に最も寄与する要因を分析することによって,従来の注意欠陥検出研究を拡大することを目的とする。
被験者の視覚データを様々なレベルの注意度で分析するために,オープンソースの顔分析ツールキットOpenFaceを利用した。
論文 参考訳(メタデータ) (2021-11-29T20:11:57Z) - On the Robustness of Pretraining and Self-Supervision for a Deep
Learning-based Analysis of Diabetic Retinopathy [70.71457102672545]
糖尿病網膜症における訓練方法の違いによる影響を比較検討した。
本稿では,定量的性能,学習した特徴表現の統計,解釈可能性,画像歪みに対する頑健性など,さまざまな側面について検討する。
以上の結果から,ImageNet事前学習モデルでは,画像歪みに対する性能,一般化,堅牢性が著しく向上していることが示唆された。
論文 参考訳(メタデータ) (2021-06-25T08:32:45Z) - Anomaly Detection in Cybersecurity: Unsupervised, Graph-Based and
Supervised Learning Methods in Adversarial Environments [63.942632088208505]
現在の運用環境に固有ののは、敵対的機械学習の実践である。
本研究では,教師なし学習とグラフに基づく異常検出の可能性を検討する。
我々は,教師付きモデルの訓練時に,現実的な対人訓練機構を組み込んで,対人環境における強力な分類性能を実現する。
論文 参考訳(メタデータ) (2021-05-14T10:05:10Z) - Systematic Assessment of Hyperdimensional Computing for Epileptic
Seizure Detection [4.249341912358848]
この研究は、てんかん発作の検出のためのHDコンピューティングフレームワークの体系的な評価を行うことである。
先程実装した2つの特徴と, てんかん発作検出におけるHDコンピューティングの新しいアプローチを検証した。
論文 参考訳(メタデータ) (2021-05-03T15:11:08Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。