論文の概要: A comprehensive overview of deep learning models for object detection from videos/images
- arxiv url: http://arxiv.org/abs/2601.14677v1
- Date: Wed, 21 Jan 2026 05:50:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-22 21:27:50.24637
- Title: A comprehensive overview of deep learning models for object detection from videos/images
- Title(参考訳): 映像・映像からの物体検出のためのディープラーニングモデルの概要
- Authors: Sukana Zulfqar, Sadia Saeed, M. Azam Zia, Anjum Ali, Faisal Mehmood, Abid Ali,
- Abstract要約: ビデオおよび画像監視における物体検出は、近年のディープラーニングの進歩の影響を受けつつも、十分に確立されている。
本稿では, アーキテクチャの革新, 生成モデルの統合, 強靭性と精度を高めるための時間情報の利用について検討する。
第一の目的は、ディープラーニングモデルとその実践的応用を分析しながら、セマンティックオブジェクト検出の現在の有効性を評価することである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object detection in video and image surveillance is a well-established yet rapidly evolving task, strongly influenced by recent deep learning advancements. This review summarises modern techniques by examining architectural innovations, generative model integration, and the use of temporal information to enhance robustness and accuracy. Unlike earlier surveys, it classifies methods based on core architectures, data processing strategies, and surveillance specific challenges such as dynamic environments, occlusions, lighting variations, and real-time requirements. The primary goal is to evaluate the current effectiveness of semantic object detection, while secondary aims include analysing deep learning models and their practical applications. The review covers CNN-based detectors, GAN-assisted approaches, and temporal fusion methods, highlighting how generative models support tasks such as reconstructing missing frames, reducing occlusions, and normalising illumination. It also outlines preprocessing pipelines, feature extraction progress, benchmarking datasets, and comparative evaluations. Finally, emerging trends in low-latency, efficient, and spatiotemporal learning approaches are identified for future research.
- Abstract(参考訳): ビデオおよび画像監視における物体検出は、近年のディープラーニングの進歩に強く影響され、十分に確立されているが、急速に進化する課題である。
本稿では, アーキテクチャの革新, 生成モデルの統合, 時間情報による堅牢性と精度の向上など, 最新の技術について概説する。
以前の調査とは違って、コアアーキテクチャ、データ処理戦略、動的環境、閉塞、照明のバリエーション、リアルタイム要求などの監視固有の課題に基づいたメソッドを分類する。
第一の目的は、セマンティックオブジェクト検出の現在の有効性を評価することであり、第二の目的は、ディープラーニングモデルとその実践的応用を分析することである。
レビューでは、CNNベースの検出器、GAN支援アプローチ、時間融合手法を取り上げ、欠落フレームの再構築、オクルージョンの低減、照明の正規化など、生成モデルがどのようにタスクをサポートするかを強調した。
また、前処理パイプライン、機能抽出の進捗、ベンチマークデータセット、比較評価についても概説している。
最後に、今後の研究のために、低レイテンシ、効率的、時空間学習アプローチの新たなトレンドを特定する。
関連論文リスト
- Deep Learning for Crack Detection: A Review of Learning Paradigms, Generalizability, and Datasets [4.874652036065497]
き裂検出は、舗装や建物の検査など、土木インフラにおいて重要な役割を担っている。
近年、ディープラーニングはこの分野を著しく進歩させてきた。
新たなトレンドは、学習パラダイムの移行や一般化可能性の改善など、ランドスケープを変革している。
論文 参考訳(メタデータ) (2025-08-14T00:47:00Z) - A Systematic Investigation on Deep Learning-Based Omnidirectional Image and Video Super-Resolution [30.62413133817583]
本稿では,全方位画像とビデオ超解像の最近の進歩を体系的に概観する。
新しいデータセットである360Instaを導入し、全方位画像とビデオをオーステンシャルに劣化させた。
提案したデータセットと公開データセットの両方において,既存手法の総合的質的,定量的評価を行う。
論文 参考訳(メタデータ) (2025-06-07T08:24:44Z) - Underwater Object Detection in the Era of Artificial Intelligence: Current, Challenge, and Future [119.88454942558485]
水中物体検出(UOD)は、水中の画像やビデオ中の物体を識別し、ローカライズすることを目的としている。
近年、人工知能(AI)に基づく手法、特に深層学習法は、UODにおいて有望な性能を示している。
論文 参考訳(メタデータ) (2024-10-08T00:25:33Z) - Cross-Target Stance Detection: A Survey of Techniques, Datasets, and Challenges [7.242609314791262]
クロスターゲットスタンス検出(クロスターゲットスタンス検出)は、テキストで表現された視点を所定のターゲットに向けて決定するタスクである。
オンラインの視点や意見の分析やマイニングの必要性が高まる中、このタスクは近年大きな関心を集めている。
本総説では,過去10年間の目標間姿勢検出の進歩について検討する。
論文 参考訳(メタデータ) (2024-09-20T15:49:14Z) - Zero-Shot Object-Centric Representation Learning [72.43369950684057]
ゼロショット一般化のレンズによる現在の対象中心法について検討する。
8つの異なる合成および実世界のデータセットからなるベンチマークを導入する。
多様な実世界の画像のトレーニングにより、見えないシナリオへの転送性が向上することがわかった。
論文 参考訳(メタデータ) (2024-08-17T10:37:07Z) - Deep Learning-Based Object Pose Estimation: A Comprehensive Survey [73.74933379151419]
ディープラーニングに基づくオブジェクトポーズ推定の最近の進歩について論じる。
また、複数の入力データモダリティ、出力ポーズの自由度、オブジェクト特性、下流タスクについても調査した。
論文 参考訳(メタデータ) (2024-05-13T14:44:22Z) - Efficient Parameter Mining and Freezing for Continual Object Detection [0.0]
本稿では,ネットワークがシーケンシャルな更新にまたがって検出器の性能を維持する上で,どの層が最重要かを特定する効率的な方法を提案する。
これらの結果は,オブジェクト検出モデル内での漸進的な学習を容易にする上で,階層レベルのパラメータ分離の実質的なメリットを強調した。
論文 参考訳(メタデータ) (2024-02-20T01:07:32Z) - Information-Theoretic Odometry Learning [83.36195426897768]
生体計測推定を目的とした学習動機付け手法のための統合情報理論フレームワークを提案する。
提案フレームワークは情報理論言語の性能評価と理解のためのエレガントなツールを提供する。
論文 参考訳(メタデータ) (2022-03-11T02:37:35Z) - Incremental Object Detection via Meta-Learning [77.55310507917012]
本稿では,段階的タスク間の情報を最適に共有するように,モデル勾配を再形成するメタラーニング手法を提案する。
既存のメタ学習法と比較して,本手法はタスク非依存であり,オブジェクト検出のための高容量モデルに新たなクラスやスケールを段階的に追加することができる。
論文 参考訳(メタデータ) (2020-03-17T13:40:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。