論文の概要: Vision Technologies with Applications in Traffic Surveillance Systems: A Holistic Survey
- arxiv url: http://arxiv.org/abs/2412.00348v1
- Date: Sat, 30 Nov 2024 04:17:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:46:01.843125
- Title: Vision Technologies with Applications in Traffic Surveillance Systems: A Holistic Survey
- Title(参考訳): 交通監視システムにおけるビジョン技術と応用
- Authors: Wei Zhou, Lei Zhao, Runyu Zhang, Yifan Cui, Hongpu Huang, Kun Qie, Chen Wang,
- Abstract要約: 交通監視システム(TSS)は、現代のインテリジェント交通システムにおいてますます重要になっている。
本稿では,TSSにおけるビジョンベース技術の体系的レビューを行う。
低レベルと高レベルの両方の知覚タスクについて検討する。
- 参考スコア(独自算出の注目度): 11.42504047904665
- License:
- Abstract: Traffic Surveillance Systems (TSS) have become increasingly crucial in modern intelligent transportation systems, with vision-based technologies playing a central role for scene perception and understanding. While existing surveys typically focus on isolated aspects of TSS, a comprehensive analysis bridging low-level and high-level perception tasks, particularly considering emerging technologies, remains lacking. This paper presents a systematic review of vision-based technologies in TSS, examining both low-level perception tasks (object detection, classification, and tracking) and high-level perception applications (parameter estimation, anomaly detection, and behavior understanding). Specifically, we first provide a detailed methodological categorization and comprehensive performance evaluation for each task. Our investigation reveals five fundamental limitations in current TSS: perceptual data degradation in complex scenarios, data-driven learning constraints, semantic understanding gaps, sensing coverage limitations and computational resource demands. To address these challenges, we systematically analyze five categories of potential solutions: advanced perception enhancement, efficient learning paradigms, knowledge-enhanced understanding, cooperative sensing frameworks and efficient computing frameworks. Furthermore, we evaluate the transformative potential of foundation models in TSS, demonstrating their unique capabilities in zero-shot learning, semantic understanding, and scene generation. This review provides a unified framework bridging low-level and high-level perception tasks, systematically analyzes current limitations and solutions, and presents a structured roadmap for integrating emerging technologies, particularly foundation models, to enhance TSS capabilities.
- Abstract(参考訳): 交通監視システム(TSS: Traffic Surveillance Systems)は、現代のインテリジェント交通システムにおいてますます重要になってきており、視覚技術がシーン認識と理解の中心的な役割を担っている。
既存の調査は通常、TSSの孤立した側面に焦点を当てているが、特に新興技術を考えると、低レベルおよび高レベルな知覚タスクをブリッジする包括的な分析はいまだに不足している。
本稿では,低レベル認識タスク(対象検出,分類,追跡)と高レベル認識アプリケーション(パラメータ推定,異常検出,行動理解)の両方について,TSSにおける視覚ベース技術の体系的レビューを行う。
具体的には,まず,タスクごとに詳細な方法論分類と総合的な性能評価を行う。
我々の調査は、複雑なシナリオにおける知覚的データ劣化、データ駆動学習の制約、意味理解のギャップ、カバレッジの制限の検知、計算リソースの要求の5つの基本的な制限を明らかにした。
これらの課題に対処するために,我々は,先進的な知覚向上,効率的な学習パラダイム,知識強化された理解,協調的なセンシングフレームワーク,効率的なコンピューティングフレームワークの5つのカテゴリを体系的に分析した。
さらに,TSSにおける基礎モデルの変換可能性を評価し,ゼロショット学習,意味理解,シーン生成において,そのユニークな能力を示す。
このレビューは、低レベルおよび高レベルの知覚タスクをブリッジする統一されたフレームワークを提供し、現在の制限とソリューションを体系的に分析し、TSS機能を強化するために新興技術、特に基礎モデルを統合するための構造化されたロードマップを提供する。
関連論文リスト
- Object Detectors in the Open Environment: Challenges, Solutions, and Outlook [95.3317059617271]
オープン環境のダイナミックで複雑な性質は、オブジェクト検出器に新しくて恐ろしい挑戦をもたらす。
本稿では,オープン環境におけるオブジェクト検出器の総合的なレビューと解析を行う。
データ/ターゲットの変化の次元に基づいて、4つの四分法(ドメイン外、カテゴリ外、堅牢な学習、漸進的な学習)を含むフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-24T19:32:39Z) - A Review of Physics-Informed Machine Learning Methods with Applications
to Condition Monitoring and Anomaly Detection [1.124958340749622]
PIMLは、既知の物理法則と制約を機械学習アルゴリズムに組み込んだものである。
本研究では,条件モニタリングの文脈におけるPIML技術の概要を概観する。
論文 参考訳(メタデータ) (2024-01-22T11:29:44Z) - Representation Engineering: A Top-Down Approach to AI Transparency [132.0398250233924]
表現工学の新たな領域(RepE)を特定し,特徴付ける
RepEは、神経細胞や回路ではなく、人口レベルの表現を解析の中心に置く。
これらの手法が、広範囲の安全関連問題に対してどのようにトラクションを提供するかを紹介する。
論文 参考訳(メタデータ) (2023-10-02T17:59:07Z) - A Study of Situational Reasoning for Traffic Understanding [63.45021731775964]
トラフィック領域における状況推論のための3つの新しいテキストベースのタスクを考案する。
先行作業における言語推論タスクにまたがる一般化能力を示す知識強化手法を4つ採用する。
本稿では,データ分割におけるモデル性能の詳細な解析を行い,モデル予測を分類的に検討する。
論文 参考訳(メタデータ) (2023-06-05T01:01:12Z) - SLAM for Visually Impaired People: a Survey [18.839307761493174]
視力障害と視覚障害に対するSLAMベースのソリューションに関する54の最近の研究の体系的な文献レビューを初めて紹介する。
視覚障害者のナビゲーションにおけるこれらの手法の利点と限界について論じる。
また,現実シナリオにおけるSLAMベースのソリューションの有効性とユーザ満足度を評価した。
論文 参考訳(メタデータ) (2022-12-09T09:45:43Z) - Remote Sensing Image Classification using Transfer Learning and
Attention Based Deep Neural Network [59.86658316440461]
本稿では、転送学習技術とマルチヘッドアテンションスキームを活用した、深層学習に基づくRSISCフレームワークを提案する。
提案したディープラーニングフレームワークは、ベンチマークNWPU-RESISC45データセットに基づいて評価され、最高の分類精度94.7%を達成する。
論文 参考訳(メタデータ) (2022-06-20T10:05:38Z) - Computational Experiments: Past, Present and Future [29.515830983306966]
計算実験はCPSSの定量的解析のための新しい方法として登場した。
本稿では,起源,特徴,方法論的枠組み,鍵となる技術,典型的応用など,いくつかの重要な側面から計算実験を概説する。
論文 参考訳(メタデータ) (2022-02-28T11:18:17Z) - Infrastructure-Based Object Detection and Tracking for Cooperative
Driving Automation: A Survey [16.20885642028316]
インフラベースの物体検出・追跡システムは、連結車両の知覚能力を高めることができる。
現在の機会、オープンな問題、今後のトレンドを指摘するために行われた議論。
論文 参考訳(メタデータ) (2022-01-28T00:55:24Z) - Investigating Bi-Level Optimization for Learning and Vision from a
Unified Perspective: A Survey and Beyond [114.39616146985001]
機械学習やコンピュータビジョンの分野では、モチベーションやメカニズムが異なるにもかかわらず、複雑な問題の多くは、一連の密接に関連するサブプロトコルを含んでいる。
本稿では,BLO(Bi-Level Optimization)の観点から,これらの複雑な学習と視覚問題を一様に表現する。
次に、値関数に基づく単一レベル再構成を構築し、主流勾配に基づくBLO手法を理解し、定式化するための統一的なアルゴリズムフレームワークを確立する。
論文 参考訳(メタデータ) (2021-01-27T16:20:23Z) - LSM: Learning Subspace Minimization for Low-level Vision [78.27774638569218]
我々は、正規化項を学習可能な部分空間制約に置き換え、データ項をドメイン知識を活用するために保存する。
この学習サブスペース最小化(LSM)フレームワークは、多くの低レベル視覚タスクのネットワーク構造とパラメータを統一する。
インタラクティブな画像セグメンテーション、ビデオセグメンテーション、ステレオマッチング、オプティカルフローを含む4つの低レベルタスクについてLSMフレームワークを実証し、様々なデータセット上でネットワークを検証した。
論文 参考訳(メタデータ) (2020-04-20T10:49:38Z) - DEEVA: A Deep Learning and IoT Based Computer Vision System to Address
Safety and Security of Production Sites in Energy Industry [0.0]
本稿では,シーン分類,シーン中のオブジェクト検出,セマンティックセグメンテーション,シーンキャプションなど,さまざまなコンピュータビジョンに関わる問題に取り組む。
我々は、シーン分類、オブジェクト検出、セマンティックセグメンテーション、シーンのキャプションを扱うためのDeep ExxonMobil Eye for Video Analysis (DEEVA)パッケージを開発した。
その結果, RetinaNet物体検出器を用いた伝達学習により, 作業者の存在, 車両・建設機器の種類, 安全関連物体を高い精度(90%以上)で検出できることがわかった。
論文 参考訳(メタデータ) (2020-03-02T21:26:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。