論文の概要: Semi-Supervised Pipe Video Temporal Defect Interval Localization
- arxiv url: http://arxiv.org/abs/2407.15170v1
- Date: Sun, 21 Jul 2024 14:04:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-23 18:59:03.857774
- Title: Semi-Supervised Pipe Video Temporal Defect Interval Localization
- Title(参考訳): 半スーパービジョン・パイプビデオの時間的欠陥間隔の定位
- Authors: Zhu Huang, Gang Pan, Chao Kang, YaoZhi Lv,
- Abstract要約: 本研究では,視覚オドメトリーを応用した半教師付きマルチプロトタイプ方式による注意誘導手法(PipeSPO)を提案する。
実世界のデータセットでの実験では、PipeSPOは、IoU(Intersection over Union)閾値の0.1-0.7の平均精度を41.89%達成し、現在の最先端手法よりも8.14%向上している。
- 参考スコア(独自算出の注目度): 7.067654938568829
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In sewer pipe Closed-Circuit Television (CCTV) inspection, accurate temporal defect localization is essential for effective defect classification, detection, segmentation and quantification. Industry standards typically do not require time-interval annotations, even though they are more informative than time-point annotations for defect localization, resulting in additional annotation costs when fully supervised methods are used. Additionally, differences in scene types and camera motion patterns between pipe inspections and Temporal Action Localization (TAL) hinder the effective transfer of point-supervised TAL methods. Therefore, this study introduces a Semi-supervised multi-Prototype-based method incorporating visual Odometry for enhanced attention guidance (PipeSPO). PipeSPO fully leverages unlabeled data through unsupervised pretext tasks and utilizes time-point annotated data with a weakly supervised multi-prototype-based method, relying on visual odometry features to capture camera pose information. Experiments on real-world datasets demonstrate that PipeSPO achieves 41.89% average precision across Intersection over Union (IoU) thresholds of 0.1-0.7, improving by 8.14% over current state-of-the-art methods.
- Abstract(参考訳): 下水道管閉鎖回路テレビ(CCTV)検査では, 正確な時間的欠陥局所化が効果的な欠陥分類, 検出, セグメンテーション, 定量化に不可欠である。
業界標準は通常、時間間隔アノテーションを必要としないが、欠陥ローカライゼーションのためのタイムポイントアノテーションよりも情報的であり、完全な教師付きメソッドを使用すると追加のアノテーションコストが発生する。
さらに,管内検査と時間的行動局所化(TAL)のシーンタイプとカメラ動作パターンの違いは,点監督型 TAL 法の効果的な移動を妨げている。
そこで本研究では,視覚オドメトリーを応用した半教師付きマルチプロトタイプ方式(PipeSPO)を提案する。
PipeSPOは、教師なしのプリテキストタスクを通じてラベルなしのデータを完全に活用し、カメラのポーズ情報を取得するために視覚的オドメトリ機能に依存する弱教師付きマルチプロトタイプベースの手法で、タイムポイントアノテートデータを利用する。
実世界のデータセットでの実験では、PipeSPOは、IoU(Intersection over Union)閾値の0.1-0.7の平均精度を41.89%達成し、現在の最先端手法よりも8.14%向上している。
関連論文リスト
- Appearance Blur-driven AutoEncoder and Motion-guided Memory Module for Video Anomaly Detection [14.315287192621662]
ビデオ異常検出(VAD)は、しばしば正常なサンプルの分布を学習し、重要な偏差を測定することによって異常を検出する。
ほとんどのVADは、新しいターゲットドメインに対するデータセット間の検証には対応できない。
ゼロショットによるクロスデータセット検証を実現するため,動作誘導型メモリモジュールを用いた新しいVAD手法を提案する。
論文 参考訳(メタデータ) (2024-09-26T07:48:20Z) - Weakly Supervised Video Anomaly Detection and Localization with Spatio-Temporal Prompts [57.01985221057047]
本稿では、事前学習された視覚言語モデル(VLM)に基づく、弱教師付きビデオ異常検出および局所化のための時間的プロンプト埋め込み(WSVADL)を学習する新しい手法を提案する。
提案手法は,WSVADLタスクの3つの公開ベンチマークにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-08-12T03:31:29Z) - PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文 参考訳(メタデータ) (2024-06-04T13:51:08Z) - Graph Spatiotemporal Process for Multivariate Time Series Anomaly
Detection with Missing Values [67.76168547245237]
本稿では,グラフ時間過程と異常スコアラを用いて異常を検出するGST-Proという新しいフレームワークを提案する。
実験結果から,GST-Pro法は時系列データ中の異常を効果的に検出し,最先端の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2024-01-11T10:10:16Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - Delving into Sequential Patches for Deepfake Detection [64.19468088546743]
近年の顔偽造技術は、ほとんど追跡不可能なディープフェイクビデオを生み出しており、悪意のある意図で活用することができる。
従来の研究では、ディープフェイク法にまたがる一般化を追求する上で、局所的な低レベルな手がかりと時間的情報の重要性が指摘されてきた。
本稿では,局所的・時間的変換をベースとしたDeepfake Detectionフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-06T16:46:30Z) - SIOD: Single Instance Annotated Per Category Per Image for Object
Detection [67.64774488115299]
画像内の既存のカテゴリ毎に1つのインスタンスアノテーションのみを必要とする単一インスタンスアノテーションオブジェクト検出(SIOD)を提案する。
WSOD(Inter-task)やSSOD(Inter-image)の相違点からイメージ内の相違点に分解されたSIODは、ラベルなしインスタンスの残りをマイニングする上で、より信頼性が高く豊富な事前知識を提供する。
SIOD設定下では、類似性に基づく擬似ラベル生成モジュール(SPLG)と、Pixelレベルのグループコントラスト学習モジュール(PGCL)からなる、シンプルで効果的なフレームワークであるDual-Mining(DMiner)を提案する。
論文 参考訳(メタデータ) (2022-03-29T08:49:51Z) - FastFlow: Unsupervised Anomaly Detection and Localization via 2D
Normalizing Flows [18.062328700407726]
本稿では,ResNet や Vision Transformer など,任意の機能抽出用プラグインモジュールとしてFastFlowを提案する。
トレーニングフェーズでは、FastFlowは入力された視覚的特徴を抽出可能な分布に変換することを学び、推論フェーズにおける異常を認識する可能性を得る。
提案手法は推論効率の高い異常検出において99.4%のAUCを実現する。
論文 参考訳(メタデータ) (2021-11-15T11:15:02Z) - Fully Convolutional Cross-Scale-Flows for Image-based Defect Detection [24.0966076588569]
欠陥部分の画像サンプルを必要とせずに自動欠陥検出の問題に取り組む。
本稿では,異なるスケールの複数の特徴写像を共同で処理する,完全畳み込み型クロススケール正規化フロー(CS-Flow)を提案する。
ベンチマークデータセットであるMagnetic Tile DefectsとMVTec ADは、15クラス中4クラスで100%AUROCを示す。
論文 参考訳(メタデータ) (2021-10-06T15:35:13Z) - Real-time Detection of Clustered Events in Video-imaging data with
Applications to Additive Manufacturing [9.018291036304941]
本稿では,映像データにおける異常検出のための統合時間分解と回帰手法を提案する。
本手法は, 金属添加物製造プロセスにおいて, 局所過熱現象(ホットスポット)を検出し, 検出するために, 映像データの解析に応用した。
論文 参考訳(メタデータ) (2020-04-23T05:32:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。