Fugu-MT 論文翻訳(概要): TSdetector: Temporal-Spatial Self-correction Collaborative Learning for Colonoscopy Video Detection

論文の概要: TSdetector: Temporal-Spatial Self-correction Collaborative Learning for Colonoscopy Video Detection

arxiv url: http://arxiv.org/abs/2409.19983v1
Date: Mon, 30 Sep 2024 06:19:29 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-05 16:27:46.884421
Title: TSdetector: Temporal-Spatial Self-correction Collaborative Learning for Colonoscopy Video Detection
Title（参考訳）: TSdetector : 大腸内視鏡画像検出のための時間空間自己補正協調学習
Authors: Kaini Wang, Haolin Wang, Guang-Quan Zhou, Yangang Wang, Ling Yang, Yang Chen, Shuo Li,
Abstract要約: 本研究では,時間レベルの整合性学習と空間レベルの信頼性学習を統合した時間空間自己補正検出器(TSdetector)を提案する。公開された3つのポリプビデオデータセットの実験結果は、TSdetectorが最も高いポリプ検出率を達成し、他の最先端手法よりも優れていることを示している。
参考スコア（独自算出の注目度）: 19.00902297385955
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: CNN-based object detection models that strike a balance between performance and speed have been gradually used in polyp detection tasks. Nevertheless, accurately locating polyps within complex colonoscopy video scenes remains challenging since existing methods ignore two key issues: intra-sequence distribution heterogeneity and precision-confidence discrepancy. To address these challenges, we propose a novel Temporal-Spatial self-correction detector (TSdetector), which first integrates temporal-level consistency learning and spatial-level reliability learning to detect objects continuously. Technically, we first propose a global temporal-aware convolution, assembling the preceding information to dynamically guide the current convolution kernel to focus on global features between sequences. In addition, we designed a hierarchical queue integration mechanism to combine multi-temporal features through a progressive accumulation manner, fully leveraging contextual consistency information together with retaining long-sequence-dependency features. Meanwhile, at the spatial level, we advance a position-aware clustering to explore the spatial relationships among candidate boxes for recalibrating prediction confidence adaptively, thus eliminating redundant bounding boxes efficiently. The experimental results on three publicly available polyp video dataset show that TSdetector achieves the highest polyp detection rate and outperforms other state-of-the-art methods. The code can be available at https://github.com/soleilssss/TSdetector.
Abstract（参考訳）: CNNに基づく物体検出モデルでは, 性能と速度のバランスを保ちながら, ポリープ検出タスクに徐々に利用されてきた。それにもかかわらず、複雑な大腸内視鏡ビデオシーン内のポリプの正確な配置は、既存の方法では、配列内分布の不均一性と精度信頼の相違という2つの主要な問題を無視しているため、依然として困難である。これらの課題に対処するために、時間レベルの整合性学習と空間レベルの信頼性学習を統合してオブジェクトを連続的に検出する新しい時間空間自己補正検出器(TSdetector)を提案する。技術的には、まずグローバルな時相対応の畳み込みを提案し、前報を組み立て、現在の畳み込みカーネルを動的に誘導し、シーケンス間のグローバルな特徴に焦点を当てる。さらに,階層的な待ち行列統合機構を設計し,時系列依存性の維持とともにコンテキスト整合性情報を完全に活用する。一方、空間レベルでは、位置認識クラスタリングを推進し、予測信頼度を適応的に補正する候補ボックス間の空間関係を探索し、冗長な境界ボックスを効率的に除去する。公開された3つのポリプビデオデータセットの実験結果は、TSdetectorが最も高いポリプ検出率を達成し、他の最先端手法よりも優れていることを示している。コードはhttps://github.com/soleilssss/TSdetector.comで入手できる。

関連論文リスト

SlowFastVAD: Video Anomaly Detection via Integrating Simple Detector and RAG-Enhanced Vision-Language Model [52.47816604709358]
ビデオ異常検出(VAD)は、ビデオ内の予期せぬ事象を識別することを目的としており、安全クリティカルドメインに広く応用されている。視覚言語モデル(VLM)は強力なマルチモーダル推論能力を示し、異常検出の新しい機会を提供している。 SlowFastVADは高速異常検出器と低速異常検出器を統合したハイブリッドフレームワークである。
論文参考訳（メタデータ） (2025-04-14T15:30:03Z)
Reduced Spatial Dependency for More General Video-level Deepfake Detection [9.51656628987442]
本稿では,複数の空間的摂動クラスタから共通の時間的整合性を統合した空間依存削減法を提案する。大規模なベンチマークとアブレーション研究は、我々のアプローチの有効性と合理性を示している。
論文参考訳（メタデータ） (2025-03-05T08:51:55Z)
Multimodal Attention-Enhanced Feature Fusion-based Weekly Supervised Anomaly Violence Detection [1.9223495770071632]
このシステムは、RGBビデオ、光フロー、オーディオ信号の3つの特徴ストリームを使用し、それぞれのストリームが相補的な空間的特徴と時間的特徴を抽出する。このシステムは3つのデータセットの異常検出精度とロバスト性を大幅に改善する。
論文参考訳（メタデータ） (2024-09-17T14:17:52Z)
Weakly Supervised Video Anomaly Detection and Localization with Spatio-Temporal Prompts [57.01985221057047]
本稿では、事前学習された視覚言語モデル(VLM)に基づく、弱教師付きビデオ異常検出および局所化のための時間的プロンプト埋め込み(WSVADL)を学習する新しい手法を提案する。提案手法は,WSVADLタスクの3つの公開ベンチマークにおける最先端性能を実現する。
論文参考訳（メタデータ） (2024-08-12T03:31:29Z)
Graph Spatiotemporal Process for Multivariate Time Series Anomaly Detection with Missing Values [67.76168547245237]
本稿では,グラフ時間過程と異常スコアラを用いて異常を検出するGST-Proという新しいフレームワークを提案する。実験結果から,GST-Pro法は時系列データ中の異常を効果的に検出し,最先端の手法より優れていることがわかった。
論文参考訳（メタデータ） (2024-01-11T10:10:16Z)
FOCAL: Contrastive Learning for Multimodal Time-Series Sensing Signals in Factorized Orthogonal Latent Space [7.324708513042455]
本稿では,マルチモーダル時系列センシング信号から包括的特徴を抽出する,FOCALと呼ばれる新しいコントラスト学習フレームワークを提案する。ダウンストリームタスクにおける最先端のベースラインを、明確なマージンで一貫して上回る。
論文参考訳（メタデータ） (2023-10-30T22:55:29Z)
A Spatial-Temporal Deformable Attention based Framework for Breast Lesion Detection in Videos [107.96514633713034]
本稿では,STNet という空間的・時間的変形可能なアテンションベースのフレームワークを提案する。我々のSTNetは、局所的な空間的時間的特徴融合を行うために、空間的時間的変形可能なアテンションモジュールを導入している。乳腺病変の超音波画像データセットを用いた実験により,STNetは最先端の検出性能を得ることができた。
論文参考訳（メタデータ） (2023-09-09T07:00:10Z)
Correlation-aware Spatial-Temporal Graph Learning for Multivariate Time-series Anomaly Detection [67.60791405198063]
時系列異常検出のための相関対応時空間グラフ学習(CST-GL)を提案する。 CST-GLは、多変量時系列相関学習モジュールを介してペアの相関を明示的にキャプチャする。新規な異常スコアリング成分をCST-GLにさらに統合し、純粋に教師なしの方法で異常の度合いを推定する。
論文参考訳（メタデータ） (2023-07-17T11:04:27Z)
Robust Detection of Lead-Lag Relationships in Lagged Multi-Factor Models [61.10851158749843]
データ固有のリード-ラグ関係を発見することで、重要な洞察を得ることができる。階層化多要素モデルにおけるリードラグ関係のロバスト検出のためのクラスタリング駆動手法を開発した。
論文参考訳（メタデータ） (2023-05-11T10:30:35Z)
Doubly Inhomogeneous Reinforcement Learning [4.334006170547247]
我々は、ポリシー学習のために、時間とともに個人間で類似したダイナミクスを表示する「最良のデータチャンクを決定するためのオリジナルアルゴリズム」を提案する。提案手法は汎用的であり,クラスタリングおよび変更点検出アルゴリズムの幅広い範囲で動作する。
論文参考訳（メタデータ） (2022-11-08T03:41:14Z)
Learning Appearance-motion Normality for Video Anomaly Detection [11.658792932975652]
時空間記憶を付加した2ストリーム自動エンコーダフレームワークを提案する。見た目の正常さと動きの正常さを独立に学習し、敵の学習を通して相関関係を探索する。我々のフレームワークは最先端の手法より優れており、UCSD Ped2とCUHK Avenueのデータセットで98.1%、89.8%のAUCを実現している。
論文参考訳（メタデータ） (2022-07-27T08:30:19Z)
Neural Contextual Anomaly Detection for Time Series [7.523820334642732]
本稿では,時系列における異常検出のためのフレームワークであるNeural Contextual Anomaly Detection (NCAD)を紹介する。 NCADは教師なし設定から教師なし設定までシームレスにスケールする。我々は,提案手法が最先端の性能を得るための標準ベンチマークデータセットを実証的に実証した。
論文参考訳（メタデータ） (2021-07-16T04:33:53Z)
Depthwise Non-local Module for Fast Salient Object Detection Using a Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文参考訳（メタデータ） (2020-01-22T15:23:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。