論文の概要: What's in the Flow? Exploiting Temporal Motion Cues for Unsupervised Generic Event Boundary Detection
- arxiv url: http://arxiv.org/abs/2404.18935v1
- Date: Thu, 15 Feb 2024 14:49:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-01 11:29:30.984562
- Title: What's in the Flow? Exploiting Temporal Motion Cues for Unsupervised Generic Event Boundary Detection
- Title(参考訳): 流れには何があるのか?教師なしジェネリックイベント境界検出のための時間運動キューの爆発
- Authors: Sourabh Vasant Gothe, Vibhav Agarwal, Sourav Ghosh, Jayesh Rajkumar Vachhani, Pranay Kashyap, Barath Raj Kandur Raja,
- Abstract要約: ジェネリックイベント境界検出(GEBD)タスクは、ビデオを意味のあるイベントに分割する、ジェネリックで分類のない境界を認識することを目的としている。
現在の手法は通常、大量のデータに基づいてトレーニングされたニューラルモデルを含み、かなりの計算能力とストレージスペースを必要とする。
GEBDのための非パラメトリック非教師技術であるFlowGEBDを提案する。
- 参考スコア(独自算出の注目度): 1.3695134621603882
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Generic Event Boundary Detection (GEBD) task aims to recognize generic, taxonomy-free boundaries that segment a video into meaningful events. Current methods typically involve a neural model trained on a large volume of data, demanding substantial computational power and storage space. We explore two pivotal questions pertaining to GEBD: Can non-parametric algorithms outperform unsupervised neural methods? Does motion information alone suffice for high performance? This inquiry drives us to algorithmically harness motion cues for identifying generic event boundaries in videos. In this work, we propose FlowGEBD, a non-parametric, unsupervised technique for GEBD. Our approach entails two algorithms utilizing optical flow: (i) Pixel Tracking and (ii) Flow Normalization. By conducting thorough experimentation on the challenging Kinetics-GEBD and TAPOS datasets, our results establish FlowGEBD as the new state-of-the-art (SOTA) among unsupervised methods. FlowGEBD exceeds the neural models on the Kinetics-GEBD dataset by obtaining an F1@0.05 score of 0.713 with an absolute gain of 31.7% compared to the unsupervised baseline and achieves an average F1 score of 0.623 on the TAPOS validation dataset.
- Abstract(参考訳): ジェネリックイベント境界検出(GEBD)タスクは、ビデオを意味のあるイベントに分割する、ジェネリックで分類のない境界を認識することを目的としている。
現在の手法は通常、大量のデータで訓練されたニューラルモデルを含み、かなりの計算能力とストレージスペースを必要とする。
非パラメトリックアルゴリズムは教師なしニューラルネットワークよりも優れているか?
運動情報だけではハイパフォーマンスに十分か?
この調査は、ビデオ内の一般的なイベント境界を特定するために、モーションキューをアルゴリズムで活用することを促す。
本稿では,非パラメトリックで教師なしなGABD技術であるFlowGEBDを提案する。
本稿では,光学的流れを利用した2つのアルゴリズムについて述べる。
(i)追跡・追跡
(二)流れの正規化
本研究では,Kineetics-GEBD と TAPOS のデータセットを徹底的に実験することにより,新しい最先端技術 (SOTA) として FlowGEBD を確立した。
FlowGEBDは、教師なしベースラインに比べて31.7%の絶対ゲインでF1@0.05スコアの0.713を取得し、TAPOS検証データセットの平均F1スコアの0.623を達成することで、Kinetics-GEBDデータセットのニューラルモデルを上回る。
関連論文リスト
- Dual-frame Fluid Motion Estimation with Test-time Optimization and Zero-divergence Loss [9.287932323337163]
3次元粒子追跡速度計(PTV)は乱流解析の鍵となる技術である。
深層学習に基づく手法は、2フレームの流体運動推定において顕著な精度を達成している。
我々は,完全に自己管理された新しい手法を導入し,完全に教師された手法よりも優れていた。
論文 参考訳(メタデータ) (2024-10-15T18:00:00Z) - KECOR: Kernel Coding Rate Maximization for Active 3D Object Detection [48.66703222700795]
我々は、ラベルの取得に最も有用なポイントクラウドを特定するために、新しいカーネル戦略を利用する。
1段目(SECOND)と2段目(SECOND)の両方に対応するため、アノテーションに選択した境界ボックスの総数と検出性能のトレードオフをよく組み込んだ分類エントロピー接点を組み込んだ。
その結果,ボックスレベルのアノテーションのコストは約44%,計算時間は26%削減された。
論文 参考訳(メタデータ) (2023-07-16T04:27:03Z) - Human Semantic Segmentation using Millimeter-Wave Radar Sparse Point
Clouds [3.3888257250564364]
本稿では,ミリ波レーダの粗い逐次点雲のセマンティックセグメンテーションのためのフレームワークを提案する。
mmWaveデータの空間的特徴と時間的トポロジ的特徴は依然として問題である。
グラフ構造とトポロジ的特徴をポイントクラウドに導入し,セマンティックセグメンテーションフレームワークを提案する。
我々のモデルは、$mathbf82.31%$でカスタムデータセットの平均精度を達成し、最先端のアルゴリズムより優れている。
論文 参考訳(メタデータ) (2023-04-27T12:28:06Z) - Towards Better Out-of-Distribution Generalization of Neural Algorithmic
Reasoning Tasks [51.8723187709964]
ニューラルネットワーク推論タスクのOOD一般化について検討する。
目標は、ディープニューラルネットワークを使用して入出力ペアからアルゴリズムを学ぶことである。
論文 参考訳(メタデータ) (2022-11-01T18:33:20Z) - GFlowCausal: Generative Flow Networks for Causal Discovery [27.51595081346858]
本稿では,GFlowCausalと呼ばれる観測データからDAG(Directed Acyclic Graph)を学習するための新しい手法を提案する。
GFlowCausalは、事前定義された報酬に比例した確率を持つシーケンシャルアクションによって、ハイリワードDAGを生成するための最良のポリシーを学ぶことを目的としている。
合成データセットと実データセットの両方について広範な実験を行い、提案手法が優れていることを示すとともに、大規模環境での良好な性能を示す。
論文 参考訳(メタデータ) (2022-10-15T04:07:39Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - Benchmarking Node Outlier Detection on Graphs [90.29966986023403]
グラフの外れ値検出は、多くのアプリケーションにおいて、新しいが重要な機械学習タスクである。
UNODと呼ばれるグラフに対して、最初の包括的教師なしノード外乱検出ベンチマークを示す。
論文 参考訳(メタデータ) (2022-06-21T01:46:38Z) - Masked Autoencoders for Generic Event Boundary Detection CVPR'2022
Kinetics-GEBD Challenge [11.823891739821443]
ジェネリックイベント境界検出(GEBD)タスクは、ビデオ全体をチャンクに分割する、ジェネリックで分類のないイベント境界を検出することを目的としている。
本稿では,GABDタスクにおけるアルゴリズム性能向上のためにMasked Autoencodersを適用した。
我々のアプローチでは、2021年のキネティクス-GEBDチャレンジの勝者と比較してF1スコアを2.31%改善したKinetics-GEBDテストセットのF1スコアで85.94%を達成した。
論文 参考訳(メタデータ) (2022-06-17T08:10:27Z) - A2Log: Attentive Augmented Log Anomaly Detection [53.06341151551106]
異常検出は、ITサービスの信頼性とサービス性にとってますます重要になる。
既存の教師なし手法は、適切な決定境界を得るために異常な例を必要とする。
我々は,異常判定と異常判定の2段階からなる教師なし異常検出手法であるA2Logを開発した。
論文 参考訳(メタデータ) (2021-09-20T13:40:21Z) - DAAIN: Detection of Anomalous and Adversarial Input using Normalizing
Flows [52.31831255787147]
我々は、アウト・オブ・ディストリビューション(OOD)インプットと敵攻撃(AA)を検出する新しい手法であるDAINを導入する。
本手法は,ニューラルネットワークの内部動作を監視し,活性化分布の密度推定器を学習する。
当社のモデルは,特別なアクセラレータを必要とせずに,効率的な計算とデプロイが可能な単一のGPUでトレーニングすることが可能です。
論文 参考訳(メタデータ) (2021-05-30T22:07:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。