論文の概要: Online Generic Event Boundary Detection
- arxiv url: http://arxiv.org/abs/2510.06855v1
- Date: Wed, 08 Oct 2025 10:23:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 16:41:20.422555
- Title: Online Generic Event Boundary Detection
- Title(参考訳): オンラインジェネリックイベント境界検出
- Authors: Hyungrok Jung, Daneul Kim, Seunggyun Lim, Jeany Son, Jonghyun Choi,
- Abstract要約: ストリーミングビデオにおけるジェネリックイベントの境界を検出することを目的とした,オンラインジェネリックイベント境界検出(On-GEBD)というタスクを導入する。
このタスクは、将来的なフレームへのアクセスなしに、微妙で分類なしのイベント変更をリアルタイムで特定する、というユニークな課題に直面している。
本研究では,予測情報と実際の情報との相違を利用して,人間が現在進行中の活動をイベントに分割する方法を説明するイベント理論(EST)に着想を得た新しいオン・GEBDフレームワークを提案する。
- 参考スコア(独自算出の注目度): 27.34486732049466
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generic Event Boundary Detection (GEBD) aims to interpret long-form videos through the lens of human perception. However, current GEBD methods require processing complete video frames to make predictions, unlike humans processing data online and in real-time. To bridge this gap, we introduce a new task, Online Generic Event Boundary Detection (On-GEBD), aiming to detect boundaries of generic events immediately in streaming videos. This task faces unique challenges of identifying subtle, taxonomy-free event changes in real-time, without the access to future frames. To tackle these challenges, we propose a novel On-GEBD framework, Estimator, inspired by Event Segmentation Theory (EST) which explains how humans segment ongoing activity into events by leveraging the discrepancies between predicted and actual information. Our framework consists of two key components: the Consistent Event Anticipator (CEA), and the Online Boundary Discriminator (OBD). Specifically, the CEA generates a prediction of the future frame reflecting current event dynamics based solely on prior frames. Then, the OBD measures the prediction error and adaptively adjusts the threshold using statistical tests on past errors to capture diverse, subtle event transitions. Experimental results demonstrate that Estimator outperforms all baselines adapted from recent online video understanding models and achieves performance comparable to prior offline-GEBD methods on the Kinetics-GEBD and TAPOS datasets.
- Abstract(参考訳): ジェネリックイベント境界検出(GEBD)は、人間の知覚のレンズを通して長めの動画を解釈することを目的としている。
しかし、現在のGABD法では、人間がオンラインでリアルタイムにデータを処理しているのとは異なり、完全なビデオフレームを処理して予測する必要がある。
このギャップを埋めるために、ストリーミングビデオにおけるジェネリックイベントの境界を検出するために、オンラインジェネリックイベント境界検出(On-GEBD)という新しいタスクを導入する。
このタスクは、将来的なフレームにアクセスすることなく、微妙で分類なしのイベント変更をリアルタイムで特定する、というユニークな課題に直面している。
これらの課題に対処するために,予測情報と実際の情報との相違を利用したイベントセグメンテーション理論 (EST) に触発された新しいオン・GEBDフレームワーク Estimator を提案する。
本フレームワークは, Consistent Event Precipator (CEA) と Online Boundary Discriminator (OBD) の2つの重要なコンポーネントから構成される。
具体的には、CEAは、以前のフレームのみに基づいて、現在のイベントダイナミクスを反映した将来のフレームの予測を生成する。
そして、OBDは予測誤差を測定し、過去の誤差に関する統計的テストを用いて閾値を適応的に調整し、多様な微妙なイベント遷移をキャプチャする。
実験の結果、Estimatorは最近のオンラインビデオ理解モデルから適応したすべてのベースラインより優れており、Kinetics-GEBDおよびTAPOSデータセット上の従来のオフラインGEBD手法に匹敵する性能を達成している。
関連論文リスト
- Generic Event Boundary Detection via Denoising Diffusion [42.88245960369029]
ジェネリックイベント境界検出は、ビデオ内の自然な境界を識別することを目的としており、それを明瞭で意味のあるチャンクに分割する。
従来は、決定論的予測に焦点が当てられ、可算解の多様性を見下ろしていた。
DiffGEBDと呼ばれる新しい拡散型境界検出モデルを導入し,ジェネレーティブの観点からGABDの問題に取り組む。
論文 参考訳(メタデータ) (2025-08-16T15:44:34Z) - ESTR-CoT: Towards Explainable and Accurate Event Stream based Scene Text Recognition with Chain-of-Thought Reasoning [57.767536707234036]
本稿では,イベントストリームシーンのテキスト認識フレームワークESTR-CoTを提案する。
具体的には、まず視覚エンコーダEVA-CLIPを採用し、入力イベントストリームをトークンに変換し、Llamaトークン化器を使用して与えられた生成プロンプトをエンコードする。
Qフォーマーは、事前訓練された大言語モデルVicuna-7Bにビジョントークンを整列させ、応答とチェーン・オブ・シークレット(CoT)推論プロセスの両方を同時に出力する。
論文 参考訳(メタデータ) (2025-07-02T23:41:31Z) - ONSEP: A Novel Online Neural-Symbolic Framework for Event Prediction Based on Large Language Model [10.137013634329582]
オンラインニューラル・シンボリックイベント予測フレームワークについて紹介する。
ONSEPは動的因果ルールマイニングと二重履歴拡張生成を取り入れている。
我々のフレームワークは、多様なデータセットにわたる顕著なパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2024-08-14T22:28:19Z) - A Unified Framework for Event-based Frame Interpolation with Ad-hoc Deblurring in the Wild [72.0226493284814]
本稿では,デブロリングアドホックを行うイベントベースフレームの統一フレームワークを提案する。
我々のネットワークは、フレーム上の従来の最先端の手法、単一画像のデブロアリング、および両者のジョイントタスクを一貫して上回ります。
論文 参考訳(メタデータ) (2023-01-12T18:19:00Z) - Unifying Event Detection and Captioning as Sequence Generation via
Pre-Training [53.613265415703815]
本稿では,イベント検出とキャプションのタスク間関連性を高めるための,事前学習と微調整の統合フレームワークを提案する。
我々のモデルは最先端の手法よりも優れており、大規模ビデオテキストデータによる事前学習ではさらに向上できる。
論文 参考訳(メタデータ) (2022-07-18T14:18:13Z) - AntPivot: Livestream Highlight Detection via Hierarchical Attention
Mechanism [64.70568612993416]
本稿では,Livestream Highlight Detectionという新たなタスクを定式化し,上記の課題を議論・分析し,新しいアーキテクチャAntPivotを提案する。
我々は、このタスクをインスタンス化し、我々のモデルの性能を評価するために、完全に注釈付きデータセットAntHighlightを構築した。
論文 参考訳(メタデータ) (2022-06-10T05:58:11Z) - UBoCo : Unsupervised Boundary Contrastive Learning for Generic Event
Boundary Detection [27.29169136392871]
ジェネリックイベント境界検出(GEBD)は、イベントのより深いセマンティック境界を見つけることを目的としている。
本稿では,時間的自己相似行列(TSM)を映像表現として,教師なし・教師なしのEBDのための新しいフレームワークを提案する。
我々のフレームワークは、教師なしと教師なしの両方に応用でき、最先端のパフォーマンスを大きなマージンで達成できる。
論文 参考訳(メタデータ) (2021-11-29T18:50:39Z) - Reliable Shot Identification for Complex Event Detection via
Visual-Semantic Embedding [72.9370352430965]
本稿では,映像中の事象検出のための視覚的意味的誘導損失法を提案する。
カリキュラム学習に動機付け,高い信頼性の事例で分類器の訓練を開始するために,負の弾性正規化項を導入する。
提案する非ネット正規化問題の解法として,代替最適化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-10-12T11:46:56Z) - Generic Event Boundary Detection: A Benchmark for Event Segmentation [21.914662894860474]
本稿では,ビデオ全体をチャンクに分割する一般的な分類のないイベント境界を検出するための新しいベンチマークとともに,新しいタスクを提案する。
本稿では,ジェネリックイベント境界検出(GEBD)と新しいベンチマークKinetics-GEBDを提案する。
人間が未来を正確に予測できない地点で境界をマークするという認知的発見に触発されて、教師なしのアプローチを探求する。
論文 参考訳(メタデータ) (2021-01-26T01:31:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。