論文の概要: DeformTrace: A Deformable State Space Model with Relay Tokens for Temporal Forgery Localization
- arxiv url: http://arxiv.org/abs/2603.04882v1
- Date: Thu, 05 Mar 2026 07:19:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-06 22:06:11.111304
- Title: DeformTrace: A Deformable State Space Model with Relay Tokens for Temporal Forgery Localization
- Title(参考訳): DeformTrace: 時間的フォージェリーローカライゼーションのためのリレートークンを備えた変形可能な状態空間モデル
- Authors: Xiaodong Zhu, Suting Wang, Yuanming Zheng, Junqi Yang, Yangxu Liao, Yuhong Yang, Weiping Tu, Zhongyuan Wang,
- Abstract要約: TFL(Temporal Forgery Localization)は、ビデオとオーディオの操作されたセグメントを正確に識別することを目的としており、セキュリティと法医学に強い解釈性を提供する。
最近のステート・スペース・モデル(SSM)は正確な時間的推論において有望であるが、TFLにおけるそれらの使用は曖昧な境界線、希薄な偽造物、限られた長距離モデリングによって妨げられている。
本稿では,これらの課題に対処するため,変形可能な動的機構とリレー機構を備えたSSMを改良したDeformTraceを提案する。
- 参考スコア(独自算出の注目度): 23.899829316926724
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Temporal Forgery Localization (TFL) aims to precisely identify manipulated segments in video and audio, offering strong interpretability for security and forensics. While recent State Space Models (SSMs) show promise in precise temporal reasoning, their use in TFL is hindered by ambiguous boundaries, sparse forgeries, and limited long-range modeling. We propose DeformTrace, which enhances SSMs with deformable dynamics and relay mechanisms to address these challenges. Specifically, Deformable Self-SSM (DS-SSM) introduces dynamic receptive fields into SSMs for precise temporal localization. To further enhance its capacity for temporal reasoning and mitigate long-range decay, a Relay Token Mechanism is integrated into DS-SSM. Besides, Deformable Cross-SSM (DC-SSM) partitions the global state space into query-specific subspaces, reducing non-forgery information accumulation and boosting sensitivity to sparse forgeries. These components are integrated into a hybrid architecture that combines the global modeling of Transformers with the efficiency of SSMs. Extensive experiments show that DeformTrace achieves state-of-the-art performance with fewer parameters, faster inference, and stronger robustness.
- Abstract(参考訳): TFL(Temporal Forgery Localization)は、ビデオとオーディオで操作されたセグメントを正確に識別することを目的としており、セキュリティと法医学に強い解釈性を提供する。
最近のステート・スペース・モデル(SSM)は正確な時間的推論において有望であるが、TFLにおけるそれらの使用は曖昧な境界線、希薄な偽造物、限られた長距離モデリングによって妨げられている。
本稿では,これらの課題に対処するため,変形可能な動的機構とリレー機構を備えたSSMを改良したDeformTraceを提案する。
具体的には、Deformable Self-SSM (DS-SSM) は、動的受容場をSSMに導入し、正確な時間的局所化を行う。
さらに、時間的推論能力を高め、長距離崩壊を緩和するため、リレートークン機構をDS-SSMに統合する。
さらに、Deformable Cross-SSM (DC-SSM)は、グローバルステートスペースをクエリ固有のサブスペースに分割し、非フォージェニー情報の蓄積を減らし、スパースフォージェリーに対する感度を高める。
これらのコンポーネントは、TransformerのグローバルモデリングとSSMの効率性を組み合わせたハイブリッドアーキテクチャに統合される。
大規模な実験により、DeformTraceはより少ないパラメータ、高速な推論、強力な堅牢性で最先端のパフォーマンスを達成することが示された。
関連論文リスト
- WaveSSM: Multiscale State-Space Models for Non-stationary Signal Attention [22.983737182781244]
状態空間モデル(SSM)は、長距離シーケンスモデリングの強力な基盤として登場した。
本稿では,ウェーブレットフレーム上に構築されたSSMの集合であるemphWaveSSMを紹介する。
我々のキーとなる観察は、ウェーブレットフレームが時間次元の局所的な支持を与え、正確な局所化を必要とするタスクに役立ちます。
論文 参考訳(メタデータ) (2026-02-25T06:27:22Z) - MEMTS: Internalizing Domain Knowledge via Parameterized Memory for Retrieval-Free Domain Adaptation of Time Series Foundation Models [51.506429027626005]
Memory for Time Series (MEMTS) は、時系列予測における検索不要領域適応のための軽量かつプラグアンドプレイ方式である。
MEMTSの鍵となるコンポーネントは知識永続化モジュール(KPM)であり、ドメイン固有の時間力学を内部化する。
このパラダイムシフトにより、MEMTSは定数時間推論とニアゼロレイテンシによる正確なドメイン適応を実現することができる。
論文 参考訳(メタデータ) (2026-02-14T14:00:06Z) - Scalable Spatio-Temporal SE(3) Diffusion for Long-Horizon Protein Dynamics [51.85385061275941]
分子動力学(MD)シミュレーションは、タンパク質動力学研究のゴールドスタンダードのままである。
近年の生成モデルではシミュレーションの加速が期待できるが、長軸生成に苦慮している。
物理的に可塑性なタンパク質軌道をマイクロスケールの時間スケールで生成する拡張拡散モデルSTAR-MDを提案する。
論文 参考訳(メタデータ) (2026-02-02T14:13:28Z) - MS-SSM: A Multi-Scale State Space Model for Efficient Sequence Modeling [60.648359990090846]
状態空間モデル(SSM)は、最近、計算コストのかかるシーケンスモデルに対する効率的な代替手段として注目されている。
本稿では,複数の解像度にまたがるシーケンスダイナミクスを表現するマルチスケールSSMフレームワークを提案し,各解像度を特殊な状態空間ダイナミクスで処理する。
論文 参考訳(メタデータ) (2025-12-29T19:36:28Z) - The Curious Case of In-Training Compression of State Space Models [49.819321766705514]
ステートスペースモデル(SSM)は、並列化可能なトレーニングと高速推論の両方を提供する。
鍵となる設計上の課題は、表現力の最大化と計算負荷の制限の間の適切なバランスを打つことだ。
我々のアプローチである textscCompreSSM はリニアリカレントユニットのような線形時間不変SSMに適用されるが、選択モデルにも拡張可能である。
論文 参考訳(メタデータ) (2025-10-03T09:02:33Z) - ST-LINK: Spatially-Aware Large Language Models for Spatio-Temporal Forecasting [7.853736939635847]
逐次的依存関係をキャプチャする大規模言語モデルの能力を高める新しいフレームワークST-LINKを紹介する。
その鍵となる構成要素は空間拡張注意(SE-Attention)とメモリ検索フィードフォワードネットワーク(MRFFN)である。
論文 参考訳(メタデータ) (2025-09-17T07:11:45Z) - Message-Passing State-Space Models: Improving Graph Learning with Modern Sequence Modeling [19.10832920407789]
我々は、メッセージパッシングニューラルネットワークフレームワークに直接、現代のSSMの鍵となる原則を組み込むことによって、新しい視点を導入する。
我々は,MP-SSMを用いて,メッセージパッシングのアーキテクチャ的単純さを保ちながら,効率よく,順列同変かつ長距離情報伝達を可能にする。
論文 参考訳(メタデータ) (2025-05-24T14:53:07Z) - Learning to Dissipate Energy in Oscillatory State-Space Models [51.98491034847041]
状態空間モデル (SSM) はシーケンス学習のためのネットワークのクラスである。
我々は,D-LinOSSがLinOSSの手法を長距離学習タスクで一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2025-05-17T23:15:17Z) - Efficient High-Resolution Visual Representation Learning with State Space Model for Human Pose Estimation [60.80423207808076]
高解像度の視覚表現を維持しながら長距離依存関係をキャプチャすることは、人間のポーズ推定のような密集した予測タスクに不可欠である。
マルチスケールの畳み込み操作で視覚状態空間モデルを拡張する動的ビジュアル状態空間(DVSS)ブロックを提案する。
HRVMambaは効率的な高分解能表現学習のための新しいモデルである。
論文 参考訳(メタデータ) (2024-10-04T06:19:29Z) - Cross-Scan Mamba with Masked Training for Robust Spectral Imaging [51.557804095896174]
本研究では,空間スペクトルSSMを用いたクロススキャンマンバ(CS-Mamba)を提案する。
実験の結果, CS-Mambaは最先端の性能を達成し, マスク付きトレーニング手法によりスムーズな特徴を再構築し, 視覚的品質を向上させることができた。
論文 参考訳(メタデータ) (2024-08-01T15:14:10Z) - SMR: State Memory Replay for Long Sequence Modeling [19.755738298836526]
本稿では並列畳み込み計算における互換性の限界を克服する新しい非再帰的非一様サンプル処理戦略を提案する。
本研究では,学習可能な記憶を利用する状態記憶再生(SMR)を導入し,学習データと異なるサンプリングポイントでの一般化のために,現在の状態を多段階情報で調整する。
自己回帰言語モデリングとLong Range Arenaにおける長距離モデリングタスクの実験は、一連のSSMモデルに対するSMRメカニズムの一般的な効果を実証している。
論文 参考訳(メタデータ) (2024-05-27T17:53:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。