論文の概要: Computation-Aware Event-to-Frame Reconstruction via Selective Attention
- arxiv url: http://arxiv.org/abs/2606.06142v1
- Date: Thu, 04 Jun 2026 13:19:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.810519
- Title: Computation-Aware Event-to-Frame Reconstruction via Selective Attention
- Title(参考訳): 選択的注意によるイベント・ツー・フレーム再構成の計算
- Authors: Jingqian Wu, Yunbo Jia, Edmund Y. Lam,
- Abstract要約: Event-to-frame(E2F)再構築は、非同期イベントストリームをフレームベースのビジョンパイプラインでブリッジする。
本稿では,因果時間モデリングと計算対応設計を重視した効率的なE2Fフレームワークを提案する。
- 参考スコア(独自算出の注目度): 16.457124252847297
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Event-to-frame (E2F) reconstruction bridges asynchronous event streams with frame-based vision pipelines, but existing methods often face a trade-off between reconstruction quality and computational efficiency. In this work, we propose an efficient E2F framework that emphasizes causal temporal modeling and computation-aware design. The architecture adopts a recurrent encoder-decoder to incrementally aggregate event information with compact hidden states. To improve robustness under fast motion and illumination variations, a selective context fusion strategy is introduced to integrate event-driven features with prior intensity cues. Within this fusion process, a lightweight hybrid attention mechanism enhances feature selectivity without relying on heavy attention operations. Experimental results on standard benchmarks demonstrate that the proposed approach achieves competitive reconstruction performance while maintaining a favorable balance between accuracy and model complexity.
- Abstract(参考訳): イベント・ツー・フレーム(E2F)再構築は、非同期イベントストリームをフレームベースのビジョンパイプラインでブリッジするが、既存の手法では、再構築の品質と計算効率のトレードオフに直面することが多い。
本研究では,因果時間モデリングと計算対応設計を重視した効率的なE2Fフレームワークを提案する。
アーキテクチャは、連続エンコーダデコーダを採用して、イベント情報をコンパクトな隠蔽状態で漸進的に集約する。
高速動作および照明変動下でのロバスト性を改善するため、イベント駆動機能と事前の強度手がかりを統合するための選択的コンテキスト融合戦略が導入された。
この融合プロセスにおいて、軽量なハイブリッドアテンション機構は、重いアテンション操作に頼ることなく特徴選択性を高める。
標準ベンチマークによる実験結果から,提案手法は精度とモデルの複雑さのバランスを良好に保ちながら,競争力のある再構築性能を実現することが示された。
関連論文リスト
- SCING:Towards More Efficient and Robust Person Re-Identification through Selective Cross-modal Prompt Tuning [17.104905795008555]
Selective Cross-modal Prompt Tuning (SCING) というフレームワークを提案する。
我々のフレームワークは、効率的な推論を維持しながら重いアダプタを排除し、性能と計算オーバーヘッドの最適なトレードオフを実現する。
論文 参考訳(メタデータ) (2025-07-01T07:21:31Z) - Fully Spiking Neural Networks for Unified Frame-Event Object Tracking [17.626181371045575]
我々は、SpikeFETと呼ばれる、最初の完全なSpyking Frame-Event Trackingフレームワークを提案する。
このネットワークは、進化的局所特徴抽出とトランスフォーマーに基づくグローバルモデリングをスパイキングパラダイム内で相乗的に統合する。
提案手法は既存の手法よりも優れたトラッキング精度を実現し,消費電力を大幅に削減できることを示す。
論文 参考訳(メタデータ) (2025-05-27T07:53:50Z) - ReCoM: Realistic Co-Speech Motion Generation with Recurrent Embedded Transformer [58.49950218437718]
音声に同期した高忠実で一般化可能な人体動作を生成するための効率的なフレームワークであるReCoMを提案する。
Recurrent Embedded Transformer (RET)は、動的埋め込み正規化(DER)をViT(Vit)コアアーキテクチャに統合する。
モデルロバスト性を高めるため,ノイズ抵抗とクロスドメイン一般化の二重性を持つモデルに,提案したDER戦略を取り入れた。
論文 参考訳(メタデータ) (2025-03-27T16:39:40Z) - Spatially-guided Temporal Aggregation for Robust Event-RGB Optical Flow Estimation [47.75348821902489]
現在の光学フロー法は、フレーム(またはRGB)データの安定した出現を利用して、時間にわたって堅牢な対応を確立する。
一方、イベントカメラは、高時間分解能のモーションキューを提供し、挑戦的なシナリオに優れています。
本研究は,時間的に密度の高い事象モダリティの集合を導くために空間的に密度の高いモダリティを用いる新しいアプローチを提案する。
論文 参考訳(メタデータ) (2025-01-01T13:40:09Z) - Low-Light Video Enhancement via Spatial-Temporal Consistent Decomposition [52.89441679581216]
低照度ビデオエンハンスメント(LLVE)は、激しい視認性とノイズに悩まされる動的または静的なシーンの復元を目指している。
本稿では、ビューに依存しない、ビューに依存しないコンポーネントを組み込んだ革新的なビデオ分解戦略を提案する。
我々のフレームワークは、既存のメソッドを一貫して上回り、新しいSOTAパフォーマンスを確立します。
論文 参考訳(メタデータ) (2024-05-24T15:56:40Z) - Asynchronous Optimisation for Event-based Visual Odometry [53.59879499700895]
イベントカメラは、低レイテンシと高ダイナミックレンジのために、ロボット知覚の新しい可能性を開く。
イベントベースビジュアル・オドメトリー(VO)に焦点をあてる
動作最適化のバックエンドとして非同期構造を提案する。
論文 参考訳(メタデータ) (2022-03-02T11:28:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。