論文の概要: Efficient Logic Gate Networks for Video Copy Detection
- arxiv url: http://arxiv.org/abs/2604.21694v1
- Date: Thu, 23 Apr 2026 14:01:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.57715
- Title: Efficient Logic Gate Networks for Video Copy Detection
- Title(参考訳): ビデオコピー検出のための効率的な論理ゲートネットワーク
- Authors: Katarzyna Fojcik,
- Abstract要約: ビデオコピー検出は、多様な視覚歪みの下で頑健な類似性推定を必要とする。
ディープニューラルネットワークは高いパフォーマンスを実現するが、計算コストとディスクリプタサイズは実際のデプロイメントを制限している。
可変論理ゲートネットワークに基づくビデオコピー検出フレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video copy detection requires robust similarity estimation under diverse visual distortions while operating at very large scale. Although deep neural networks achieve strong performance, their computational cost and descriptor size limit practical deployment in high-throughput systems. In this work, we propose a video copy detection framework based on differentiable Logic Gate Networks (LGNs), which replace conventional floating-point feature extractors with compact, logic-based representations. Our approach combines aggressive frame miniaturization, binary preprocessing, and a trainable LGN embedding model that learns both logical operations and interconnections. After training, the model can be discretized into a purely Boolean circuit, enabling extremely fast and memory-efficient inference. We systematically evaluate different similarity strategies, binarization schemes, and LGN architectures across multiple dataset folds and difficulty levels. Experimental results demonstrate that LGN-based models achieve competitive or superior accuracy and ranking performance compared to prior models, while producing descriptors several orders of magnitude smaller and delivering inference speeds exceeding 11k samples per second. These findings indicate that logic-based models offer a promising alternative for scalable and resource-efficient video copy detection.
- Abstract(参考訳): ビデオコピー検出は、非常に大規模な操作において、多様な視覚歪みの下で頑健な類似性推定を必要とする。
ディープニューラルネットワークは高い性能を達成するが、その計算コストと記述子サイズは、高スループットシステムにおける実践的な展開を制限する。
本研究では,従来の浮動小数点特徴抽出器をコンパクトな論理ベース表現に置き換えた,微分可能論理ゲートネットワーク(LGN)に基づくビデオコピー検出フレームワークを提案する。
我々のアプローチは、アグレッシブフレームの小型化、バイナリ前処理、および論理演算と相互接続の両方を学ぶ訓練可能なLGN埋め込みモデルを組み合わせる。
トレーニング後、モデルは純粋にブール回路に離散化することができ、非常に高速でメモリ効率の良い推論を可能にする。
我々は、複数のデータセットの折り畳みと難易度で異なる類似性戦略、双対化スキーム、LGNアーキテクチャを体系的に評価した。
実験結果から,LGNベースのモデルでは,先行モデルに比べて競合的あるいは優れた精度とランク付け性能が得られ,デクリプタは桁違いに小さく,毎秒1k以上の推論速度を実現していることがわかった。
これらの結果は、論理ベースのモデルが、スケーラブルでリソース効率のよいビデオコピー検出に、有望な代替手段を提供することを示している。
関連論文リスト
- MSN: Multi-directional Similarity Network for Hand-crafted and Deep-synthesized Copy-Move Forgery Detection [41.87843079741093]
本稿では,複数方向類似性ネットワーク(MSN)と呼ばれる新しい2ストリームモデルを提案する。
画像は多方向CNNネットワークによって階層的に符号化され、スケールや回転の多様化により、2つのストリームにおけるサンプルパッチの類似性をよりよく測定できる。
ローカライゼーションでは,2次元類似度行列に基づくデコーダを設計し,現在の1次元類似度ベクトルに基づくデコーダと比較して,画像全体の空間情報をフル活用する。
論文 参考訳(メタデータ) (2025-12-08T02:47:05Z) - Multi-Scale Invertible Neural Network for Wide-Range Variable-Rate Learned Image Compression [90.59962443790593]
本稿では,制限を克服するために,可逆変換に基づく可変レート画像圧縮モデルを提案する。
具体的には、入力画像をマルチスケールの潜在表現にマッピングする、軽量なマルチスケール非可逆ニューラルネットワークを設計する。
実験結果から,提案手法は既存の可変レート法と比較して最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2025-03-27T09:08:39Z) - Binary Code Similarity Detection via Graph Contrastive Learning on Intermediate Representations [52.34030226129628]
バイナリコード類似度検出(BCSD)は、脆弱性検出、マルウェア分析、コードの再利用識別など、多くの分野で重要な役割を果たしている。
本稿では,LLVM-IRと高レベルのセマンティック抽象化を利用して,コンパイル差を緩和するIRBinDiffを提案する。
IRBinDiffは1対1の比較と1対多の検索シナリオにおいて,他の主要なBCSD手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-24T09:09:20Z) - Representation Similarity: A Better Guidance of DNN Layer Sharing for Edge Computing without Training [3.792729116385123]
本稿では,表現類似度Sで導かれる表現をエッジで共有することで,新しいモデルマージ方式を提案する。
Pearson correlation Coefficient |r| > 0.94 than other metrics。
論文 参考訳(メタデータ) (2024-10-15T03:35:54Z) - SIGMA:Sinkhorn-Guided Masked Video Modeling [69.31715194419091]
SIGMA (Sinkhorn-guided Masked Video Modelling) は、新しいビデオ事前学習法である。
時空管の特徴を,限られた数の学習可能なクラスタに均等に分散する。
10個のデータセットによる実験結果から,より高性能で時間的,堅牢な映像表現を学習する上で,SIGMAの有効性が検証された。
論文 参考訳(メタデータ) (2024-07-22T08:04:09Z) - ZippyPoint: Fast Interest Point Detection, Description, and Matching
through Mixed Precision Discretization [71.91942002659795]
我々は,ネットワーク量子化技術を用いて推論を高速化し,計算限定プラットフォームでの利用を可能にする。
バイナリディスクリプタを用いた効率的な量子化ネットワークZippyPointは,ネットワーク実行速度,ディスクリプタマッチング速度,3Dモデルサイズを改善する。
これらの改善は、ホモグラフィー推定、視覚的ローカライゼーション、マップフリーな視覚的再ローカライゼーションのタスクで評価されるように、小さなパフォーマンス劣化をもたらす。
論文 参考訳(メタデータ) (2022-03-07T18:59:03Z) - Rate Distortion Characteristic Modeling for Neural Image Compression [59.25700168404325]
エンドツーエンドの最適化機能は、ニューラルイメージ圧縮(NIC)の優れた損失圧縮性能を提供する。
異なるモデルは、R-D空間の異なる点に到達するために訓練される必要がある。
深層ネットワークと統計モデルを用いてNICのR-D挙動を記述するために,本質的な数学的関数の定式化に努めている。
論文 参考訳(メタデータ) (2021-06-24T12:23:05Z) - Unsupervised Learning Consensus Model for Dynamic Texture Videos
Segmentation [12.462608802359936]
動的テクスチャのセグメンテーションのための効果的な教師なし学習コンセンサスモデルを提案する。
提案モデルでは,分類対象画素の周辺部における再量子化局所2値パターン(LBP)ヒストグラムの値の集合を特徴として用いた。
挑戦的なSynthDBデータセットで実施された実験は、ULCMが大幅に高速で、コーディングが簡単で、単純で、パラメータが限られていることを示している。
論文 参考訳(メタデータ) (2020-06-29T16:40:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。