論文の概要: LP$^{2}$DH: A Locality-Preserving Pixel-Difference Hashing Framework for Dynamic Texture Recognition
- arxiv url: http://arxiv.org/abs/2604.15707v1
- Date: Fri, 17 Apr 2026 05:27:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.746378
- Title: LP$^{2}$DH: A Locality-Preserving Pixel-Difference Hashing Framework for Dynamic Texture Recognition
- Title(参考訳): LP$^{2}$DH:動的テクスチャ認識のための局所保存型画素差ハッシュフレームワーク
- Authors: Ruxin Ding, Jianfeng Ren, Heng Yu, Jiawei Li, Xudong Jiang,
- Abstract要約: 局所バイナリパターン(STLBP)は、広く使われている動的テクスチャ記述子であるが、非常に高次元性に悩まされている。
これを解決するために、STLBPの特徴はしばしば3つの平面上で抽出される。
本研究では,近隣のLP$2$DHの違いを共同で符号化する枠組みを提案する。
- 参考スコア(独自算出の注目度): 24.985206222246955
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Spatiotemporal Local Binary Pattern (STLBP) is a widely used dynamic texture descriptor, but it suffers from extremely high dimensionality. To tackle this, STLBP features are often extracted on three orthogonal planes, which sacrifice inter-plane correlation. In this work, we propose a Locality-Preserving Pixel-Difference Hashing (LP$^{2}$DH) framework that jointly encodes pixel differences in the full spatiotemporal neighbourhood. LP$^{2}$DH transforms Pixel-Difference Vectors (PDVs) into compact binary codes with maximal discriminative power. Furthermore, we incorporate a locality-preserving embedding to maintain the PDVs' local structure before and after hashing. Then, a curvilinear search strategy is utilized to jointly optimize the hashing matrix and binary codes via gradient descent on the Stiefel manifold. After hashing, dictionary learning is applied to encode the binary vectors into codewords, and the resulting histogram is utilized as the final feature representation. The proposed LP$^{2}$DH achieves state-of-the-art performance on three major dynamic texture recognition benchmarks: 99.80% against DT-GoogleNet's 98.93% on UCLA, 98.52% against HoGF$^{3D}$'s 97.63% on DynTex++, and 96.19% compared to STS's 95.00% on YUPENN. The source code is available at: https://github.com/drx770/LP2DH.
- Abstract(参考訳): 時空間境界パターン (STLBP) は動的テクスチャ記述法として広く用いられているが, 極めて高次元性に悩まされている。
これを解決するために、STLBPの特徴はしばしば3つの直交平面上で抽出される。
本研究では,全時空間における画素差を共同符号化する局所性保存型Pixel-Difference Hashing (LP$^{2}$DH) フレームワークを提案する。
LP$^{2}$DHは、Pixel-Difference Vectors (PDV) を最大判別力を持つコンパクトなバイナリコードに変換する。
さらに, ハッシュ前後のPDVの局所構造を維持するために, 局所保存埋め込みを組み込んだ。
次に、シュティーフェル多様体上の勾配降下によるハッシュ行列とバイナリ符号を協調的に最適化するために、曲線探索戦略を用いる。
ハッシュ後、二進ベクトルをコードワードにエンコードするために辞書学習を適用し、その結果のヒストグラムを最終特徴表現として利用する。
提案されたLP$^{2}$DHは、DT-GoogleNetの98.93%をUCLAで、98.52%をHoGF$^{3D}$で、97.63%をDynTex++で、STSの95.00%をYUPENNで、96.19%という3つの主要な動的テクスチャ認識ベンチマークで、最先端のパフォーマンスを達成した。
ソースコードは、https://github.com/drx770/LP2DHで入手できる。
関連論文リスト
- 3DGS$^2$-TR: Scalable Second-Order Trust-Region Method for 3D Gaussian Splatting [25.277141070184083]
3次元ガウススティングにおけるトレーニング問題を高速化する2次計算法である3DGS$2$-TRを提案する(3DGS)。
本手法はハッチンソン法を用いて, ヘッセン行列の対角線のみを用いて曲率を近似する。
3DGS$2$-TRは、ADAMよりも50%少ないトレーニングイテレーション、3DGS-LMより85%少ないトレーニングイテレーションを使用して、標準データセットの再構築品質を向上させることができる。
論文 参考訳(メタデータ) (2026-01-30T23:14:09Z) - Sparse VideoGen2: Accelerate Video Generation with Sparse Attention via Semantic-Aware Permutation [84.00166854547241]
拡散変換器(DiT)はビデオ生成に必須であるが,注意の2次複雑さにより遅延が著しく低下する。
SVG2は,識別精度を最大化し,無駄を最小化する学習自由フレームワークである。
論文 参考訳(メタデータ) (2025-05-24T21:30:29Z) - TSP3D: Text-guided Sparse Voxel Pruning for Efficient 3D Visual Grounding [74.033589504806]
視覚的グラウンド化のための効率的なマルチレベル畳み込みアーキテクチャを提案する。
提案手法はトップ推論速度を達成し,従来の最速の手法を100% FPS で上回っている。
論文 参考訳(メタデータ) (2025-02-14T18:59:59Z) - HAC: Hash-grid Assisted Context for 3D Gaussian Splatting Compression [55.6351304553003]
3D Gaussian Splatting (3DGS) は、新しいビュー合成のための有望なフレームワークとして登場した。
高速な3DGS表現のためのHash-grid Assisted Context (HAC) フレームワークを提案する。
私たちの研究は、コンテキストベースの3DGS表現の圧縮を探求するパイオニアです。
論文 参考訳(メタデータ) (2024-03-21T16:28:58Z) - Robust Zero Level-Set Extraction from Unsigned Distance Fields Based on
Double Covering [28.268387694075415]
非符号距離場(UDF)からゼロレベルセットを抽出する新しい手法を提案する。
DoubleCoverUDFは学習したUDFとユーザが指定したパラメータ $r$ を入力として取ります。
計算されたアイソ曲面は、対象ゼロレベルセット$S$の$r$オフセット体積の境界であることを示す。
論文 参考訳(メタデータ) (2023-10-05T10:17:30Z) - CAGroup3D: Class-Aware Grouping for 3D Object Detection on Point Clouds [55.44204039410225]
本稿では,CAGroup3Dという新しい2段階完全スパース3Dオブジェクト検出フレームワークを提案する。
提案手法は,まず,オブジェクト表面のボクセル上でのクラス認識型局所群戦略を活用することによって,高品質な3D提案を生成する。
不正なボクセルワイドセグメンテーションにより欠落したボクセルの特徴を回復するために,完全にスパースな畳み込み型RoIプールモジュールを構築した。
論文 参考訳(メタデータ) (2022-10-09T13:38:48Z) - Dynamic Texture Recognition using PDV Hashing and Dictionary Learning on
Multi-scale Volume Local Binary Pattern [11.497810572868396]
PHD-MVLBPを用いたPDVハッシュと辞書学習を用いた動的テクスチャ認識手法を提案する。
非常に高次元のLPPヒストグラムの特徴を形成する代わりに、まずハッシュ関数を使用してピクセル差分ベクトル(PDV)を二進ベクトルにマッピングし、それから導出した二進ベクトルを用いて辞書を作成し、導出した辞書を用いてそれらをエンコードする。
論文 参考訳(メタデータ) (2021-11-24T07:57:14Z) - ASH: A Modern Framework for Parallel Spatial Hashing in 3D Perception [91.24236600199542]
ASHは、GPU上の並列空間ハッシュのためのモダンで高性能なフレームワークである。
ASHはより高いパフォーマンスを実現し、よりリッチな機能をサポートし、より少ないコード行を必要とする。
ASHとそのサンプルアプリケーションはOpen3Dでオープンソース化されている。
論文 参考訳(メタデータ) (2021-10-01T16:25:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。