論文の概要: Dynamic Texture Recognition using PDV Hashing and Dictionary Learning on
Multi-scale Volume Local Binary Pattern
- arxiv url: http://arxiv.org/abs/2111.12315v1
- Date: Wed, 24 Nov 2021 07:57:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-25 15:36:22.805372
- Title: Dynamic Texture Recognition using PDV Hashing and Dictionary Learning on
Multi-scale Volume Local Binary Pattern
- Title(参考訳): PDVハッシュを用いた動的テクスチャ認識と多スケールボリューム局所バイナリパターンを用いた辞書学習
- Authors: Ruxin Ding, Jianfeng Ren, Heng Yu, Jiawei Li
- Abstract要約: PHD-MVLBPを用いたPDVハッシュと辞書学習を用いた動的テクスチャ認識手法を提案する。
非常に高次元のLPPヒストグラムの特徴を形成する代わりに、まずハッシュ関数を使用してピクセル差分ベクトル(PDV)を二進ベクトルにマッピングし、それから導出した二進ベクトルを用いて辞書を作成し、導出した辞書を用いてそれらをエンコードする。
- 参考スコア(独自算出の注目度): 11.497810572868396
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Spatial-temporal local binary pattern (STLBP) has been widely used in dynamic
texture recognition. STLBP often encounters the high-dimension problem as its
dimension increases exponentially, so that STLBP could only utilize a small
neighborhood. To tackle this problem, we propose a method for dynamic texture
recognition using PDV hashing and dictionary learning on multi-scale volume
local binary pattern (PHD-MVLBP). Instead of forming very high-dimensional LBP
histogram features, it first uses hash functions to map the pixel difference
vectors (PDVs) to binary vectors, then forms a dictionary using the derived
binary vector, and encodes them using the derived dictionary. In such a way,
the PDVs are mapped to feature vectors of the size of dictionary, instead of
LBP histograms of very high dimension. Such an encoding scheme could extract
the discriminant information from videos in a much larger neighborhood
effectively. The experimental results on two widely-used dynamic textures
datasets, DynTex++ and UCLA, show the superiority performance of the proposed
approach over the state-of-the-art methods.
- Abstract(参考訳): 動的テクスチャ認識には時空間局所パターン(STLBP)が広く用いられている。
STLBPは、その次元が指数関数的に増加するにつれて、しばしば高次元問題に遭遇する。
この問題に対処するために,多スケールボリュームローカルバイナリパターン(PHD-MVLBP)を用いたPDVハッシュと辞書学習を用いた動的テクスチャ認識手法を提案する。
非常に高次元のLPPヒストグラムの特徴を形成する代わりに、まずハッシュ関数を使用してピクセル差分ベクトル(PDV)を二進ベクトルにマッピングし、それから導出した二進ベクトルを用いて辞書を作成し、導出した辞書を使ってそれらを符号化する。
このように、pdvは、非常に高次元のlppヒストグラムではなく、辞書の大きさのベクトルを特徴付けるようにマッピングされる。
このような符号化方式は、より広い範囲の動画から識別情報を効果的に抽出することができる。
広く使われている2つの動的テクスチャデータセットであるDynTex++とUCLAの実験結果から,提案手法が最先端手法よりも優れていることを示す。
関連論文リスト
- Local Binary Pattern(LBP) Optimization for Feature Extraction [0.08192907805418582]
局所バイナリパターン(LBP)は、画像の局所的なテクスチャの特徴を記述する強力な演算子である。
本稿では,演算子を3つの行列に分割することで,LBPの数学的表現を新たに提供する。
分類性能の向上のために,新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-26T10:59:19Z) - Low Rank Multi-Dictionary Selection at Scale [5.827700856320355]
LRMDSという低ランクスパース符号化のための多次元原子選択手法を提案する。
我々は,合成データセットと実世界のデータセットの両方において,LRMDSのスケーラビリティを実証する。
論文 参考訳(メタデータ) (2024-06-11T05:40:45Z) - Fast Machine Learning Method with Vector Embedding on Orthonormal Basis
and Spectral Transform [0.0]
本稿では,ユリア語でベクトルデータベースを用いて実装された単語埋め込み,テキストチャンク埋め込み,画像埋め込みの例を示す。
また,本手法を用いた教師なし学習と教師なし学習と,大規模データ量を扱う戦略についても検討した。
論文 参考訳(メタデータ) (2023-10-27T18:48:54Z) - LexLIP: Lexicon-Bottlenecked Language-Image Pre-Training for Large-Scale
Image-Text Retrieval [71.01982683581572]
従来の高密度検索パラダイムは、デュアルストリームエンコーダを用いて画像やテキストを高密度表現に符号化することに依存している。
本稿では,語彙空間における疎表現を画像やテキストに対して学習する語彙重み付けパラダイムを提案する。
重要度を意識した辞書表現を学習する新しい事前学習フレームワークを提案する。
我々のフレームワークは、検索速度5.5221.3倍、インデックス記憶メモリ13.248.8倍の高速化を実現している。
論文 参考訳(メタデータ) (2023-02-06T16:24:41Z) - Learning-Based Dimensionality Reduction for Computing Compact and
Effective Local Feature Descriptors [101.62384271200169]
特徴の形でのイメージパッチの独特な表現は多くのコンピュータビジョンとロボティクスのタスクの重要な構成要素である。
マルチ層パーセプトロン(MLP)を用いて,低次元ながら高品質な記述子を抽出する。
視覚的ローカライゼーション、パッチ検証、画像マッチング、検索など、さまざまなアプリケーションについて検討する。
論文 参考訳(メタデータ) (2022-09-27T17:59:04Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - Dictionary Learning with Uniform Sparse Representations for Anomaly
Detection [2.277447144331876]
本研究では,信号のデータセットにおける異常サンプルの検出において,辞書学習(DL)が果たす役割について検討する。
数値シミュレーションにより、この結果のサブスペースを効率よく利用し、正規データ点上の異常を識別できることが示されている。
論文 参考訳(メタデータ) (2022-01-11T10:22:46Z) - ASH: A Modern Framework for Parallel Spatial Hashing in 3D Perception [91.24236600199542]
ASHは、GPU上の並列空間ハッシュのためのモダンで高性能なフレームワークである。
ASHはより高いパフォーマンスを実現し、よりリッチな機能をサポートし、より少ないコード行を必要とする。
ASHとそのサンプルアプリケーションはOpen3Dでオープンソース化されている。
論文 参考訳(メタデータ) (2021-10-01T16:25:40Z) - A Holistically-Guided Decoder for Deep Representation Learning with
Applications to Semantic Segmentation and Object Detection [74.88284082187462]
一般的な戦略の1つは、バックボーンネットワークに拡張畳み込みを採用し、高解像度のフィーチャーマップを抽出することです。
本稿では,高分解能なセマンティクスリッチな特徴マップを得るために紹介される,新たなホリスティック誘導デコーダを提案する。
論文 参考訳(メタデータ) (2020-12-18T10:51:49Z) - Appliance identification using a histogram post-processing of 2D local
binary patterns for smart grid applications [2.389598109913753]
本稿では,電力信号から2次元空間への変換後の電力信号の抽出手法を提案する。
従来のLBPの識別能力の向上に依存する改良された局所二分法(LBP)を提案する。
2つの異なるデータセットに対して総合的な性能評価を行う。
論文 参考訳(メタデータ) (2020-10-03T19:23:30Z) - Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。
次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。
最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。
本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文 参考訳(メタデータ) (2020-08-25T06:00:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。