論文の概要: Online Hybrid Lightweight Representations Learning: Its Application to
Visual Tracking
- arxiv url: http://arxiv.org/abs/2205.11179v1
- Date: Mon, 23 May 2022 10:31:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-24 18:08:47.908442
- Title: Online Hybrid Lightweight Representations Learning: Its Application to
Visual Tracking
- Title(参考訳): オンラインハイブリッド軽量表現学習:その視覚追跡への応用
- Authors: Ilchae Jung, Minji Kim, Eunhyeok Park, Bohyung Han
- Abstract要約: 本稿では,ストリーミングデータのための新しいハイブリッド表現学習フレームワークを提案する。
ビデオ内の画像フレームは、2つの異なるディープニューラルネットワークのアンサンブルによってモデル化される。
ハイブリッド表現手法をオンライン視覚追跡タスクに組み込む。
- 参考スコア(独自算出の注目度): 42.49852446519412
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a novel hybrid representation learning framework for
streaming data, where an image frame in a video is modeled by an ensemble of
two distinct deep neural networks; one is a low-bit quantized network and the
other is a lightweight full-precision network. The former learns coarse primary
information with low cost while the latter conveys residual information for
high fidelity to original representations. The proposed parallel architecture
is effective to maintain complementary information since fixed-point arithmetic
can be utilized in the quantized network and the lightweight model provides
precise representations given by a compact channel-pruned network. We
incorporate the hybrid representation technique into an online visual tracking
task, where deep neural networks need to handle temporal variations of target
appearances in real-time. Compared to the state-of-the-art real-time trackers
based on conventional deep neural networks, our tracking algorithm demonstrates
competitive accuracy on the standard benchmarks with a small fraction of
computational cost and memory footprint.
- Abstract(参考訳): 本稿では,ビデオ内の画像フレームを2つの異なるディープニューラルネットワークのアンサンブルでモデル化し,一方は低ビット量子化ネットワークであり,他方は軽量な完全精度ネットワークである,ストリーミングデータのための新しいハイブリッド表現学習フレームワークを提案する。
前者は粗い一次情報を低コストで学習し、後者は元の表現に忠実な残差情報を伝達する。
提案する並列アーキテクチャは,定点演算を量子化ネットワークで活用でき,軽量モデルはコンパクトなチャネルプラニングネットワークで与えられる正確な表現を提供するため,補完的情報を維持するのに有効である。
我々はこのハイブリッド表現手法を、ディープニューラルネットワークがリアルタイムにターゲットの外観の時間的変動を処理する必要があるオンライン視覚追跡タスクに組み込む。
従来のディープニューラルネットワークに基づく最先端のリアルタイムトラッカーと比較して,我々の追跡アルゴリズムは,計算コストとメモリフットプリントの少ない標準ベンチマークにおける競合精度を示す。
関連論文リスト
- TCCT-Net: Two-Stream Network Architecture for Fast and Efficient Engagement Estimation via Behavioral Feature Signals [58.865901821451295]
本稿では,新しい2ストリーム機能融合 "Tensor-Convolution and Convolution-Transformer Network" (TCCT-Net) アーキテクチャを提案する。
時間空間領域における意味のあるパターンをよりよく学習するために、ハイブリッド畳み込み変換器を統合する「CT」ストリームを設計する。
並行して、時間周波数領域からリッチなパターンを効率的に抽出するために、連続ウェーブレット変換(CWT)を用いて情報を2次元テンソル形式で表現する「TC」ストリームを導入する。
論文 参考訳(メタデータ) (2024-04-15T06:01:48Z) - Efficient and Accurate Hyperspectral Image Demosaicing with Neural Network Architectures [3.386560551295746]
本研究では,ハイパースペクトル画像復調におけるニューラルネットワークアーキテクチャの有効性について検討した。
様々なネットワークモデルと修正を導入し、それらを従来の手法や既存の参照ネットワークアプローチと比較する。
その結果、我々のネットワークは、例外的な性能を示す両方のデータセットにおいて、参照モデルよりも優れるか、一致していることがわかった。
論文 参考訳(メタデータ) (2023-12-21T08:02:49Z) - Building a Graph-based Deep Learning network model from captured traffic
traces [4.671648049111933]
技術ネットワークモデルの現状は離散事象シミュレーション(DES)に基づいているか依存している
DESは非常に正確であり、計算コストも高く、並列化も困難であり、高性能ネットワークをシミュレートするには実用的ではない。
我々は,実際のネットワークシナリオの複雑さをより正確に捉えるために,グラフニューラルネットワーク(GNN)ベースのソリューションを提案する。
論文 参考訳(メタデータ) (2023-10-18T11:16:32Z) - Neural Maximum A Posteriori Estimation on Unpaired Data for Motion
Deblurring [87.97330195531029]
本稿では、ニューラルネットワークをトレーニングし、失明したデータから視覚情報や鋭いコンテンツを復元するためのニューラルネットワークの最大Aポストエリオリ(NeurMAP)推定フレームワークを提案する。
提案されたNeurMAPは、既存のデブロアリングニューラルネットワークに対するアプローチであり、未使用データセット上のイメージデブロアリングネットワークのトレーニングを可能にする最初のフレームワークである。
論文 参考訳(メタデータ) (2022-04-26T08:09:47Z) - Event Neural Networks [13.207573300016277]
イベントニューラルネットワーク(EvNets)は、繰り返しを利用して、ビデオ推論タスクの大幅な削減を実現する。
従来のニューラルネットを仮想的にEvNetに変換することは可能であることを示す。
本研究では,高レベルかつ低レベルの視覚処理において,最先端のニューラルネットワークにおける本手法の有効性を実証する。
論文 参考訳(メタデータ) (2021-12-02T00:08:48Z) - CondenseNeXt: An Ultra-Efficient Deep Neural Network for Embedded
Systems [0.0]
畳み込みニューラルネットワーク(英: Convolutional Neural Network, CNN)は、画像センサが捉えた視覚画像の分析に広く用いられているディープニューラルネットワーク(DNN)のクラスである。
本稿では,組込みシステム上でのリアルタイム推論のために,既存のCNNアーキテクチャの性能を改善するために,深層畳み込みニューラルネットワークアーキテクチャの新しい変種を提案する。
論文 参考訳(メタデータ) (2021-12-01T18:20:52Z) - Neural BRDF Representation and Importance Sampling [79.84316447473873]
本稿では,リフレクタンスBRDFデータのコンパクトニューラルネットワークに基づく表現について述べる。
BRDFを軽量ネットワークとしてエンコードし、適応角サンプリングによるトレーニングスキームを提案する。
複数の実世界のデータセットから等方性および異方性BRDFの符号化結果を評価する。
論文 参考訳(メタデータ) (2021-02-11T12:00:24Z) - Binary Graph Neural Networks [69.51765073772226]
グラフニューラルネットワーク(gnns)は、不規則データに対する表現学習のための強力で柔軟なフレームワークとして登場した。
本稿では,グラフニューラルネットワークのバイナライゼーションのための異なる戦略を提示し,評価する。
モデルの慎重な設計とトレーニングプロセスの制御によって、バイナリグラフニューラルネットワークは、挑戦的なベンチマークの精度において、適度なコストでトレーニングできることを示しています。
論文 参考訳(メタデータ) (2020-12-31T18:48:58Z) - Graph-Based Neural Network Models with Multiple Self-Supervised
Auxiliary Tasks [79.28094304325116]
グラフ畳み込みネットワークは、構造化されたデータポイント間の関係をキャプチャするための最も有望なアプローチである。
マルチタスク方式でグラフベースニューラルネットワークモデルを学習するための3つの新しい自己教師付き補助タスクを提案する。
論文 参考訳(メタデータ) (2020-11-14T11:09:51Z) - Exploring the Connection Between Binary and Spiking Neural Networks [1.329054857829016]
両立ニューラルネットワークとスパイクニューラルネットワークの訓練における最近のアルゴリズムの進歩を橋渡しする。
極端量子化システムにおけるスパイキングニューラルネットワークのトレーニングは,大規模データセット上でのほぼ完全な精度向上をもたらすことを示す。
論文 参考訳(メタデータ) (2020-02-24T03:46:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。