論文の概要: A Compact Deep Architecture for Real-time Saliency Prediction
- arxiv url: http://arxiv.org/abs/2008.13227v1
- Date: Sun, 30 Aug 2020 17:47:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-23 12:18:41.519357
- Title: A Compact Deep Architecture for Real-time Saliency Prediction
- Title(参考訳): リアルタイムsaliency予測のためのコンパクト深層アーキテクチャ
- Authors: Samad Zabihi, Hamed Rezazadegan Tavakoli, Ali Borji
- Abstract要約: 唾液度モデルは、人間の視覚系における注意機構を模倣することを目的としている。
ディープモデルは多数のパラメータを持ち、リアルタイムアプリケーションには適さない。
本稿では,実時間精度予測のためのコンパクトかつ高速なモデルを提案する。
- 参考スコア(独自算出の注目度): 42.58396452892243
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Saliency computation models aim to imitate the attention mechanism in the
human visual system. The application of deep neural networks for saliency
prediction has led to a drastic improvement over the last few years. However,
deep models have a high number of parameters which makes them less suitable for
real-time applications. Here we propose a compact yet fast model for real-time
saliency prediction. Our proposed model consists of a modified U-net
architecture, a novel fully connected layer, and central difference
convolutional layers. The modified U-Net architecture promotes compactness and
efficiency. The novel fully-connected layer facilitates the implicit capturing
of the location-dependent information. Using the central difference
convolutional layers at different scales enables capturing more robust and
biologically motivated features. We compare our model with state of the art
saliency models using traditional saliency scores as well as our newly devised
scheme. Experimental results over four challenging saliency benchmark datasets
demonstrate the effectiveness of our approach in striking a balance between
accuracy and speed. Our model can be run in real-time which makes it appealing
for edge devices and video processing.
- Abstract(参考訳): 残差計算モデルは人間の視覚系における注意機構を模倣することを目的としている。
深層ニューラルネットワークの唾液率予測への応用は、ここ数年で大幅に改善されている。
しかし、深層モデルには多くのパラメータがあるため、リアルタイムアプリケーションには適さない。
本稿では,実時間精度予測のためのコンパクトかつ高速なモデルを提案する。
提案モデルは,u-netアーキテクチャの改良,新しい完全連結層,中央差分畳み込み層からなる。
修正されたu-netアーキテクチャはコンパクト性と効率性を促進する。
新たな完全接続層は、位置依存情報の暗黙的捕捉を容易にする。
異なるスケールで中央差分畳み込み層を使用することで、より堅牢で生物学的に動機付けられた特徴をキャプチャできる。
従来のサリエンシスコアと新たに考案したスキームを用いて,我々のモデルとアートサリエンシモデルの現状を比較した。
4つの難解なsaliency benchmarkデータセットに対する実験結果は、精度と速度のバランスを取るためのアプローチの有効性を示しています。
我々のモデルは、エッジデバイスやビデオ処理にアピールするために、リアルタイムで実行できる。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - NAR-Former: Neural Architecture Representation Learning towards Holistic
Attributes Prediction [37.357949900603295]
本稿では,属性の全体的推定に使用できるニューラルネットワーク表現モデルを提案する。
実験の結果,提案するフレームワークは,セルアーキテクチャとディープニューラルネットワーク全体の遅延特性と精度特性を予測できることがわかった。
論文 参考訳(メタデータ) (2022-11-15T10:15:21Z) - Dynamic Spatial Sparsification for Efficient Vision Transformers and
Convolutional Neural Networks [88.77951448313486]
視覚データにおける空間空間空間性を利用したモデルアクセラレーションのための新しい手法を提案する。
本稿では,冗長トークンを具現化する動的トークンスペーシフィケーションフレームワークを提案する。
提案手法は,CNNや階層型視覚変換器などの階層モデルに拡張する。
論文 参考訳(メタデータ) (2022-07-04T17:00:51Z) - STAR: Sparse Transformer-based Action Recognition [61.490243467748314]
本研究は,空間的次元と時間的次元に細かな注意を払っている新しいスケルトンに基づく人間行動認識モデルを提案する。
実験により、トレーニング可能なパラメータをはるかに少なくし、トレーニングや推論の高速化を図りながら、モデルが同等のパフォーマンスを達成できることが示されている。
論文 参考訳(メタデータ) (2021-07-15T02:53:11Z) - Sparse Flows: Pruning Continuous-depth Models [107.98191032466544]
生成モデルにおいて,プルーニングによりニューラルネットワークの一般化が向上することを示す。
また、プルーニングは、元のネットワークに比べて最大98%少ないパラメータで、精度を損なうことなく、最小かつ効率的なニューラルODE表現を見出すことを示した。
論文 参考訳(メタデータ) (2021-06-24T01:40:17Z) - The Untapped Potential of Off-the-Shelf Convolutional Neural Networks [29.205446247063673]
ResNet-50のような既存の市販モデルは、ImageNet上で95%以上の精度を持つことを示す。
このレベルのパフォーマンスは現在、20倍以上のパラメータとはるかに複雑なトレーニング手順を持つモデルを上回る。
論文 参考訳(メタデータ) (2021-03-17T20:04:46Z) - Tidying Deep Saliency Prediction Architectures [6.613005108411055]
本稿では,入力特徴,マルチレベル統合,読み出しアーキテクチャ,損失関数の4つの主成分を同定する。
我々はSimpleNet と MDNSal という2つの新しいエンドツーエンドアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-03-10T19:34:49Z) - An Image Enhancing Pattern-based Sparsity for Real-time Inference on
Mobile Devices [58.62801151916888]
パターンと接続性を組み合わせた新しい空間空間,すなわちパターンベースの空間空間を導入し,高度に正確かつハードウェアに親しみやすいものにした。
新たなパターンベースの空間性に対する我々のアプローチは,モバイルプラットフォーム上での高効率DNN実行のためのコンパイラ最適化に自然に適合する。
論文 参考訳(メタデータ) (2020-01-20T16:17:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。