論文の概要: Fast and Accurate Light Field Saliency Detection through Deep Encoding
- arxiv url: http://arxiv.org/abs/2010.13073v2
- Date: Mon, 13 Dec 2021 17:12:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 04:57:11.714473
- Title: Fast and Accurate Light Field Saliency Detection through Deep Encoding
- Title(参考訳): 深部符号化による高速・高精度光場塩分検出
- Authors: Sahan Hemachandra, Ranga Rodrigo, Chamira Edussooriya
- Abstract要約: 光電界のサリエンシ検出は依然として速度に欠けており、精度も向上している。
既存のアプローチでは、トレーニングに必要な大量の計算リソースを消費し、テストの実行時間も長くなります。
より小さな3チャンネル特徴写像に、大規模光フィールド画像を積極的に還元することで、この問題を解消する。
- 参考スコア(独自算出の注目度): 0.8356765961526955
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Light field saliency detection -- important due to utility in many vision
tasks -- still lacks speed and can improve in accuracy. Due to the formulation
of the saliency detection problem in light fields as a segmentation task or a
memorizing task, existing approaches consume unnecessarily large amounts of
computational resources for training, and have longer execution times for
testing. We solve this by aggressively reducing the large light field images to
a much smaller three-channel feature map appropriate for saliency detection
using an RGB image saliency detector with attention mechanisms. We achieve this
by introducing a novel convolutional neural network based features extraction
and encoding module. Our saliency detector takes $0.4$ s to process a light
field of size $9\times9\times512\times375$ in a CPU and is significantly faster
than state-of-the-art light field saliency detectors, with better or comparable
accuracy. Furthermore, model size of our architecture is significantly lower
compared to state-of-the-art light field saliency detectors. Our work shows
that extracting features from light fields through aggressive size reduction
and the attention mechanism results in a faster and accurate light field
saliency detector leading to near real-time light field processing.
- Abstract(参考訳): 多くのビジョンタスクで有効性のために重要な光フィールドのサリエンシ検出は、まだスピードが欠けており、精度が向上する可能性がある。
光場における分節タスクや記憶タスクとしての塩分検出問題の定式化により、既存のアプローチでは、トレーニングに必要となる大量の計算リソースを消費し、テストの実行時間が長い。
注意機構を備えたRGBイメージ・サリエンシ検出装置を用いて、より小さな3チャンネル特徴写像に積極的に光界像を減少させることにより、この問題を解消する。
本稿では,新しい畳み込みニューラルネットワークによる特徴抽出と符号化モジュールの導入により,これを実現する。
私たちのサリエンシー検出器は、サイズ9\times9\times512\times375$の光をcpuで処理するのに0.4$ sかかります。
さらに、我々のアーキテクチャのモデルサイズは、最先端の光電界サリエンシー検出器と比べてかなり低い。
本研究は,アグレッシブなサイズ縮小とアテンション機構により,光フィールドから特徴を抽出することで,より高速で正確な光フィールドサリエンシー検出器が実現され,ほぼリアルタイム光フィールド処理が可能となることを示す。
関連論文リスト
- Characterization of point-source transient events with a rolling-shutter compressed sensing system [0.0]
ポイントソースの過渡イベント(PSTE)は、イメージングシステムにいくつかの課題をもたらす。
これらの要件を満たす従来のイメージングシステムは、価格、サイズ、重量、消費電力、データ帯域幅の点で費用がかかる。
画像システムのローリングシャッター読み出しに適応した新しい圧縮センシングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-08-29T19:22:37Z) - SegNet: A Segmented Deep Learning based Convolutional Neural Network Approach for Drones Wildfire Detection [2.07180164747172]
本研究は,無人航空機(UAV)/ドローンによる地球規模の山火事検出における処理時間と検出能力の向上という課題に対処するものである。
我々は,リアルタイムの山火事検出における処理速度と精度を大幅に向上させるため,特徴マップの削減に重点を置いている。
論文 参考訳(メタデータ) (2024-02-29T15:23:12Z) - Learning based Deep Disentangling Light Field Reconstruction and
Disparity Estimation Application [1.5603081929496316]
本稿では,光電界拡散機構の原理を継承し,高度なネットワーク構造を付加するDeep Disentangling Mechanismを提案する。
本研究では,DDASR(Deep Disentangling Mechanism)に基づく光電場再構成ネットワークを設計し,実験においてSOTAの性能を実現する。
論文 参考訳(メタデータ) (2023-11-14T12:48:17Z) - Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - Low-Light Image Enhancement with Illumination-Aware Gamma Correction and
Complete Image Modelling Network [69.96295927854042]
低照度環境は通常、情報の少ない大規模な暗黒地帯に繋がる。
本稿では,ガンマ補正の有効性を深層ネットワークのモデリング能力と統合することを提案する。
指数関数演算は高い計算複雑性をもたらすので、Taylor Series を用いてガンマ補正を近似することを提案する。
論文 参考訳(メタデータ) (2023-08-16T08:46:51Z) - Factorized Inverse Path Tracing for Efficient and Accurate
Material-Lighting Estimation [97.0195314255101]
逆経路追跡は計算に高価であり、反射と放出の間に曖昧さが存在する。
当社のFactized Inverse Path Tracing (FIPT) は, ファクタリング光輸送の定式化によってこれらの課題に対処する。
提案アルゴリズムは, 従来よりも高精度な材料と照明の最適化を実現し, あいまいさの解消に有効である。
論文 参考訳(メタデータ) (2023-04-12T07:46:05Z) - Ultra-High-Definition Low-Light Image Enhancement: A Benchmark and
Transformer-Based Method [51.30748775681917]
低照度画像強調(LLIE)の課題を考察し,4K解像度と8K解像度の画像からなる大規模データベースを導入する。
我々は、系統的なベンチマーク研究を行い、現在のLLIEアルゴリズムと比較する。
第2のコントリビューションとして,変換器をベースとした低照度化手法であるLLFormerを紹介する。
論文 参考訳(メタデータ) (2022-12-22T09:05:07Z) - SALISA: Saliency-based Input Sampling for Efficient Video Object
Detection [58.22508131162269]
ビデオオブジェクト検出のための新しい一様SALiencyベースの入力SAmpling技術であるSALISAを提案する。
SALISAは小物体の検出を著しく改善することを示す。
論文 参考訳(メタデータ) (2022-04-05T17:59:51Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - Lightweight Convolutional Neural Network with Gaussian-based Grasping
Representation for Robotic Grasping Detection [4.683939045230724]
現在の物体検出器は、高い精度と高速な推論速度のバランスを取るのが難しい。
ロボットつかみポーズ推定を行うための効率的かつ堅牢な完全畳み込みニューラルネットワークモデルを提案する。
ネットワークは、他の優れたアルゴリズムよりも桁違いに小さい順序です。
論文 参考訳(メタデータ) (2021-01-25T16:36:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。