論文の概要: DynamicISP: Dynamically Controlled Image Signal Processor for Image
Recognition
- arxiv url: http://arxiv.org/abs/2211.01146v3
- Date: Mon, 28 Aug 2023 02:59:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-30 01:24:10.030300
- Title: DynamicISP: Dynamically Controlled Image Signal Processor for Image
Recognition
- Title(参考訳): dynamicisp:画像認識のための動的制御型画像信号処理装置
- Authors: Masakazu Yoshimura, Junji Otsuka, Atsushi Irie, Takeshi Ohashi
- Abstract要約: 動的ISPは、複数の古典的ISP関数から構成され、前のフレームの認識結果に応じて各フレームのパラメータを動的に制御する。
本稿では,複数のISP関数のパラメータの制御に成功し,単一および複数カテゴリのオブジェクト検出タスクにおいて,計算コストの低い最先端の精度を実現する。
- 参考スコア(独自算出の注目度): 0.5530212768657544
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image Signal Processors (ISPs) play important roles in image recognition
tasks as well as in the perceptual quality of captured images. In most cases,
experts make a lot of effort to manually tune many parameters of ISPs, but the
parameters are sub-optimal. In the literature, two types of techniques have
been actively studied: a machine learning-based parameter tuning technique and
a DNN-based ISP technique. The former is lightweight but lacks expressive
power. The latter has expressive power, but the computational cost is too heavy
on edge devices. To solve these problems, we propose "DynamicISP," which
consists of multiple classical ISP functions and dynamically controls the
parameters of each frame according to the recognition result of the previous
frame. We show our method successfully controls the parameters of multiple ISP
functions and achieves state-of-the-art accuracy with low computational cost in
single and multi-category object detection tasks.
- Abstract(参考訳): 画像信号処理装置(isp)は、画像認識タスクや撮像画像の知覚品質において重要な役割を果たす。
ほとんどの場合、専門家はISPの多くのパラメータを手動で調整するために多くの努力をしています。
文献では、機械学習に基づくパラメータチューニング技術とDNNベースのISP技術という2つの手法が活発に研究されている。
前者は軽量だが、表現力に欠ける。
後者は表現力があるが、計算コストはエッジデバイスでは重すぎる。
これらの問題を解決するために,複数の古典的ISP関数からなるDynamicISPを提案し,前フレームの認識結果に応じて各フレームのパラメータを動的に制御する。
本稿では,複数のISP関数のパラメータの制御に成功し,単一および複数カテゴリのオブジェクト検出タスクにおいて,計算コストの低い最先端の精度を実現する。
関連論文リスト
- Learning to Compose SuperWeights for Neural Parameter Allocation Search [61.078949532440724]
提案手法は,同じ重み集合を用いて多くのネットワークに対してパラメータを生成することができることを示す。
これにより、効率的なアンサンブルや、いつでも予測できるようなタスクをサポートできます。
論文 参考訳(メタデータ) (2023-12-03T04:20:02Z) - Learning Degradation-Independent Representations for Camera ISP
Pipelines [15.954407353419263]
本稿では, 自己教師付き学習ベースライン表現の洗練を通じて, 劣化非依存表現(DiR)を学習するための新しい手法を提案する。
提案手法はドメイン一般化能力に優れ,様々なダウンストリームタスクにおいて最先端の手法よりも優れる。
論文 参考訳(メタデータ) (2023-07-03T05:38:28Z) - T-former: An Efficient Transformer for Image Inpainting [50.43302925662507]
トランスフォーマーと呼ばれる注目に基づくネットワークアーキテクチャのクラスは、自然言語処理の分野で大きなパフォーマンスを示している。
本稿では,Taylorの展開に応じて,解像度に線形に関連付けられた新たな注意を設計し,この注意に基づいて,画像インペイントのためのネットワークである$T$-formerを設計する。
いくつかのベンチマークデータセットの実験により,提案手法は比較的少ないパラメータ数と計算複雑性を維持しつつ,最先端の精度を達成できることが示されている。
論文 参考訳(メタデータ) (2023-05-12T04:10:42Z) - LW-ISP: A Lightweight Model with ISP and Deep Learning [17.972611191715888]
ISPパイプラインにおけるリアルタイム高速処理を実現するための学習ベース手法の可能性を示す。
RAWデータからRGB画像へのイメージマッピングを暗黙的に学習する新しいアーキテクチャであるLW-ISPを提案する。
実験により、LW-ISPはPSNRの0.38dB改善を達成した。
論文 参考訳(メタデータ) (2022-10-08T04:00:03Z) - DRL-ISP: Multi-Objective Camera ISP with Deep Reinforcement Learning [82.4114562598703]
本稿では,Deep Reinforcement Learning(DRL)とカメラISPツールボックスを利用するカメラISPフレームワークを提案する。
DRLベースのカメラISPフレームワークは、ツールボックスから適切なツールを反復的に選択し、画像に適用して、与えられた視覚タスク固有の報酬関数を最大化する。
提案するDRLベースのISPフレームワークは,RAW-to-RGB画像復元,2次元物体検出,単眼深度推定などの視覚タスクに応じて,画像品質を効果的に向上する。
論文 参考訳(メタデータ) (2022-07-07T04:34:05Z) - Controllable Image Enhancement [66.18525728881711]
いくつかのパラメータを制御して、複数のスタイルで高品質な画像を生成できる半自動画像強調アルゴリズムを提案する。
エンコーダ・デコーダフレームワークは、リタッチスキルを潜在コードにエンコードし、イメージ信号処理機能のパラメータにデコードする。
論文 参考訳(メタデータ) (2022-06-16T23:54:53Z) - ReconfigISP: Reconfigurable Camera Image Processing Pipeline [75.46902933531247]
Image Signal Processor(ISP)は、センサー信号を画像に変換するデジタルカメラにおいて、知覚と理解のために重要なコンポーネントである。
既存のISP設計では、固定されたアーキテクチャ(例えば、厳密な順序で接続されたいくつかのシーケンシャルなモジュール)が常に採用されている。
本研究では,Reconfigurable ISP(Reconfigurable ISP)を提案する。
論文 参考訳(メタデータ) (2021-09-10T09:56:43Z) - Learning Frequency-aware Dynamic Network for Efficient Super-Resolution [56.98668484450857]
本稿では、離散コサイン変換(dct)領域の係数に応じて入力を複数の部分に分割する新しい周波数認識動的ネットワークについて検討する。
実際、高周波部は高価な操作で処理され、低周波部は計算負荷を軽減するために安価な操作が割り当てられる。
ベンチマークSISRモデルおよびデータセット上での実験は、周波数認識動的ネットワークが様々なSISRニューラルネットワークに使用できることを示している。
論文 参考訳(メタデータ) (2021-03-15T12:54:26Z) - TFPnP: Tuning-free Plug-and-Play Proximal Algorithm with Applications to
Inverse Imaging Problems [22.239477171296056]
Plug-and-Play (MM) は非最適化フレームワークであり、例えば、数値アルゴリズムと高度なデノゲーション前処理を組み合わせたものである。
我々は、学習戦略とともに最先端の成果である、より難解な問題に対するいくつかの実践的考察について論じる。
論文 参考訳(メタデータ) (2020-11-18T14:19:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。