論文の概要: DynamicISP: Dynamically Controlled Image Signal Processor for Image
Recognition
- arxiv url: http://arxiv.org/abs/2211.01146v1
- Date: Wed, 2 Nov 2022 14:22:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 12:44:43.514198
- Title: DynamicISP: Dynamically Controlled Image Signal Processor for Image
Recognition
- Title(参考訳): dynamicisp:画像認識のための動的制御型画像信号処理装置
- Authors: Masakazu Yoshimura, Junji Otsuka, Atsushi Irie, Takeshi Ohashi
- Abstract要約: 本稿では、従来の単純なISP関数からなるDynamicISPを提案するが、パラメータは画像毎に動的に制御される。
提案手法は,複数のISP関数のパラメータの制御に成功し,計算コストを小さくして最先端の精度を実現した。
- 参考スコア(独自算出の注目度): 1.0323063834827415
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image signal processor (ISP) plays an important role not only for human
perceptual quality but also for computer vision. In most cases, experts resort
to manual tuning of many parameters in the ISPs for perceptual quality. It
failed in sub-optimal, especially for computer vision. Aiming to improve ISPs,
two approaches have been actively proposed; tuning the parameters with machine
learning, or constructing an ISP with DNN. The former is lightweight but lacks
expressive powers. The latter has expressive powers but it was too heavy to
calculate on edge devices. To this end, we propose DynamicISP, which consists
of traditional simple ISP functions but their parameters are controlled
dynamically per image according to what the downstream image recognition model
felt to the previous frame. Our proposed method successfully controlled
parameters of multiple ISP functions and got state-of-the-art accuracy with a
small computational cost.
- Abstract(参考訳): 画像信号プロセッサ(ISP)は人間の知覚品質だけでなく、コンピュータビジョンにも重要な役割を果たす。
ほとんどの場合、専門家は知覚品質のためにISP内の多くのパラメータを手動でチューニングする。
これは、特にコンピュータビジョンの最適化に失敗した。
ISPの改善を目的として、パラメータを機械学習でチューニングするか、DNNでISPを構築するという2つのアプローチが積極的に提案されている。
前者は軽量だが表現力に欠ける。
後者は表現力があるが、エッジデバイスで計算するには重すぎる。
この目的のために、従来の単純なISP関数からなるDynamicISPを提案するが、そのパラメータは、以前のフレームに対して下流画像認識モデルが感じたものに応じて、画像毎に動的に制御される。
提案手法は,複数のISP関数のパラメータの制御に成功し,少ない計算コストで最先端の精度を得る。
関連論文リスト
- Learning to Compose SuperWeights for Neural Parameter Allocation Search [61.078949532440724]
提案手法は,同じ重み集合を用いて多くのネットワークに対してパラメータを生成することができることを示す。
これにより、効率的なアンサンブルや、いつでも予測できるようなタスクをサポートできます。
論文 参考訳(メタデータ) (2023-12-03T04:20:02Z) - Learning Degradation-Independent Representations for Camera ISP
Pipelines [15.954407353419263]
本稿では, 自己教師付き学習ベースライン表現の洗練を通じて, 劣化非依存表現(DiR)を学習するための新しい手法を提案する。
提案手法はドメイン一般化能力に優れ,様々なダウンストリームタスクにおいて最先端の手法よりも優れる。
論文 参考訳(メタデータ) (2023-07-03T05:38:28Z) - T-former: An Efficient Transformer for Image Inpainting [50.43302925662507]
トランスフォーマーと呼ばれる注目に基づくネットワークアーキテクチャのクラスは、自然言語処理の分野で大きなパフォーマンスを示している。
本稿では,Taylorの展開に応じて,解像度に線形に関連付けられた新たな注意を設計し,この注意に基づいて,画像インペイントのためのネットワークである$T$-formerを設計する。
いくつかのベンチマークデータセットの実験により,提案手法は比較的少ないパラメータ数と計算複雑性を維持しつつ,最先端の精度を達成できることが示されている。
論文 参考訳(メタデータ) (2023-05-12T04:10:42Z) - LW-ISP: A Lightweight Model with ISP and Deep Learning [17.972611191715888]
ISPパイプラインにおけるリアルタイム高速処理を実現するための学習ベース手法の可能性を示す。
RAWデータからRGB画像へのイメージマッピングを暗黙的に学習する新しいアーキテクチャであるLW-ISPを提案する。
実験により、LW-ISPはPSNRの0.38dB改善を達成した。
論文 参考訳(メタデータ) (2022-10-08T04:00:03Z) - DRL-ISP: Multi-Objective Camera ISP with Deep Reinforcement Learning [82.4114562598703]
本稿では,Deep Reinforcement Learning(DRL)とカメラISPツールボックスを利用するカメラISPフレームワークを提案する。
DRLベースのカメラISPフレームワークは、ツールボックスから適切なツールを反復的に選択し、画像に適用して、与えられた視覚タスク固有の報酬関数を最大化する。
提案するDRLベースのISPフレームワークは,RAW-to-RGB画像復元,2次元物体検出,単眼深度推定などの視覚タスクに応じて,画像品質を効果的に向上する。
論文 参考訳(メタデータ) (2022-07-07T04:34:05Z) - Controllable Image Enhancement [66.18525728881711]
いくつかのパラメータを制御して、複数のスタイルで高品質な画像を生成できる半自動画像強調アルゴリズムを提案する。
エンコーダ・デコーダフレームワークは、リタッチスキルを潜在コードにエンコードし、イメージ信号処理機能のパラメータにデコードする。
論文 参考訳(メタデータ) (2022-06-16T23:54:53Z) - ReconfigISP: Reconfigurable Camera Image Processing Pipeline [75.46902933531247]
Image Signal Processor(ISP)は、センサー信号を画像に変換するデジタルカメラにおいて、知覚と理解のために重要なコンポーネントである。
既存のISP設計では、固定されたアーキテクチャ(例えば、厳密な順序で接続されたいくつかのシーケンシャルなモジュール)が常に採用されている。
本研究では,Reconfigurable ISP(Reconfigurable ISP)を提案する。
論文 参考訳(メタデータ) (2021-09-10T09:56:43Z) - Learning Frequency-aware Dynamic Network for Efficient Super-Resolution [56.98668484450857]
本稿では、離散コサイン変換(dct)領域の係数に応じて入力を複数の部分に分割する新しい周波数認識動的ネットワークについて検討する。
実際、高周波部は高価な操作で処理され、低周波部は計算負荷を軽減するために安価な操作が割り当てられる。
ベンチマークSISRモデルおよびデータセット上での実験は、周波数認識動的ネットワークが様々なSISRニューラルネットワークに使用できることを示している。
論文 参考訳(メタデータ) (2021-03-15T12:54:26Z) - TFPnP: Tuning-free Plug-and-Play Proximal Algorithm with Applications to
Inverse Imaging Problems [22.239477171296056]
Plug-and-Play (MM) は非最適化フレームワークであり、例えば、数値アルゴリズムと高度なデノゲーション前処理を組み合わせたものである。
我々は、学習戦略とともに最先端の成果である、より難解な問題に対するいくつかの実践的考察について論じる。
論文 参考訳(メタデータ) (2020-11-18T14:19:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。