論文の概要: ISP Distillation
- arxiv url: http://arxiv.org/abs/2101.10203v1
- Date: Mon, 25 Jan 2021 16:12:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-14 19:21:08.997758
- Title: ISP Distillation
- Title(参考訳): ISP蒸留
- Authors: Eli Schwartz, Alex Bronstein, Raja Giryes
- Abstract要約: 物体認識などの高レベルマシンビジョンモデルは、画像がカメラispによって標準画像空間に変換されると仮定する。
カメラISPは、人間の観察者に視覚的に喜ばしい画像を生成するために最適化されており、マシンには適用されないため、ISPの計算時間を省き、ビジョンモデルを生データに直接適用することができる。
我々は、知識蒸留を用いてRAWデータに直接適用されるモデルを訓練し、RAW画像のモデル予測が、処理されたRGB画像の既訓練モデルの予測と一致するようにした。
- 参考スコア(独自算出の注目度): 43.111429881689865
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Nowadays, many of the images captured are "observed" by machines only and not
by humans, for example, robots' or autonomous cars' cameras. High-level machine
vision models, such as object recognition, assume images are transformed to
some canonical image space by the camera ISP. However, the camera ISP is
optimized for producing visually pleasing images to human observers and not for
machines, thus, one may spare the ISP compute time and apply the vision models
directly to the raw data. Yet, it has been shown that training such models
directly on the RAW images results in a performance drop. To mitigate this drop
in performance (without the need to annotate RAW data), we use a dataset of RAW
and RGB image pairs, which can be easily acquired with no human labeling. We
then train a model that is applied directly to the RAW data by using knowledge
distillation such that the model predictions for RAW images will be aligned
with the predictions of an off-the-shelf pre-trained model for processed RGB
images. Our experiments show that our performance on RAW images is
significantly better than a model trained on labeled RAW images. It also
reasonably matches the predictions of a pre-trained model on processed RGB
images, while saving the ISP compute overhead.
- Abstract(参考訳): 現在、撮影された画像の多くは、ロボットや自動運転車のカメラなど、人間ではなく機械によって「観察」されている。
物体認識などの高レベルマシンビジョンモデルは、画像がカメラispによって標準画像空間に変換されると仮定する。
しかし、カメラISPは、人間の観察者に対して、マシンではなく、視覚的に喜ぶ画像を生成するために最適化されているため、ISPの計算時間を省いて、ビジョンモデルを生データに直接適用することができる。
しかし,RAW画像から直接そのようなモデルをトレーニングすると,性能低下が生じることが示されている。
RAWデータのアノテートを必要とせずに)この性能低下を軽減するために、RAWとRGBのイメージペアのデータセットを使用し、人間のラベルなしで容易に取得できる。
次に、RAW画像のモデル予測が処理されたRGB画像の既製プリトレーニングモデルの予測と一致するように、知識蒸留を使用してRAWデータに直接適用されるモデルをトレーニングします。
実験の結果,RAW画像の性能はラベル付きRAW画像で訓練されたモデルよりも有意に優れていることがわかった。
また、処理されたRGB画像の事前訓練されたモデルの予測に合理的に一致し、ISPの計算オーバーヘッドを節約します。
関連論文リスト
- Simple Image Signal Processing using Global Context Guidance [56.41827271721955]
ディープラーニングベースのISPは、深層ニューラルネットワークを使用してRAW画像をDSLRライクなRGBイメージに変換することを目指している。
我々は,全RAW画像からグローバルなコンテキスト情報をキャプチャするために,任意のニューラルISPに統合可能な新しいモジュールを提案する。
本モデルでは,多種多様な実スマートフォン画像を用いて,様々なベンチマークで最新の結果が得られる。
論文 参考訳(メタデータ) (2024-04-17T17:11:47Z) - Rawformer: Unpaired Raw-to-Raw Translation for Learnable Camera ISPs [53.68932498994655]
本稿では,多種多様なカメラを用いた生と生の翻訳の未ペアリング学習手法を提案する。
特定のカメラが捉えた生画像をターゲットカメラに正確にマッピングし、学習可能なISPを新しい目に見えないカメラに一般化する。
提案手法は,従来の最先端技術と比較して精度が高く,実際のカメラデータセットに優れた性能を示す。
論文 参考訳(メタデータ) (2024-04-16T16:17:48Z) - Raw Instinct: Trust Your Classifiers and Skip the Conversion [12.323236593352698]
十分高度な分類器は、RGBと比較してRAW入力に対して等価な結果が得られることを示す。
さらに、RAW画像データからRAW画像の分類結果までの計算時間は、RGBよりも最大8.46倍高速であることを示す。
論文 参考訳(メタデータ) (2024-03-21T14:45:41Z) - Self-Supervised Reversed Image Signal Processing via Reference-Guided
Dynamic Parameter Selection [1.1602089225841632]
メタデータとペア画像を必要としない自己教師付き逆ISP方式を提案する。
提案手法は,RGB画像を参照RAW画像と同じセンサで同一環境で撮影されたRAWライクな画像に変換する。
提案手法は,他の最先端教師付き手法に匹敵する精度で,様々な逆ISPを学習可能であることを示す。
論文 参考訳(メタデータ) (2023-03-24T11:12:05Z) - Efficient Visual Computing with Camera RAW Snapshots [41.9863557302409]
従来のカメラはセンサ上の画像光を捕捉し、画像信号プロセッサ(ISP)を用いてRGB画像に変換する。
RAW画像にはキャプチャされた全ての情報が含まれているため、ISPを用いたRAWからRGBへの変換はビジュアルコンピューティングには必要ないと論じることができる。
RAW画像を用いた高レベルセマンティック理解と低レベル圧縮を実現するための新しい$rho$-Visionフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-15T12:54:21Z) - Transform your Smartphone into a DSLR Camera: Learning the ISP in the
Wild [159.71025525493354]
本稿では,スマートフォンが取得したRAW画像に基づいて,DSLRの品質画像を生成する訓練可能な画像信号処理フレームワークを提案する。
トレーニング画像ペア間の色ずれに対処するために、カラー条件ISPネットワークを使用し、各入力RAWと基準DSLR画像間の新しいパラメトリック色マッピングを最適化する。
論文 参考訳(メタデータ) (2022-03-20T20:13:59Z) - Model-Based Image Signal Processors via Learnable Dictionaries [6.766416093990318]
デジタルカメラは画像信号処理装置(ISP)を用いてRAW読み出しをRGB画像に変換する
近年のアプローチでは、RGBからRAWマッピングを推定することで、このギャップを埋めようとしている。
本稿では,学習可能かつ解釈可能なハイブリッド・モデルベースかつデータ駆動型ISPを提案する。
論文 参考訳(メタデータ) (2022-01-10T08:36:10Z) - Towards Low Light Enhancement with RAW Images [101.35754364753409]
我々は、低光強度でRAW画像を使用することの優位性について、最初のベンチマークを行う。
本研究では,RAW画像の特性を計測可能な因子に分解するFEM(Facterized Enhancement Model)を新たに開発した。
実アプリケーションにおけるRAW画像の利点と利用不可のトレードオフを生かしたREENet(RAW-guiding Exposure Enhancement Network)を開発した。
論文 参考訳(メタデータ) (2021-12-28T07:27:51Z) - Raw Image Deblurring [24.525466412146358]
RAW画像と処理されたsRGB画像の両方を含む新しいデータセットを構築し、RAW画像のユニークな特性を利用する新しいモデルを設計します。
RAW画像のみをトレーニングしたデブロアリングモデルは,最先端のパフォーマンスを実現し,処理されたsRGB画像上でのトレーニングよりも優れる。
論文 参考訳(メタデータ) (2020-12-08T08:03:09Z) - CycleISP: Real Image Restoration via Improved Data Synthesis [166.17296369600774]
本稿では,前向きと逆方向のカメラ画像パイプラインをモデル化するフレームワークを提案する。
リアルな合成データに基づいて新しい画像認識ネットワークをトレーニングすることにより、実際のカメラベンチマークデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-03-17T15:20:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。