論文の概要: Transfer Learning in General Lensless Imaging through Scattering Media
- arxiv url: http://arxiv.org/abs/1912.12419v1
- Date: Sat, 28 Dec 2019 07:37:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-17 12:45:00.224380
- Title: Transfer Learning in General Lensless Imaging through Scattering Media
- Title(参考訳): 散乱媒質を用いた一般レンズレスイメージングにおける伝達学習
- Authors: Yukuan Yang, Lei Deng, Peng Jiao, Yansong Chua, Jing Pei, Cheng Ma,
Guoqi Li
- Abstract要約: ディープニューラルネットワーク(DNN)は、散乱媒体を介してレンズレスイメージングの分野にうまく導入されている。
本研究は, 散乱媒質による無レンズイメージングの課題に対処するために, 転写学習を提案する。
- 参考スコア(独自算出の注目度): 16.445963019768744
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently deep neural networks (DNNs) have been successfully introduced to the
field of lensless imaging through scattering media. By solving an inverse
problem in computational imaging, DNNs can overcome several shortcomings in the
conventional lensless imaging through scattering media methods, namely, high
cost, poor quality, complex control, and poor anti-interference. However, for
training, a large number of training samples on various datasets have to be
collected, with a DNN trained on one dataset generally performing poorly for
recovering images from another dataset. The underlying reason is that lensless
imaging through scattering media is a high dimensional regression problem and
it is difficult to obtain an analytical solution. In this work, transfer
learning is proposed to address this issue. Our main idea is to train a DNN on
a relatively complex dataset using a large number of training samples and
fine-tune the last few layers using very few samples from other datasets.
Instead of the thousands of samples required to train from scratch, transfer
learning alleviates the problem of costly data acquisition. Specifically,
considering the difference in sample sizes and similarity among datasets, we
propose two DNN architectures, namely LISMU-FCN and LISMU-OCN, and a balance
loss function designed for balancing smoothness and sharpness. LISMU-FCN, with
much fewer parameters, can achieve imaging across similar datasets while
LISMU-OCN can achieve imaging across significantly different datasets. What's
more, we establish a set of simulation algorithms which are close to the real
experiment, and it is of great significance and practical value in the research
on lensless scattering imaging. In summary, this work provides a new solution
for lensless imaging through scattering media using transfer learning in DNNs.
- Abstract(参考訳): 近年,深層ニューラルネットワーク (dnn) が散乱媒質によるレンズレスイメージングの分野に導入されている。
計算画像における逆問題を解決することで、DNNは従来のレンズレスイメージングにおけるいくつかの欠点、すなわち、高コスト、低品質、複雑な制御、低反干渉を克服することができる。
しかし、トレーニングのためには、さまざまなデータセット上の多数のトレーニングサンプルを収集する必要がある。
その理由として,散乱媒質によるレンズレスイメージングは高次元回帰問題であり,解析的解を得るのが困難である。
本稿では,この問題に対処するために,転校学習を提案する。
主なアイデアは、多数のトレーニングサンプルを使用して比較的複雑なデータセットでDNNをトレーニングし、他のデータセットからのごくわずかなサンプルを使用して、最後の数層を微調整することです。
ゼロからトレーニングするために必要な何千ものサンプルの代わりに、転送学習はコストの高いデータ取得の問題を軽減する。
具体的には,データセットのサンプルサイズと類似性の違いを考慮し,2つのDNNアーキテクチャ,すなわちLISMU-FCNとLISMU-OCNを提案する。
LISMU-OCNは、パラメータがはるかに少ないため、同様のデータセットをまたいでイメージングを達成できる。
さらに、実際の実験に近い一連のシミュレーションアルゴリズムを構築し、レンズレス散乱イメージングの研究において非常に重要かつ実用的価値がある。
要約すると、この研究はDNNにおける転写学習を用いた散乱媒体によるレンズレスイメージングの新しいソリューションを提供する。
関連論文リスト
- Analysis of Classifier Training on Synthetic Data for Cross-Domain Datasets [4.696575161583618]
本研究は、高度な運転支援システムと自律運転のためのカメラベースの交通標識認識アプリケーションに焦点を当てた。
合成データセットの増補パイプラインは、構造化影やガウスの特異なハイライトのような新しい増補プロセスを含む。
実験の結果、クロスドメインテストデータセットに適用した場合、ほとんどの場合、合成画像ベースアプローチは実際の画像ベーストレーニングよりも優れていた。
論文 参考訳(メタデータ) (2024-10-30T07:11:41Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - Impact of Light and Shadow on Robustness of Deep Neural Networks [5.015796849425367]
ディープニューラルネットワーク(DNN)は、画像分類、セグメンテーション、オブジェクト検出など、様々なコンピュータビジョンタスクにおいて顕著な進歩を遂げている。
近年の研究では、敵攻撃として知られる入力データの故意な操作に直面した先進的なDNNの脆弱性が明らかにされている。
我々は,イメージネットのサブセット内に,各画像に対して24種類の輝度レベルを組み込んだ輝度変化データセットを提案する。
論文 参考訳(メタデータ) (2023-05-23T15:30:56Z) - Robustifying the Multi-Scale Representation of Neural Radiance Fields [86.69338893753886]
実世界の画像の両問題を克服するために,頑健なマルチスケールニューラルラジアンス場表現手法を提案する。
提案手法は,NeRFにインスパイアされたアプローチを用いて,マルチスケール画像効果とカメラ位置推定問題に対処する。
例えば、日常的に取得したマルチビュー画像からオブジェクトの正確な神経表現を行うためには、カメラの正確な位置推定が不可欠であることを示す。
論文 参考訳(メタデータ) (2022-10-09T11:46:45Z) - Agricultural Plantation Classification using Transfer Learning Approach
based on CNN [0.0]
深層学習により高スペクトル画像認識の効率は著しく向上した。
CNNとMulti-Layer Perceptron(MLP)は画像の分類に優れたプロセスであることが示されている。
本稿では,移動学習の手法を用いて,学習時間を短縮し,ラベル付き大規模データセットへの依存を減らすことを提案する。
論文 参考訳(メタデータ) (2022-06-19T14:43:31Z) - Terrain Classification using Transfer Learning on Hyperspectral Images:
A Comparative study [0.13999481573773068]
畳み込みニューラルネットワーク(CNN)とMulti-Layer Perceptron(MLP)は画像分類の有効な方法であることが証明されている。
しかし、彼らは長いトレーニング時間と大量のラベル付きデータの要求の問題に悩まされている。
本稿では,移動学習法を用いてトレーニング時間を短縮し,大規模ラベル付きデータセットへの依存を減らすことを提案する。
論文 参考訳(メタデータ) (2022-06-19T14:36:33Z) - Feature transforms for image data augmentation [74.12025519234153]
画像分類において、多くの拡張アプローチは単純な画像操作アルゴリズムを利用する。
本研究では,14種類の拡張アプローチを組み合わせて生成した画像を追加することで,データレベルでのアンサンブルを構築する。
事前トレーニングされたResNet50ネットワークは、各拡張メソッドから派生した画像を含むトレーニングセットに基づいて微調整される。
論文 参考訳(メタデータ) (2022-01-24T14:12:29Z) - Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。
本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。
以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文 参考訳(メタデータ) (2021-10-25T21:01:00Z) - Deep Multimodal Transfer-Learned Regression in Data-Poor Domains [0.0]
画像と特徴データのマルチモーダル学習のためのDMTL-R(Deep Multimodal Transfer-Learned Regressor)を提案する。
我々のモデルは、少量のトレーニング画像データに基づいて、与えられたトレーニング済みCNN重みのセットを微調整することができる。
各種CNNアーキテクチャからの事前学習重みを用いた位相場シミュレーションマイクロ構造画像とそれに付随する物理特徴集合を用いた結果を提案する。
論文 参考訳(メタデータ) (2020-06-16T16:52:44Z) - Data Consistent CT Reconstruction from Insufficient Data with Learned
Prior Images [70.13735569016752]
偽陰性病変と偽陽性病変を呈示し,CT画像再構成における深層学習の堅牢性について検討した。
本稿では,圧縮センシングと深層学習の利点を組み合わせた画像品質向上のためのデータ一貫性再構築手法を提案する。
提案手法の有効性は,円錐ビームCTにおいて,トランキャットデータ,リミテッドアングルデータ,スパースビューデータで示される。
論文 参考訳(メタデータ) (2020-05-20T13:30:49Z) - Single-Image HDR Reconstruction by Learning to Reverse the Camera
Pipeline [100.5353614588565]
本稿では,LDR画像形成パイプラインの領域知識をモデルに組み込むことを提案する。
我々は,HDRto-LDR画像形成パイプラインを(1)ダイナミックレンジクリッピング,(2)カメラ応答関数からの非線形マッピング,(3)量子化としてモデル化する。
提案手法は,最先端の単一画像HDR再構成アルゴリズムに対して良好に動作することを示す。
論文 参考訳(メタデータ) (2020-04-02T17:59:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。