論文の概要: SDAT: Sub-Dataset Alternation Training for Improved Image Demosaicing
- arxiv url: http://arxiv.org/abs/2303.15792v2
- Date: Mon, 12 Feb 2024 10:04:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-14 01:19:51.807540
- Title: SDAT: Sub-Dataset Alternation Training for Improved Image Demosaicing
- Title(参考訳): SDAT:画質向上のためのサブデータセット代替トレーニング
- Authors: Yuval Becker, Raz Z. Nossek, Tomer Peleg
- Abstract要約: ディープラーニングのようなデータ中心のアプローチでは、トレーニングに使用されるデータセットの分布は、ネットワークの結果にバイアスを与える可能性がある。
ほとんどのディープラーニングアプローチは、特定の損失を利用したり、特別なネットワークアーキテクチャを設計することで、この問題に対処する。
本稿では,トレーニングプロトコルの観点から問題に取り組むサブデータセット代替訓練であるS DATを提案する。
- 参考スコア(独自算出の注目度): 1.4623192580567588
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Image demosaicing is an important step in the image processing pipeline for
digital cameras. In data centric approaches, such as deep learning, the
distribution of the dataset used for training can impose a bias on the
networks' outcome. For example, in natural images most patches are smooth, and
high-content patches are much rarer. This can lead to a bias in the performance
of demosaicing algorithms. Most deep learning approaches address this challenge
by utilizing specific losses or designing special network architectures. We
propose a novel approach, SDAT, Sub-Dataset Alternation Training, that tackles
the problem from a training protocol perspective. SDAT is comprised of two
essential phases. In the initial phase, we employ a method to create
sub-datasets from the entire dataset, each inducing a distinct bias. The
subsequent phase involves an alternating training process, which uses the
derived sub-datasets in addition to training also on the entire dataset. SDAT
can be applied regardless of the chosen architecture as demonstrated by various
experiments we conducted for the demosaicing task. The experiments are
performed across a range of architecture sizes and types, namely CNNs and
transformers. We show improved performance in all cases. We are also able to
achieve state-of-the-art results on three highly popular image demosaicing
benchmarks.
- Abstract(参考訳): 画像復調はデジタルカメラの画像処理パイプラインにおいて重要なステップである。
ディープラーニングのようなデータ中心のアプローチでは、トレーニングに使用されるデータセットの分布は、ネットワークの結果にバイアスを与える可能性がある。
例えば、自然画像では、ほとんどのパッチは滑らかで、高濃度のパッチはより稀である。
これはデモサイシングアルゴリズムのパフォーマンスのバイアスにつながる可能性がある。
ほとんどのディープラーニングアプローチは、特定の損失を利用したり、特別なネットワークアーキテクチャを設計することで、この問題に対処する。
本稿では,訓練プロトコルの観点から問題に取り組む,SDAT(Sub-Dataset Alternation Training)を提案する。
SDATは2つの必須相から構成される。
初期段階では、データセット全体からサブデータセットを作成する方法を採用し、それぞれが異なるバイアスを発生させる。
次のフェーズでは、データセット全体のトレーニングに加えて、派生したサブデータセットを使用する、交互のトレーニングプロセスが含まれている。
sdatは選択したアーキテクチャに関わらず,デモサイシングタスクで実施した各種実験によって適用可能である。
実験は、cnnやトランスフォーマーなど、さまざまなアーキテクチャサイズとタイプで実施されている。
すべてのケースで改善されたパフォーマンスを示します。
また、人気の高い3つのイメージデモサイシングベンチマークで最先端の結果を得ることができます。
関連論文リスト
- Rethinking Transformers Pre-training for Multi-Spectral Satellite
Imagery [78.43828998065071]
教師なし学習の最近の進歩は、下流タスクにおける有望な結果を達成するための大きな視覚モデルの可能性を示している。
このような事前学習技術は、大量の未学習データが利用可能であることから、リモートセンシング領域でも最近研究されている。
本稿では,マルチモーダルで効果的に活用されるマルチスケール情報の事前学習と活用について述べる。
論文 参考訳(メタデータ) (2024-03-08T16:18:04Z) - Exploring Data Redundancy in Real-world Image Classification through
Data Selection [20.389636181891515]
ディープラーニングモデルはトレーニングに大量のデータを必要とすることが多く、結果としてコストが増大する。
実世界の画像データの冗長性を調べるために,シナプスインテリジェンスと勾配ノルムに基づく2つのデータ評価指標を提案する。
オンラインおよびオフラインのデータ選択アルゴリズムは、検査されたデータ値に基づいてクラスタリングとグループ化によって提案される。
論文 参考訳(メタデータ) (2023-06-25T03:31:05Z) - Data-Free Sketch-Based Image Retrieval [56.96186184599313]
本研究では,事前学習された単一モダリティ分類モデルを用いて,学習データにアクセスせずに検索のためのクロスモーダルな距離空間を学習するData-Free (DF)-SBIRを提案する。
本稿では、写真やスケッチの分類を行うために、独立して訓練されたモデルからの知識を活用できるDF-SBIRの方法論を提案する。
また、トレーニングデータを必要としないデータ依存アプローチと競合するmAPを実現する。
論文 参考訳(メタデータ) (2023-03-14T10:34:07Z) - Semi-Supervised Image Captioning by Adversarially Propagating Labeled
Data [95.0476489266988]
本稿では、画像キャプションモデルの一般化を改善するための、新しいデータ効率半教師付きフレームワークを提案する。
提案手法は,キャプタにペアデータから学習し,段階的に未ペアデータの関連付けを行うよう訓練する。
1)画像ベースと(2)高密度領域ベースキャプションデータセットの両方を総合的かつ包括的な実験結果とし,それに続いて,少ないペアリングデータセットの包括的分析を行った。
論文 参考訳(メタデータ) (2023-01-26T15:25:43Z) - Mitigating Representation Bias in Action Recognition: Algorithms and
Benchmarks [76.35271072704384]
ディープラーニングモデルは、稀なシーンやオブジェクトを持つビデオに適用すると、パフォーマンスが悪くなります。
この問題にはアルゴリズムとデータセットの2つの異なる角度から対処する。
偏りのある表現は、他のデータセットやタスクに転送するとより一般化できることを示す。
論文 参考訳(メタデータ) (2022-09-20T00:30:35Z) - Feature transforms for image data augmentation [74.12025519234153]
画像分類において、多くの拡張アプローチは単純な画像操作アルゴリズムを利用する。
本研究では,14種類の拡張アプローチを組み合わせて生成した画像を追加することで,データレベルでのアンサンブルを構築する。
事前トレーニングされたResNet50ネットワークは、各拡張メソッドから派生した画像を含むトレーニングセットに基づいて微調整される。
論文 参考訳(メタデータ) (2022-01-24T14:12:29Z) - Realistic Image Normalization for Multi-Domain Segmentation [7.856339385917824]
本稿では,複数のデータセットにまたがる共通正規化関数を学習することで,従来の画像正規化手法を再検討する。
複数のデータセットを共同で正規化することにより、一貫した正規化イメージと改善されたイメージセグメンテーションが得られる。
また、複数の画像領域から学習する場合に利用可能なサンプル数を増やすことで、データの可用性を向上させることができる。
論文 参考訳(メタデータ) (2020-09-29T13:57:04Z) - Fast ultrasonic imaging using end-to-end deep learning [1.0266286487433585]
ディープニューラルネットワーク(DNN)は、データ前処理とイメージ後処理のステップを別々に使用する。
エンド・ツー・エンドのトレーニングを実現するために,3つのステップをすべて統合した新しいディープラーニングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-09-04T13:53:46Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z) - Extracting dispersion curves from ambient noise correlations using deep
learning [1.0237120900821557]
本研究では,表面波の分散曲線の位相を分類する機械学習手法を提案する。
受信機のアレイで観測された表面の標準FTAN解析を画像に変換する。
我々は、教師付き学習目標を備えた畳み込みニューラルネットワーク(U-net)アーキテクチャを使用し、伝達学習を取り入れる。
論文 参考訳(メタデータ) (2020-02-05T23:41:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。