論文の概要: Make the Most Out of Your Net: Alternating Between Canonical and Hard
Datasets for Improved Image Demosaicing
- arxiv url: http://arxiv.org/abs/2303.15792v1
- Date: Tue, 28 Mar 2023 07:57:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-29 16:03:15.490208
- Title: Make the Most Out of Your Net: Alternating Between Canonical and Hard
Datasets for Improved Image Demosaicing
- Title(参考訳): ネットを最大限に活用する: 画像のデモサイシングを改善するためのcanonicalとhardのデータセットを交互に切り替える
- Authors: Yuval Becker, Raz Z. Nossek, Tomer Peleg
- Abstract要約: デジタルカメラの画像処理パイプラインにおいて,画像復号化は重要なステップである。
私たちの仕事は、トレーニングプロトコルの観点から問題に取り組みます。
以上の結果から,本手法は,さまざまなアーキテクチャサイズやタイプにおいて,標準的なトレーニングよりも優れていることがわかった。
- 参考スコア(独自算出の注目度): 0.966840768820136
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Image demosaicing is an important step in the image processing pipeline for
digital cameras, and it is one of the many tasks within the field of image
restoration. A well-known characteristic of natural images is that most patches
are smooth, while high-content patches like textures or repetitive patterns are
much rarer, which results in a long-tailed distribution. This distribution can
create an inductive bias when training machine learning algorithms for image
restoration tasks and for image demosaicing in particular. There have been many
different approaches to address this challenge, such as utilizing specific
losses or designing special network architectures. What makes our work is
unique in that it tackles the problem from a training protocol perspective. Our
proposed training regime consists of two key steps. The first step is a
data-mining stage where sub-categories are created and then refined through an
elimination process to only retain the most helpful sub-categories. The second
step is a cyclic training process where the neural network is trained on both
the mined sub-categories and the original dataset. We have conducted various
experiments to demonstrate the effectiveness of our training method for the
image demosaicing task. Our results show that this method outperforms standard
training across a range of architecture sizes and types, including CNNs and
Transformers. Moreover, we are able to achieve state-of-the-art results with a
significantly smaller neural network, compared to previous state-of-the-art
methods.
- Abstract(参考訳): 画像復調はデジタルカメラの画像処理パイプラインにおいて重要なステップであり、画像復元の分野における多くのタスクの1つである。
自然画像のよく知られた特徴は、ほとんどのパッチは滑らかであるが、テクスチャや反復パターンのような高濃度のパッチはより稀であり、長い尾の分布をもたらすことである。
この分布は、画像復元タスクや特に画像復調のための機械学習アルゴリズムをトレーニングする場合、帰納的バイアスを生じさせる。
特定の損失の活用や特別なネットワークアーキテクチャの設計など、この課題に対処するためのさまざまなアプローチがある。
私たちの仕事は、トレーニングプロトコルの観点から問題に取り組むという点でユニークなものです。
提案するトレーニング体制は,2つの重要なステップから構成される。
最初のステップは、サブカテゴリが作成され、削除プロセスを通じて洗練され、最も有用なサブカテゴリのみを保持するデータマイニングステージである。
第2のステップは、ニューラルネットワークがマイニングされたサブカテゴリとオリジナルのデータセットの両方でトレーニングされる、循環トレーニングプロセスである。
画像復調作業におけるトレーニング手法の有効性を示すため,様々な実験を行った。
本手法は,cnnやトランスフォーマーなど,さまざまなアーキテクチャサイズやタイプにおいて,標準的なトレーニングよりも優れることを示す。
さらに,従来の最先端手法と比較して,はるかに小さなニューラルネットワークで最先端の成果を得ることができる。
関連論文リスト
- Rethinking Transformers Pre-training for Multi-Spectral Satellite
Imagery [78.43828998065071]
教師なし学習の最近の進歩は、下流タスクにおける有望な結果を達成するための大きな視覚モデルの可能性を示している。
このような事前学習技術は、大量の未学習データが利用可能であることから、リモートセンシング領域でも最近研究されている。
本稿では,マルチモーダルで効果的に活用されるマルチスケール情報の事前学習と活用について述べる。
論文 参考訳(メタデータ) (2024-03-08T16:18:04Z) - Exploring Data Redundancy in Real-world Image Classification through
Data Selection [20.389636181891515]
ディープラーニングモデルはトレーニングに大量のデータを必要とすることが多く、結果としてコストが増大する。
実世界の画像データの冗長性を調べるために,シナプスインテリジェンスと勾配ノルムに基づく2つのデータ評価指標を提案する。
オンラインおよびオフラインのデータ選択アルゴリズムは、検査されたデータ値に基づいてクラスタリングとグループ化によって提案される。
論文 参考訳(メタデータ) (2023-06-25T03:31:05Z) - Data-Free Sketch-Based Image Retrieval [56.96186184599313]
本研究では,事前学習された単一モダリティ分類モデルを用いて,学習データにアクセスせずに検索のためのクロスモーダルな距離空間を学習するData-Free (DF)-SBIRを提案する。
本稿では、写真やスケッチの分類を行うために、独立して訓練されたモデルからの知識を活用できるDF-SBIRの方法論を提案する。
また、トレーニングデータを必要としないデータ依存アプローチと競合するmAPを実現する。
論文 参考訳(メタデータ) (2023-03-14T10:34:07Z) - Semi-Supervised Image Captioning by Adversarially Propagating Labeled
Data [95.0476489266988]
本稿では、画像キャプションモデルの一般化を改善するための、新しいデータ効率半教師付きフレームワークを提案する。
提案手法は,キャプタにペアデータから学習し,段階的に未ペアデータの関連付けを行うよう訓練する。
1)画像ベースと(2)高密度領域ベースキャプションデータセットの両方を総合的かつ包括的な実験結果とし,それに続いて,少ないペアリングデータセットの包括的分析を行った。
論文 参考訳(メタデータ) (2023-01-26T15:25:43Z) - Mitigating Representation Bias in Action Recognition: Algorithms and
Benchmarks [76.35271072704384]
ディープラーニングモデルは、稀なシーンやオブジェクトを持つビデオに適用すると、パフォーマンスが悪くなります。
この問題にはアルゴリズムとデータセットの2つの異なる角度から対処する。
偏りのある表現は、他のデータセットやタスクに転送するとより一般化できることを示す。
論文 参考訳(メタデータ) (2022-09-20T00:30:35Z) - Feature transforms for image data augmentation [74.12025519234153]
画像分類において、多くの拡張アプローチは単純な画像操作アルゴリズムを利用する。
本研究では,14種類の拡張アプローチを組み合わせて生成した画像を追加することで,データレベルでのアンサンブルを構築する。
事前トレーニングされたResNet50ネットワークは、各拡張メソッドから派生した画像を含むトレーニングセットに基づいて微調整される。
論文 参考訳(メタデータ) (2022-01-24T14:12:29Z) - Realistic Image Normalization for Multi-Domain Segmentation [7.856339385917824]
本稿では,複数のデータセットにまたがる共通正規化関数を学習することで,従来の画像正規化手法を再検討する。
複数のデータセットを共同で正規化することにより、一貫した正規化イメージと改善されたイメージセグメンテーションが得られる。
また、複数の画像領域から学習する場合に利用可能なサンプル数を増やすことで、データの可用性を向上させることができる。
論文 参考訳(メタデータ) (2020-09-29T13:57:04Z) - Fast ultrasonic imaging using end-to-end deep learning [1.0266286487433585]
ディープニューラルネットワーク(DNN)は、データ前処理とイメージ後処理のステップを別々に使用する。
エンド・ツー・エンドのトレーニングを実現するために,3つのステップをすべて統合した新しいディープラーニングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-09-04T13:53:46Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z) - Extracting dispersion curves from ambient noise correlations using deep
learning [1.0237120900821557]
本研究では,表面波の分散曲線の位相を分類する機械学習手法を提案する。
受信機のアレイで観測された表面の標準FTAN解析を画像に変換する。
我々は、教師付き学習目標を備えた畳み込みニューラルネットワーク(U-net)アーキテクチャを使用し、伝達学習を取り入れる。
論文 参考訳(メタデータ) (2020-02-05T23:41:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。