論文の概要: Evaluating Deep Neural Networks for Image Document Enhancement
- arxiv url: http://arxiv.org/abs/2106.15286v1
- Date: Fri, 11 Jun 2021 19:48:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-04 19:39:50.503078
- Title: Evaluating Deep Neural Networks for Image Document Enhancement
- Title(参考訳): 画像文書強調のためのディープニューラルネットワークの評価
- Authors: Lucas N. Kirsten, Ricardo Piccoli and Ricardo Ribani
- Abstract要約: この研究は、文書画像の強化問題に適用された6つの最先端のディープニューラルネットワーク(DNN)アーキテクチャを評価する。
優れたアーキテクチャは、既存のアルゴリズムと比較して、一般的に優れた拡張を実現した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This work evaluates six state-of-the-art deep neural network (DNN)
architectures applied to the problem of enhancing camera-captured document
images. The results from each network were evaluated both qualitatively and
quantitatively using Image Quality Assessment (IQA) metrics, and also compared
with an existing approach based on traditional computer vision techniques. The
best performing architectures generally produced good enhancement compared to
the existing algorithm, showing that it is possible to use DNNs for document
image enhancement. Furthermore, the best performing architectures could work as
a baseline for future investigations on document enhancement using deep
learning techniques. The main contributions of this paper are: a baseline of
deep learning techniques that can be further improved to provide better
results, and a evaluation methodology using IQA metrics for quantitatively
comparing the produced images from the neural networks to a ground truth.
- Abstract(参考訳): 本研究は,6つの最先端のディープニューラルネットワーク(DNN)アーキテクチャを,カメラキャプチャドドキュメンテーション画像の高精細化問題に適用した。
各ネットワークの結果は、画像品質評価(IQA)メトリクスを用いて定性的かつ定量的に評価され、従来のコンピュータビジョン技術に基づく既存手法と比較された。
最高の性能を持つアーキテクチャは、既存のアルゴリズムと比較して優れた拡張を実現し、文書画像の強化にDNNを使用することが可能であることを示した。
さらに、最高のアーキテクチャは、深層学習技術を用いた文書強化に関する将来の調査のベースラインとして機能する可能性がある。
本論文の主な貢献は、より優れた結果を得るためにさらに改善できるディープラーニング技術のベースラインと、ニューラルネットワークから生成された画像と地上の真実とを定量的に比較するためのIQAメトリクスを用いた評価手法である。
関連論文リスト
- A Comprehensive Survey on Deep Neural Image Deblurring [0.76146285961466]
画像の劣化は、ぼやけを引き起こす画像の劣化要素を排除し、画像の品質を改善して、テクスチャとオブジェクトの可視化を改善する。
伝統的に、画像の劣化で優先される事前ベース最適化アプローチは、ディープニューラルネットワークが最近この分野で大きなブレークスルーをもたらした。
私たちは、デブロアリングアプリケーションで使用される最も一般的なディープニューラルネットワーク構造を概説し、その強みと斬新さを説明し、パフォーマンスメトリクスを要約し、広く使われているデータセットを紹介します。
論文 参考訳(メタデータ) (2023-10-07T07:29:42Z) - Comparison Analysis of Traditional Machine Learning and Deep Learning
Techniques for Data and Image Classification [62.997667081978825]
本研究の目的は、コンピュータビジョン2次元オブジェクト分類タスクに使用される最も一般的な機械学習およびディープラーニング技術を分析し比較することである。
まず、視覚語モデルと深部畳み込みニューラルネットワーク(DCNN)の理論的背景を示す。
次に、Bag of Visual Wordsモデル、VGG16 CNN Architectureを実装します。
論文 参考訳(メタデータ) (2022-04-11T11:34:43Z) - Deep Image Deblurring: A Survey [165.32391279761006]
低レベルのコンピュータビジョンにおいて、デブロアリングは古典的な問題であり、ぼやけた入力画像からシャープなイメージを復元することを目的としている。
近年のディープラーニングの進歩は、この問題の解決に大きな進歩をもたらした。
論文 参考訳(メタデータ) (2022-01-26T01:31:30Z) - SDT-DCSCN for Simultaneous Super-Resolution and Deblurring of Text
Images [3.5590597557917363]
我々は,SDT-DCSCNという手法を提案し,DCSCNに基づく低解像度のぼかしテキスト画像の高解像度化とデブロアリングを共同で行う。
提案手法では,入力画像と元のシャープ画像に,サブサンプルのぼやけた画像を用いる。
論文 参考訳(メタデータ) (2022-01-15T14:51:50Z) - Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。
本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。
以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文 参考訳(メタデータ) (2021-10-25T21:01:00Z) - Image Quality Assessment in the Modern Age [53.19271326110551]
本チュートリアルは、画像品質評価(IQA)の基礎的理論、方法論、現状の進歩を聴衆に提供する。
まず,視覚刺激を適切に選択する方法に着目し,主観的品質評価手法を再考する。
手書きのエンジニアリングと(深い)学習ベースの手法の両方をカバーします。
論文 参考訳(メタデータ) (2021-10-19T02:38:46Z) - Joint Learning of Neural Transfer and Architecture Adaptation for Image
Recognition [77.95361323613147]
現在の最先端の視覚認識システムは、大規模データセット上でニューラルネットワークを事前トレーニングし、より小さなデータセットでネットワーク重みを微調整することに依存している。
本稿では,各ドメインタスクに適応したネットワークアーキテクチャの動的適応と,効率と効率の両面で重みの微調整の利点を実証する。
本手法は,ソースドメインタスクでスーパーネットトレーニングを自己教師付き学習に置き換え,下流タスクで線形評価を行うことにより,教師なしパラダイムに容易に一般化することができる。
論文 参考訳(メタデータ) (2021-03-31T08:15:17Z) - Deep Multi-Scale Features Learning for Distorted Image Quality
Assessment [20.7146855562825]
既存のディープニューラルネットワーク(DNN)はIQA問題に対処する上で大きな効果を示している。
画像品質予測のための階層的マルチスケール特徴を持つDNNを構築するためにピラミッド特徴学習を提案する。
提案するネットワークは、エンド・ツー・エンドの監視方法に最適化されている。
論文 参考訳(メタデータ) (2020-12-01T23:39:01Z) - NAS-DIP: Learning Deep Image Prior with Neural Architecture Search [65.79109790446257]
近年の研究では、深部畳み込みニューラルネットワークの構造が、以前に構造化された画像として利用できることが示されている。
我々は,より強い画像の先行を捉えるニューラルネットワークの探索を提案する。
既存のニューラルネットワーク探索アルゴリズムを利用して,改良されたネットワークを探索する。
論文 参考訳(メタデータ) (2020-08-26T17:59:36Z) - Learning Local Complex Features using Randomized Neural Networks for
Texture Analysis [0.1474723404975345]
テクスチャ解析のための学習手法と複雑ネットワーク(CN)理論を組み合わせた新しい手法を提案する。
この方法はCNの表現能力を利用してテクスチャイメージを有向ネットワークとしてモデル化する。
このニューラルネットワークは、単一の隠蔽層を持ち、高速学習アルゴリズムを使用して、テクスチャのキャラクタリゼーションのためにローカルなCNパターンを学習することができる。
論文 参考訳(メタデータ) (2020-07-10T23:18:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。