論文の概要: Automatic Photo Orientation Detection with Convolutional Neural Networks
- arxiv url: http://arxiv.org/abs/2305.10319v1
- Date: Wed, 17 May 2023 16:00:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-18 15:03:45.530956
- Title: Automatic Photo Orientation Detection with Convolutional Neural Networks
- Title(参考訳): 畳み込みニューラルネットワークを用いた自動光配向検出
- Authors: Michael Guerzhoy, Ujash Joshi
- Abstract要約: コンボリューショナルニューラルネットワーク(CNN)を,消費者写真の正しい方向を決定する文脈において,画像方向検出の問題に適用する。
我々は、標準データセットの1つの性能の観点から、公開されている技術状況を大幅に改善する。
我々は、ガイドバックプロパゲーションを使用して、CNNが写真方向を検出する方法の洞察を得、その誤りを説明する。
- 参考スコア(独自算出の注目度): 2.5215715078435705
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We apply convolutional neural networks (CNN) to the problem of image
orientation detection in the context of determining the correct orientation
(from 0, 90, 180, and 270 degrees) of a consumer photo. The problem is
especially important for digitazing analog photographs. We substantially
improve on the published state of the art in terms of the performance on one of
the standard datasets, and test our system on a more difficult large dataset of
consumer photos. We use Guided Backpropagation to obtain insights into how our
CNN detects photo orientation, and to explain its mistakes.
- Abstract(参考訳): 畳み込みニューラルネットワーク(cnn)を,消費者写真の正しい方向(0,90,180,270度)を決定する文脈における像方位検出問題に適用する。
この問題は特にアナログ写真のデジタル化に重要である。
我々は、標準データセットの1つのパフォーマンスの観点から、公開技術の公開状況を大幅に改善し、より難しい消費者写真の大規模データセットでシステムをテストします。
我々はガイドバックプロパゲーションを用いて、CNNが写真方向を検出する方法の洞察を得、その誤りを説明する。
関連論文リスト
- Iris super-resolution using CNNs: is photo-realism important to iris
recognition? [67.42500312968455]
特に畳み込みニューラルネットワーク(CNN)を用いた単一画像超解像技術が出現している
本研究では, 虹彩認識のためのCNNを用いて, 単一画像の超解像を探索する。
彼らは、近赤外線虹彩画像の1.872のデータベースと携帯電話画像データベースのアプローチを検証する。
論文 参考訳(メタデータ) (2022-10-24T11:19:18Z) - Impact of Scaled Image on Robustness of Deep Neural Networks [0.0]
生画像のスケーリングはアウト・オブ・ディストリビューションデータを生成するため、ネットワークを騙すための敵攻撃の可能性がある。
本研究では,ImageNet Challengeデータセットのサブセットを複数でスケーリングすることで,Scaling-DistortionデータセットのImageNet-CSを提案する。
論文 参考訳(メタデータ) (2022-09-02T08:06:58Z) - Image Super-resolution with An Enhanced Group Convolutional Neural
Network [102.2483249598621]
学習能力の強いCNNは、超解像問題を解くために広く選択されている。
浅層構造を持つ超解像群CNN(ESRGCNN)を提案する。
ESRGCNNは、SISRの性能、複雑さ、実行速度、画質評価およびSISRの視覚効果の観点から、最先端技術を上回っていると報告されている。
論文 参考訳(メタデータ) (2022-05-29T00:34:25Z) - Deep Image Deblurring: A Survey [165.32391279761006]
低レベルのコンピュータビジョンにおいて、デブロアリングは古典的な問題であり、ぼやけた入力画像からシャープなイメージを復元することを目的としている。
近年のディープラーニングの進歩は、この問題の解決に大きな進歩をもたらした。
論文 参考訳(メタデータ) (2022-01-26T01:31:30Z) - Weakly-supervised fire segmentation by visualizing intermediate CNN
layers [82.75113406937194]
画像やビデオにおける火の局所化は、火災事故に対処するための自律システムにとって重要なステップである。
我々は,ネットワークのトレーニングに画像ラベルのみを使用する,画像中の火の弱い制御セグメント化について検討する。
CNNの中間層における特徴量の平均値は,2値セグメンテーション問題である火災セグメンテーションの場合,従来のクラスアクティベーションマッピング(CAM)法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-16T11:56:28Z) - Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。
本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。
以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文 参考訳(メタデータ) (2021-10-25T21:01:00Z) - Segmentation of Roads in Satellite Images using specially modified U-Net
CNNs [0.0]
本研究の目的は,道路画像の特定を行う都市景観の衛星画像の分類器を構築することである。
従来のコンピュータビジョンアルゴリズムとは異なり、畳み込みニューラルネットワーク(CNN)はこのタスクに対して正確で信頼性の高い結果を提供する。
論文 参考訳(メタデータ) (2021-09-29T19:08:32Z) - Examining and Mitigating Kernel Saturation in Convolutional Neural
Networks using Negative Images [0.8594140167290097]
CNNにおける畳み込みカーネル飽和の影響を解析する。
トレーニングデータセットに負の画像を追加することで、飽和を緩和し、分類精度を高めるための単純なデータ増強技術を提案する。
以上の結果から,CNNは畳み込みカーネル飽和の影響を受けやすく,トレーニングデータセットに負のイメージを補うことで,分類精度が統計的に顕著に向上する可能性が示唆された。
論文 参考訳(メタデータ) (2021-05-10T06:06:49Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - A Singular Value Perspective on Model Robustness [14.591622269748974]
我々は、自然に訓練され、逆向きに堅牢なCNNが、同じデータセットに対して非常に異なる特徴を利用することを示す。
画像ランクに対するCNNの依存性を理解するために,最初のランクベース特徴属性法であるランク統合勾配(RIG)を提案する。
論文 参考訳(メタデータ) (2020-12-07T08:09:07Z) - Processing of incomplete images by (graph) convolutional neural networks [7.778461949427663]
欠落した値を置き換えることなく、不完全な画像からニューラルネットワークを訓練する問題について検討する。
画像はまずグラフとして表現され、欠落したピクセルは完全に無視される。
グラフ画像表現は空間グラフ畳み込みネットワークを用いて処理される。
論文 参考訳(メタデータ) (2020-10-26T21:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。