論文の概要: A Fast Deep Learning Network for Automatic Image Auto-Straightening
- arxiv url: http://arxiv.org/abs/2105.05787v1
- Date: Wed, 12 May 2021 17:01:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-13 14:14:03.162114
- Title: A Fast Deep Learning Network for Automatic Image Auto-Straightening
- Title(参考訳): 画像自動スタイリングのための高速深層学習ネットワーク
- Authors: Ionut Mironica and Andrei Zugravu
- Abstract要約: 本稿では,画像回転補正に特化した新しい深層学習ネットワークを提案する。
画像から長線を検出することに特化した長方形奥行き畳み込みを導入する。
また、配向誤差の問題に対処する新しい適応損失関数も導入しています。
- 参考スコア(独自算出の注目度): 0.6980076213134382
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Rectifying the orientation of images represents a daily task for every
photographer. This task may be complicated even for the human eye, especially
when the horizon or other horizontal and vertical lines in the image are
missing. In this paper we address this problem and propose a new deep learning
network specially adapted for image rotation correction: we introduce the
rectangle-shaped depthwise convolutions which are specialized in detecting long
lines from the image and a new adapted loss function that addresses the problem
of orientation errors.
Compared to other methods that are able to detect rotation errors only on few
image categories, like man-made structures, the proposed method can be used on
a larger variety of photographs e.g., portraits, landscapes, sport, night
photos etc. Moreover, the model is adapted to mobile devices and can be run in
real time, both for pictures and for videos. An extensive evaluation of our
model on different datasets shows that it remarkably generalizes, not being
dependent on any particular type of image. Finally, we significantly outperform
the state-of-the-art methods, providing superior results.
- Abstract(参考訳): 画像の向きを変えることは、すべての写真家にとって日常的なタスクである。
この作業は人間の目でも複雑で、特に水平線や他の水平線や垂直線が失われている場合は複雑である。
本稿では,画像回転補正に特化した新しい深層学習ネットワークを提案する。画像からの長線検出に特化した長方形奥行き畳み込みと,方向誤差問題に対処する新しい適応型損失関数を提案する。
人造構造のような少数の画像カテゴリでのみ回転誤差を検出できる他の方法と比較して、提案手法は、例えば、肖像画、風景、スポーツ、夜の写真など、より多種多様な写真に利用することができる。
さらに、このモデルはモバイルデバイスに対応しており、写真とビデオの両方でリアルタイムで実行することができる。
異なるデータセット上での我々のモデルの広範な評価は、特定の種類の画像に依存しない、著しく一般化していることを示している。
最後に、最先端のメソッドを著しく上回り、優れた結果を得る。
関連論文リスト
- CricaVPR: Cross-image Correlation-aware Representation Learning for Visual Place Recognition [73.51329037954866]
視覚的位置認識のための画像間相関認識を用いたロバストなグローバル表現手法を提案する。
本手法では,バッチ内の複数の画像の相関にアテンション機構を用いる。
本手法は,訓練時間を大幅に短縮し,最先端の手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-29T15:05:11Z) - Learning to Compare Longitudinal Images [15.245936854932374]
深層学習モデル(PaIRNetと呼ばれる)をトレーニングし、一対の長手画像と監督の有無を比較します。
4つのデータセットから得られた結果は,PaIRNetが有意な経年変化の局所化と定量化に極めて有効であることを示す。
論文 参考訳(メタデータ) (2023-04-05T15:52:07Z) - Parallax-Tolerant Unsupervised Deep Image Stitching [57.76737888499145]
本稿では,パララックス耐性の非教師あり深層画像縫合技術であるUDIS++を提案する。
まず,グローバルなホモグラフィから局所的な薄板スプライン運動への画像登録をモデル化するための,頑健で柔軟なワープを提案する。
本研究では, 縫合された画像をシームレスに合成し, シーム駆動合成マスクの教師なし学習を行うことを提案する。
論文 参考訳(メタデータ) (2023-02-16T10:40:55Z) - A Generalist Framework for Panoptic Segmentation of Images and Videos [61.61453194912186]
我々は,タスクの帰納バイアスに頼ることなく,離散的なデータ生成問題としてパノプティクスセグメンテーションを定式化する。
単純な構造と一般的な損失関数を持つパノスコープマスクをモデル化するための拡散モデルを提案する。
本手法は,動画を(ストリーミング環境で)モデル化し,オブジェクトのインスタンスを自動的に追跡することを学ぶ。
論文 参考訳(メタデータ) (2022-10-12T16:18:25Z) - Deep Rotation Correction without Angle Prior [57.76737888499145]
我々は,高コンテンツ忠実度で傾きを自動的に補正する,回転補正という新しい実用的タスクを提案する。
このタスクは画像編集アプリケーションに簡単に統合でき、ユーザーは手動操作なしで回転した画像を修正できる。
我々はニューラルネットワークを利用して、傾斜した画像を知覚的に水平に歪めることができる光学フローを予測する。
論文 参考訳(メタデータ) (2022-07-07T02:46:27Z) - Controllable Person Image Synthesis with Spatially-Adaptive Warped
Normalization [72.65828901909708]
制御可能な人物画像生成は、望ましい属性を持つ現実的な人間の画像を作成することを目的としている。
本稿では,学習フロー場とワープ変調パラメータを統合した空間適応型ワープ正規化(SAWN)を提案する。
本稿では,テクスチャ・トランスファータスクの事前学習モデルを洗練するための,新たな自己学習部分置換戦略を提案する。
論文 参考訳(メタデータ) (2021-05-31T07:07:44Z) - Learning to Resize Images for Computer Vision Tasks [15.381549764216134]
そこで本研究では,リニアリシライザを学習リシライザに置き換えることで,性能を大幅に向上できることを示す。
我々の学習画像復調器はベースライン視覚モデルで共同で訓練されている。
提案手法は,他の視覚タスクの分類ベースラインの微調整にも有用であることを示す。
論文 参考訳(メタデータ) (2021-03-17T23:43:44Z) - Generative and Discriminative Learning for Distorted Image Restoration [22.230017059874445]
Liquifyは、画像の歪みに使用できる画像編集のテクニックである。
本稿では,深層ニューラルネットワークに基づく新しい生成的・識別的学習手法を提案する。
論文 参考訳(メタデータ) (2020-11-11T14:01:29Z) - Data--driven Image Restoration with Option--driven Learning for Big and
Small Astronomical Image Datasets [11.96518190758417]
本稿では,データ駆動型画像復元手法を提案する。
本手法は,参照画像の数にかかわらず,非常に安定した画像復元結果が得られる。
論文 参考訳(メタデータ) (2020-11-07T05:05:55Z) - Deep Image Orientation Angle Detection [0.0]
本稿では,CNNと特別にアングル用に設計されたカスタム損失関数の組み合わせが,最先端の成果につながることを示す。
これは、任意の程度(0から360度)の任意の画像または文書の向き角を推定することを含む。
論文 参考訳(メタデータ) (2020-06-21T14:24:18Z) - Self-Supervised Linear Motion Deblurring [112.75317069916579]
深層畳み込みニューラルネットワークは、画像の劣化の最先端技術である。
本稿では,自己監督型動作遅延に対する識別可能なreblurモデルを提案する。
我々の実験は、自己監督された単一画像の劣化が本当に実現可能であることを実証した。
論文 参考訳(メタデータ) (2020-02-10T20:15:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。