論文の概要: DeepClean: Integrated Distortion Identification and Algorithm Selection for Rectifying Image Corruptions
- arxiv url: http://arxiv.org/abs/2407.16302v1
- Date: Tue, 23 Jul 2024 08:57:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-24 17:56:16.933963
- Title: DeepClean: Integrated Distortion Identification and Algorithm Selection for Rectifying Image Corruptions
- Title(参考訳): DeepClean: 画像破壊の修正のための統合的歪み同定とアルゴリズム選択
- Authors: Aditya Kapoor, Harshad Khadilkar, Jayvardhana Gubbi,
- Abstract要約: 画像歪みの自動分類と修正のための2段階逐次計画手法を提案する。
提案手法の利点は、入力画像に条件付けされた動的再構成と、推論時に未確認候補アルゴリズムの一般化である。
- 参考スコア(独自算出の注目度): 1.8024397171920883
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Distortion identification and rectification in images and videos is vital for achieving good performance in downstream vision applications. Instead of relying on fixed trial-and-error based image processing pipelines, we propose a two-level sequential planning approach for automated image distortion classification and rectification. At the higher level it detects the class of corruptions present in the input image, if any. The lower level selects a specific algorithm to be applied, from a set of externally provided candidate algorithms. The entire two-level setup runs in the form of a single forward pass during inference and it is to be queried iteratively until the retrieval of the original image. We demonstrate improvements compared to three baselines on the object detection task on COCO image dataset with rich set of distortions. The advantage of our approach is its dynamic reconfiguration, conditioned on the input image and generalisability to unseen candidate algorithms at inference time, since it relies only on the comparison of their output of the image embeddings.
- Abstract(参考訳): 画像やビデオの歪みの識別と修正は、下流の視覚アプリケーションにおいて優れたパフォーマンスを達成するために不可欠である。
固定された試行錯誤に基づく画像処理パイプラインに頼る代わりに、画像歪みの自動分類と修正のための2段階の逐次計画手法を提案する。
より高いレベルでは、もしあれば、入力画像に存在する汚職のクラスを検出する。
下位レベルは、適用すべき特定のアルゴリズムを、外部に提供された候補アルゴリズムのセットから選択する。
2段階のセットアップは、推論中に1つのフォワードパスの形式で実行され、元のイメージが検索されるまで反復的にクエリされる。
歪みの豊富なCOCO画像データセットにおけるオブジェクト検出タスクの3つのベースラインと比較して改善点を示す。
提案手法の利点は、画像埋め込みの出力の比較にのみ依存するため、入力画像に条件付きで動的再構成を行い、推論時に候補アルゴリズムが見えないように一般化可能であることである。
関連論文リスト
- Solving General Noisy Inverse Problem via Posterior Sampling: A Policy Gradient Viewpoint [21.22750301965104]
本研究では,事前学習した拡散生成モデルを用いて,タスク固有モデルによる微調整を伴わずに,幅広い画像逆タスクを解く。
入力画像の誘導スコア関数を正確に推定するために,拡散ポリシー勾配(DPG)を提案する。
実験により,複数の線形および非線形の逆問題に対するガウス雑音とポアソン雑音の両方に対して,本手法は頑健であることが示された。
論文 参考訳(メタデータ) (2024-03-15T16:38:47Z) - Curvature regularization for Non-line-of-sight Imaging from
Under-sampled Data [5.591221518341613]
非視線イメージング(NLOS)は、視線で測定されたデータから3次元の隠れたシーンを再構築することを目的としている。
曲率正規化に基づく新しいNLOS再構成モデルを提案する。
提案したアルゴリズムを,合成データセットと実データセットの両方で評価する。
論文 参考訳(メタデータ) (2023-01-01T14:10:43Z) - Fast Key Points Detection and Matching for Tree-Structured Images [4.929206987094714]
本稿では,木状パターンを用いたナノ解像度視覚識別子の画像マッチングに基づく新しい認証アルゴリズムを提案する。
提案アルゴリズムは様々な木構造画像マッチングに適用できるが,近年開発された視覚的識別子であるデンドライトに焦点をあてる。
論文 参考訳(メタデータ) (2022-11-07T00:22:56Z) - Exploring Resolution and Degradation Clues as Self-supervised Signal for
Low Quality Object Detection [77.3530907443279]
劣化した低解像度画像中の物体を検出するための,新しい自己教師型フレームワークを提案する。
本手法は, 既存手法と比較して, 異変劣化状況に直面する場合に比べ, 優れた性能を示した。
論文 参考訳(メタデータ) (2022-08-05T09:36:13Z) - Inverse Problems Leveraging Pre-trained Contrastive Representations [88.70821497369785]
破損したデータの表現を復元するための新しい逆問題群について検討する。
コントラスト目的を用いた教師付きインバージョン手法を提案する。
提案手法は,幅広いフォワード演算子においてラベル付きデータのごく一部であっても,エンド・ツー・エンドのベースラインよりも優れる。
論文 参考訳(メタデータ) (2021-10-14T15:06:30Z) - Region-level Active Learning for Cluttered Scenes [60.93811392293329]
本稿では,従来の画像レベルのアプローチとオブジェクトレベルのアプローチを一般化した領域レベルのアプローチに仮定する新たな戦略を提案する。
その結果,本手法はラベル付けの労力を大幅に削減し,クラス不均衡や散らかったシーンを生かしたリアルなデータに対する希少なオブジェクト検索を改善することが示唆された。
論文 参考訳(メタデータ) (2021-08-20T14:02:38Z) - A deep primal-dual proximal network for image restoration [8.797434238081372]
我々は、プリミティブ・デュアル・イテレーションから構築されたディープPDNetというディープネットワークを設計し、前もって分析を行い、標準的なペナル化可能性の最小化を図った。
フルラーニング」と「パートラーニング」の2つの異なる学習戦略が提案され、第1は最も効率的な数値である。
以上の結果から,提案したDeepPDNetは,MNISTと,より複雑なBSD68,BSD100,SET14データセットにおいて,画像復元と単一画像超解像処理に優れた性能を示した。
論文 参考訳(メタデータ) (2020-07-02T08:29:52Z) - Fully Unsupervised Diversity Denoising with Convolutional Variational
Autoencoders [81.30960319178725]
完全畳み込み変分オートエンコーダ(VAE)に基づく復調手法であるDivNoisingを提案する。
まず, 撮像ノイズモデルをデコーダに明示的に組み込むことにより, 教師なしの雑音発生問題をVAEフレームワーク内に定式化する手法を提案する。
このようなノイズモデルは、ノイズの多いデータから測定したり、ブートストラップしたり、トレーニング中に共同学習したりすることが可能である。
論文 参考訳(メタデータ) (2020-06-10T21:28:13Z) - The Power of Triply Complementary Priors for Image Compressive Sensing [89.14144796591685]
本稿では,一対の相補的な旅先を含むLRD画像モデルを提案する。
次に、画像CSのためのRDモデルに基づく新しいハイブリッド・プラグイン・アンド・プレイ・フレームワークを提案する。
そこで,提案したH-based image CS問題の解法として,単純で効果的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-16T08:17:44Z) - Self-Supervised Linear Motion Deblurring [112.75317069916579]
深層畳み込みニューラルネットワークは、画像の劣化の最先端技術である。
本稿では,自己監督型動作遅延に対する識別可能なreblurモデルを提案する。
我々の実験は、自己監督された単一画像の劣化が本当に実現可能であることを実証した。
論文 参考訳(メタデータ) (2020-02-10T20:15:21Z) - Progressive Local Filter Pruning for Image Retrieval Acceleration [43.97722250091591]
画像検索高速化のための新しいプログレッシブ・ローカルフィルタ・プルーニング(PLFP)法を提案する。
具体的には、各フィルタの局所的な幾何学的性質を分析し、隣人に置き換えられるものを選択する。
このように、モデルの表現能力は保持される。
論文 参考訳(メタデータ) (2020-01-24T04:28:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。