論文の概要: Optimal Eye Surgeon: Finding Image Priors through Sparse Generators at Initialization
- arxiv url: http://arxiv.org/abs/2406.05288v1
- Date: Fri, 7 Jun 2024 23:04:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-11 20:34:04.667197
- Title: Optimal Eye Surgeon: Finding Image Priors through Sparse Generators at Initialization
- Title(参考訳): 最適アイサージオン:初期化時のスパースジェネレータによる画像先行検出
- Authors: Avrajit Ghosh, Xitong Zhang, Kenneth K. Sun, Qing Qu, Saiprasad Ravishankar, Rongrong Wang,
- Abstract要約: 我々は,深部画像生成ネットワークのプルーニングとトレーニングのためのフレームワークであるOptimal Eye Surgeon (OES)を紹介した。
OESは適応的にネットワークをランダムにプルーニングすることでこの問題に対処する。
システムは、単にマスクすることで、トレーニングなしでも、低周波画像成分を効果的にキャプチャする。
- 参考スコア(独自算出の注目度): 16.872747330499507
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce Optimal Eye Surgeon (OES), a framework for pruning and training deep image generator networks. Typically, untrained deep convolutional networks, which include image sampling operations, serve as effective image priors (Ulyanov et al., 2018). However, they tend to overfit to noise in image restoration tasks due to being overparameterized. OES addresses this by adaptively pruning networks at random initialization to a level of underparameterization. This process effectively captures low-frequency image components even without training, by just masking. When trained to fit noisy images, these pruned subnetworks, which we term Sparse-DIP, resist overfitting to noise. This benefit arises from underparameterization and the regularization effect of masking, constraining them in the manifold of image priors. We demonstrate that subnetworks pruned through OES surpass other leading pruning methods, such as the Lottery Ticket Hypothesis, which is known to be suboptimal for image recovery tasks (Wu et al., 2023). Our extensive experiments demonstrate the transferability of OES-masks and the characteristics of sparse-subnetworks for image generation. Code is available at https://github.com/Avra98/Optimal-Eye-Surgeon.git.
- Abstract(参考訳): 我々は,深部画像生成ネットワークのプルーニングとトレーニングのためのフレームワークであるOptimal Eye Surgeon (OES)を紹介した。
通常、画像サンプリング操作を含む未訓練の深層畳み込みネットワークは、効果的な画像優先として機能する(Ulyanov et al , 2018)。
しかし、過パラメータ化されているため、画像復元作業ではノイズに過度に適応する傾向にある。
OESは、ネットワークをランダム初期化してアンダーパラメータ化のレベルに適応的にプルーニングすることでこの問題に対処する。
このプロセスは、単にマスクすることで、トレーニングなしでも、低周波画像成分を効果的にキャプチャする。
Sparse-DIPと呼ばれるこの破れたサブネットは、ノイズに対する過度な適応に抵抗する。
この利点は、アンダーパラメータ化とマスキングの正規化効果から生じ、それらを画像前の多様体に制約する。
我々は,OESを経由したサブネットワークが,画像回復作業に最適であることが知られているロッテ・ティケット仮説(Wu et al ,2023)など,他の先進的なプルーニング手法を上回ることを実証した。
我々は,OESマスクの転送性および画像生成用スパースサブネットの特性について広範な実験を行った。
コードはhttps://github.com/Avra98/Optimal-Eye-Surgeon.gitで公開されている。
関連論文リスト
- Chasing Better Deep Image Priors between Over- and Under-parameterization [63.8954152220162]
そこで本研究では,DNN固有の空間性を利用して,LIP(lottery image prior)を新たに検討する。
LIPworksは、コンパクトなモデルサイズでディープデコーダを著しく上回っている。
また、LIPを圧縮センシング画像再構成に拡張し、事前学習したGANジェネレータを前者として使用する。
論文 参考訳(メタデータ) (2024-10-31T17:49:44Z) - Disruptive Autoencoders: Leveraging Low-level features for 3D Medical
Image Pre-training [51.16994853817024]
本研究は、3Dラジオグラフィ画像のための効果的な事前学習フレームワークの設計に焦点をあてる。
ローカルマスキングと低レベルの摂動の組み合わせによって生成された破壊から、オリジナルのイメージを再構築しようとする事前トレーニングフレームワークであるDisruptive Autoencodersを紹介する。
提案する事前トレーニングフレームワークは、複数のダウンストリームタスクでテストされ、最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-07-31T17:59:42Z) - Raw or Cooked? Object Detection on RAW Images [11.991240159496833]
本稿では,映像の中間表現が下流コンピュータビジョンタスクに最適であるという仮説を考察する。
我々は,ISP の操作を,トレーニング中に共同で操作のパラメータを学習することで,エンドタスクに最適化するべきであることを示唆する。
本稿では,従来のRGB画像と比較して,物体検出装置が優れた性能を発揮するための学習可能な新たな操作を提案する。
論文 参考訳(メタデータ) (2023-01-21T15:42:53Z) - Masked Autoencoders are Robust Data Augmentors [90.34825840657774]
ディープニューラルネットワークの一般化には、画像拡張のような正規化技術が必要である。
本稿では,トレーニングプロセスの正規化に向けて,新たな拡張の視点を提案する。
このようなモデルに基づく非線形変換をデータ拡張として活用することで,高レベルの認識タスクを向上できることを示す。
論文 参考訳(メタデータ) (2022-06-10T02:41:48Z) - Is Deep Image Prior in Need of a Good Education? [57.3399060347311]
画像再構成に有効な先行画像として, 奥行き画像が導入された。
その印象的な再建性にもかかわらず、学習技術や伝統的な再建技術と比べてアプローチは遅い。
計算課題に対処する2段階の学習パラダイムを開発する。
論文 参考訳(メタデータ) (2021-11-23T15:08:26Z) - A deep primal-dual proximal network for image restoration [8.797434238081372]
我々は、プリミティブ・デュアル・イテレーションから構築されたディープPDNetというディープネットワークを設計し、前もって分析を行い、標準的なペナル化可能性の最小化を図った。
フルラーニング」と「パートラーニング」の2つの異なる学習戦略が提案され、第1は最も効率的な数値である。
以上の結果から,提案したDeepPDNetは,MNISTと,より複雑なBSD68,BSD100,SET14データセットにおいて,画像復元と単一画像超解像処理に優れた性能を示した。
論文 参考訳(メタデータ) (2020-07-02T08:29:52Z) - The Power of Triply Complementary Priors for Image Compressive Sensing [89.14144796591685]
本稿では,一対の相補的な旅先を含むLRD画像モデルを提案する。
次に、画像CSのためのRDモデルに基づく新しいハイブリッド・プラグイン・アンド・プレイ・フレームワークを提案する。
そこで,提案したH-based image CS問題の解法として,単純で効果的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-16T08:17:44Z) - Exploiting Deep Generative Prior for Versatile Image Restoration and
Manipulation [181.08127307338654]
本研究は, 大規模自然画像に基づいて学習したGAN(Generative Adversarial Network)により, 得られた画像の有効利用方法を示す。
深層生成前駆体(DGP)は、色、パッチ、解像度、様々な劣化した画像の欠落したセマンティクスを復元するための説得力のある結果を提供する。
論文 参考訳(メタデータ) (2020-03-30T17:45:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。