論文の概要: WSSL: Weighted Self-supervised Learning Framework For Image-inpainting
- arxiv url: http://arxiv.org/abs/2211.13856v1
- Date: Fri, 25 Nov 2022 01:50:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-28 14:58:31.048065
- Title: WSSL: Weighted Self-supervised Learning Framework For Image-inpainting
- Title(参考訳): WSSL: イメージインペインティングのための軽量な自己教師型学習フレームワーク
- Authors: Shubham Gupta, Rahul Kunigal Ravishankar, Madhoolika Gangaraju,
Poojasree Dwarkanath and Natarajan Subramanyam
- Abstract要約: 画像インペイント(英: Image inpainting)は、画像の失われた部分を再生する過程である。
改良されたアルゴリズムベースの手法は優れた結果を示したが、2つの大きな欠点がある。
本稿では,イメージインペイントのための新たな自己教師型学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 9.430059878665993
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image inpainting is the process of regenerating lost parts of the image.
Supervised algorithm-based methods have shown excellent results but have two
significant drawbacks. They do not perform well when tested with unseen data.
They fail to capture the global context of the image, resulting in a visually
unappealing result. We propose a novel self-supervised learning framework for
image-inpainting: Weighted Self-Supervised Learning (WSSL) to tackle these
problems. We designed WSSL to learn features from multiple weighted pretext
tasks. These features are then utilized for the downstream task,
image-inpainting. To improve the performance of our framework and produce more
visually appealing images, we also present a novel loss function for image
inpainting. The loss function takes advantage of both reconstruction loss and
perceptual loss functions to regenerate the image. Our experimentation shows
WSSL outperforms previous methods, and our loss function helps produce better
results.
- Abstract(参考訳): 画像の塗装は、画像の失われた部分を再生する過程である。
改良されたアルゴリズムベースの手法は優れた結果を示したが、2つの大きな欠点がある。
見えないデータでテストしても、うまく機能しない。
画像のグローバルなコンテキストをキャプチャできないため、視覚的に見当たらない結果になる。
本稿では,これらの問題に対処するために,新たな自己教師型学習フレームワークであるWeighted Self-Supervised Learning (WSSL)を提案する。
複数の重み付けされたプレテキストタスクから機能を学ぶためにWSSLを設計しました。
これらの機能はダウンストリームタスク、イメージインペインティングに利用されます。
また,このフレームワークの性能を向上し,より視覚的に魅力的な画像を生成するため,画像インパインティングのための新たな損失関数を提案する。
損失関数は、再構成損失と知覚損失関数の両方を利用して画像を再生する。
我々の実験では、WSSLは従来の手法よりも優れており、損失関数はより良い結果をもたらす。
関連論文リスト
- DiffBIR: Towards Blind Image Restoration with Generative Diffusion Prior [70.46245698746874]
DiffBIRは、視覚の異なる画像復元タスクを処理できる一般的な修復パイプラインである。
DiffBIRは, ブラインド画像復元問題を, 1) 劣化除去: 画像に依存しない内容の除去; 2) 情報再生: 失われた画像内容の生成の2段階に分離する。
第1段階では, 修復モジュールを用いて劣化を除去し, 高忠実度復元結果を得る。
第2段階では、潜伏拡散モデルの生成能力を活用して現実的な詳細を生成するIRControlNetを提案する。
論文 参考訳(メタデータ) (2023-08-29T07:11:52Z) - Rethinking PRL: A Multiscale Progressively Residual Learning Network for
Inverse Halftoning [3.632876183725243]
逆ハーフトニングは古典的な画像復元作業であり、バイレベルピクセルのみでハーフトーン画像から連続トーン画像を復元することを目的としている。
本稿では,UNetアーキテクチャを持ち,マルチスケールな入力画像を取得する,エンドツーエンドのマルチスケール・残留学習ネットワーク(MSPRL)を提案する。
論文 参考訳(メタデータ) (2023-05-27T03:37:33Z) - Unlocking Masked Autoencoders as Loss Function for Image and Video
Restoration [19.561055022474786]
我々は、損失の可能性を研究し、学習した損失関数は、画像とビデオの復元のためのニューラルネットワークの学習能力を高める」。
1)タスク適応型MAEからネイティブMAEへ、2)イメージタスクからビデオタスクへ、3)トランスフォーマー構造から畳み込みニューラルネットワーク構造へ。
論文 参考訳(メタデータ) (2023-03-29T02:41:08Z) - Learning Prior Feature and Attention Enhanced Image Inpainting [63.21231753407192]
本稿では,事前学習に基づくMasked AutoEncoder(MAE)を塗装モデルに組み込む。
マスク付き領域とマスキングされていない領域間の長距離依存性をより学習させるために,MAE の注意点を用いた手法を提案する。
論文 参考訳(メタデータ) (2022-08-03T04:32:53Z) - Training a Better Loss Function for Image Restoration [17.20936270604533]
単一画像のスーパーレゾリューションで最先端の損失関数を上回る軽量な特徴抽出器を訓練するには,単一の自然画像だけで十分であることを示す。
発電機が導入した誤差を罰するように訓練された一連の識別器からなる新しいマルチスケール識別特徴(MDF)損失を提案する。
論文 参考訳(メタデータ) (2021-03-26T17:29:57Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - Why Do Better Loss Functions Lead to Less Transferable Features? [93.47297944685114]
本稿では,画像ネット上で学習した畳み込みニューラルネットワークの隠れ表現が,学習対象の選択が伝達可能性に与える影響について検討する。
我々は,多くの目的が,バニラソフトマックスのクロスエントロピーよりも画像ネットの精度を統計的に有意に向上させることを示した。
論文 参考訳(メタデータ) (2020-10-30T17:50:31Z) - Improving Text to Image Generation using Mode-seeking Function [5.92166950884028]
異なる画像を生成するための特別なモード探索損失関数を開発する。
われわれのモデルは、Caltech BirdsデータセットとMicrosoft COCOデータセットで検証する。
実験結果から,我々のモデルは最先端のアプローチと比較して非常によく機能することが示された。
論文 参考訳(メタデータ) (2020-08-19T12:58:32Z) - Powers of layers for image-to-image translation [60.5529622990682]
本稿では,未ペア画像から画像への変換タスクに対処するシンプルなアーキテクチャを提案する。
固定重み付きイメージオートエンコーダアーキテクチャから始める。
各タスクに対して、潜在空間で動作している残留ブロックを学習し、ターゲット領域に到達するまで繰り返し呼び出される。
論文 参考訳(メタデータ) (2020-08-13T09:02:17Z) - Distilling Localization for Self-Supervised Representation Learning [82.79808902674282]
コントラスト学習は教師なし表現学習に革命をもたらした。
現在のコントラストモデルでは、前景オブジェクトのローカライズには効果がない。
本稿では,背景変化を学習するためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T16:29:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。