論文の概要: Repaint: Improving the Generalization of Down-Stream Visual Tasks by
Generating Multiple Instances of Training Examples
- arxiv url: http://arxiv.org/abs/2110.10366v1
- Date: Wed, 20 Oct 2021 04:00:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-22 13:55:48.685298
- Title: Repaint: Improving the Generalization of Down-Stream Visual Tasks by
Generating Multiple Instances of Training Examples
- Title(参考訳): Repaint: トレーニング事例の複数事例の生成によるダウンストリーム視覚タスクの一般化の改善
- Authors: Amin Banitalebi-Dehkordi and Yong Zhang
- Abstract要約: 視覚タスクのための畳み込みニューラルネットワーク(CNN)は、低レベルのテクスチャと高レベルのオブジェクト属性の両方を学ぶと考えられている。
本稿では,CNNにおけるテクスチャバイアスについて検討する。
私たちは、リペイントと呼ばれるプロセスを通じて、元のイメージからトレーニング例の複数のインスタンスを再生します。
- 参考スコア(独自算出の注目度): 8.09193285529236
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Convolutional Neural Networks (CNNs) for visual tasks are believed to learn
both the low-level textures and high-level object attributes, throughout the
network depth. This paper further investigates the `texture bias' in CNNs. To
this end, we regenerate multiple instances of training examples from each
original image, through a process we call `repainting'. The repainted examples
preserve the shape and structure of the regions and objects within the scenes,
but diversify their texture and color. Our method can regenerate a same image
at different daylight, season, or weather conditions, can have colorization or
de-colorization effects, or even bring back some texture information from
blacked-out areas. The in-place repaint allows us to further use these
repainted examples for improving the generalization of CNNs. Through an
extensive set of experiments, we demonstrate the usefulness of the repainted
examples in training, for the tasks of image classification (ImageNet) and
object detection (COCO), over several state-of-the-art network architectures at
different capacities, and across different data availability regimes.
- Abstract(参考訳): 視覚タスクのための畳み込みニューラルネットワーク(CNN)は、ネットワーク深度を通して、低レベルのテクスチャと高レベルのオブジェクト属性の両方を学ぶと考えられている。
本稿では,CNNにおける「テクスチャバイアス」についても検討する。
この目的のために、私たちは‘repainting’と呼ばれるプロセスを通じて、各オリジナルイメージからトレーニングサンプルの複数のインスタンスを再生成します。
再塗装された例では、シーン内の領域や物体の形や構造は保存されるが、そのテクスチャや色は多様化する。
本手法では,異なる日光,季節,天候条件で同じ画像を再生したり,色づけや脱色効果を付与したり,黒色領域からテクスチャ情報を取り返したりすることができる。
インプレース・リペイントは、cnnの一般化を改善するためにこれらの再ペイントされた例をさらに利用することを可能にします。
画像分類(ImageNet)とオブジェクト検出(COCO)のタスクや,さまざまな能力を持つ最先端ネットワークアーキテクチャ,さまざまなデータアベイラビリティーシステムにおいて,トレーニングにおける再塗装例の有用性を実証する。
関連論文リスト
- Multi-Scale Representation Learning for Image Restoration with State-Space Model [13.622411683295686]
効率的な画像復元のためのマルチスケール状態空間モデル(MS-Mamba)を提案する。
提案手法は,計算複雑性を低く保ちながら,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2024-08-19T16:42:58Z) - Volume Feature Rendering for Fast Neural Radiance Field Reconstruction [11.05302598034426]
ニューラルレイディアンス場(NeRF)は、異なる位置と視点から撮影された多視点画像から現実的な新しいビューを合成することができる。
NeRFのレンダリングパイプラインでは、ニューラルネットワークはシーンを独立して表現したり、期待される色や密度のポイントのクエリ可能な特徴ベクトルを変換するために使用される。
提案手法では,まず,まず線の特徴ベクトルを描画し,次にニューラルネットワークにより最終画素色に変換する。
論文 参考訳(メタデータ) (2023-05-29T06:58:27Z) - T-former: An Efficient Transformer for Image Inpainting [50.43302925662507]
トランスフォーマーと呼ばれる注目に基づくネットワークアーキテクチャのクラスは、自然言語処理の分野で大きなパフォーマンスを示している。
本稿では,Taylorの展開に応じて,解像度に線形に関連付けられた新たな注意を設計し,この注意に基づいて,画像インペイントのためのネットワークである$T$-formerを設計する。
いくつかのベンチマークデータセットの実験により,提案手法は比較的少ないパラメータ数と計算複雑性を維持しつつ,最先端の精度を達成できることが示されている。
論文 参考訳(メタデータ) (2023-05-12T04:10:42Z) - ParaColorizer: Realistic Image Colorization using Parallel Generative
Networks [1.7778609937758327]
グレースケール画像のカラー化は、情報復元のためのAIの魅力的な応用である。
並列なGANベースのカラー化フレームワークを提案する。
マルチモーダル問題を評価するために一般的に使用される非知覚的評価指標の欠点を示す。
論文 参考訳(メタデータ) (2022-08-17T13:49:44Z) - Perceptual Artifacts Localization for Inpainting [60.5659086595901]
そこで本研究では,知覚的アーティファクトの自動セグメンテーションの学習タスクを提案する。
データセット上で高度なセグメンテーションネットワークをトレーニングし、インペイントされた画像内のインペイントされたアーティファクトを確実にローカライズする。
また, 対象領域と対象領域全体との比率である知覚人工物比 (PAR) という新しい評価指標を提案する。
論文 参考訳(メタデータ) (2022-08-05T18:50:51Z) - Learning Prior Feature and Attention Enhanced Image Inpainting [63.21231753407192]
本稿では,事前学習に基づくMasked AutoEncoder(MAE)を塗装モデルに組み込む。
マスク付き領域とマスキングされていない領域間の長距離依存性をより学習させるために,MAE の注意点を用いた手法を提案する。
論文 参考訳(メタデータ) (2022-08-03T04:32:53Z) - Restore from Restored: Single-image Inpainting [9.699531255678856]
インペイントネットワークのための,新しい,効率的な自己教師型微調整アルゴリズムを提案する。
既存の自己相似パッチを用いて,事前学習した塗装ネットワークのパラメータを更新する。
公開されているベンチマークデータセット上で、最先端の塗装結果を得る。
論文 参考訳(メタデータ) (2021-10-25T11:38:51Z) - Restore from Restored: Single-image Inpainting [9.699531255678856]
本論文では,絵画ネットワークにおける自己監督型微調整アルゴリズムについて述べる。
入力画像内の既存の自己相似パッチを利用して,事前学習したネットワークのパラメータをアップグレードする。
公開ベンチマークデータセットで最先端のインペインティング結果を達成します。
論文 参考訳(メタデータ) (2021-02-16T10:59:28Z) - Neural Re-Rendering of Humans from a Single Image [80.53438609047896]
本稿では,新しいユーザ定義のポーズと視点の下での人間のニューラルリレンダリング手法を提案する。
私たちのアルゴリズムは、単一の画像から再構築できるパラメトリックメッシュとして体ポーズと形状を表します。
論文 参考訳(メタデータ) (2021-01-11T18:53:47Z) - Free-Form Image Inpainting via Contrastive Attention Network [64.05544199212831]
画像の塗装作業では、複雑なパターンを形成する画像のどこにでも、どんな形でもマスクが現れる。
エンコーダはこの複雑な状況下でこのような強力な表現を捕捉することは困難である。
本稿では,ロバスト性と一般化性を改善するための自己教師型シームズ推論ネットワークを提案する。
論文 参考訳(メタデータ) (2020-10-29T14:46:05Z) - Instance-aware Image Colorization [51.12040118366072]
本稿では,インスタンス認識のカラー化を実現する手法を提案する。
我々のネットワークアーキテクチャは、市販のオブジェクト検出器を利用して、収穫されたオブジェクト画像を取得する。
類似したネットワークを用いて、フルイメージの特徴を抽出し、融合モジュールを適用して最終色を予測する。
論文 参考訳(メタデータ) (2020-05-21T17:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。