論文の概要: Discriminative feature encoding for intrinsic image decomposition
- arxiv url: http://arxiv.org/abs/2209.12155v1
- Date: Sun, 25 Sep 2022 05:51:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 16:15:32.085012
- Title: Discriminative feature encoding for intrinsic image decomposition
- Title(参考訳): 固有画像分解のための識別的特徴符号化
- Authors: Zongji Wang, Yunfei Liu, and Feng Lu
- Abstract要約: 内在画像分解は、重要かつ長期にわたるコンピュータビジョン問題である。
この研究はディープラーニングを利用しており、この挑戦的なコンピュータビジョン問題を高い効率で解くことができることを示している。
- 参考スコア(独自算出の注目度): 16.77439691640257
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Intrinsic image decomposition is an important and long-standing computer
vision problem. Given an input image, recovering the physical scene properties
is ill-posed. Several physically motivated priors have been used to restrict
the solution space of the optimization problem for intrinsic image
decomposition. This work takes advantage of deep learning, and shows that it
can solve this challenging computer vision problem with high efficiency. The
focus lies in the feature encoding phase to extract discriminative features for
different intrinsic layers from an input image. To achieve this goal, we
explore the distinctive characteristics of different intrinsic components in
the high dimensional feature embedding space. We define feature distribution
divergence to efficiently separate the feature vectors of different intrinsic
components. The feature distributions are also constrained to fit the real ones
through a feature distribution consistency. In addition, a data refinement
approach is provided to remove data inconsistency from the Sintel dataset,
making it more suitable for intrinsic image decomposition. Our method is also
extended to intrinsic video decomposition based on pixel-wise correspondences
between adjacent frames. Experimental results indicate that our proposed
network structure can outperform the existing state-of-the-art.
- Abstract(参考訳): 内在画像分解は、重要かつ長期にわたるコンピュータビジョン問題である。
入力画像が与えられた場合、物理シーン特性の回復が不良となる。
物理的に動機づけられたいくつかの事前条件は、内在的な画像分解の最適化問題の解空間を制限するために用いられてきた。
この研究はディープラーニングを活用し、この難しいコンピュータビジョン問題を高い効率で解決できることを示しています。
焦点は、入力画像から異なる固有の層に対する識別的特徴を抽出する特徴符号化フェーズにある。
この目的を達成するため、我々は高次元特徴埋め込み空間における異なる固有成分の特徴を探索する。
特徴分布の分散を定義し、異なる固有成分の特徴ベクトルを効率的に分離する。
機能分布は、機能分布の一貫性を通じて実際のものに合わせて制限される。
さらに、sintelデータセットからデータ不一貫性を取り除くためのデータリファインメントアプローチも提供されており、本質的な画像分解に適している。
また,隣接フレーム間の画素ワイド対応に基づく固有映像分解にも拡張した。
実験の結果,提案するネットワーク構造は,既存のネットワーク構造よりも優れていることがわかった。
関連論文リスト
- Pixel-Inconsistency Modeling for Image Manipulation Localization [63.54342601757723]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - DBAT: Dynamic Backward Attention Transformer for Material Segmentation
with Cross-Resolution Patches [8.812837829361923]
クロスレゾリューション特徴を集約する動的後方アテンション変換器(DBAT)を提案する。
実験の結果,DBATの精度は86.85%であり,最先端のリアルタイムモデルの中では最高の性能であることがわかった。
さらに,提案モデルが他の手法よりも優れた材料関連特徴を抽出できることを示すため,セマンティックなラベルにアライメントし,ネットワーク分割を行う。
論文 参考訳(メタデータ) (2023-05-06T03:47:20Z) - Feature Completion Transformer for Occluded Person Re-identification [14.735577283631509]
咬合者の再同定(Re-ID)は,咬合者の破壊による課題である。
特徴空間に隠された部分の意味情報を暗黙的に補完する特徴補完変換器(FCFormer)を提案する。
FCFormerは優れたパフォーマンスを実現し、隠蔽されたデータセットに対してかなりのマージンで最先端の手法を上回ります。
論文 参考訳(メタデータ) (2023-03-03T01:12:57Z) - CoCoNet: Coupled Contrastive Learning Network with Multi-level Feature
Ensemble for Multi-modality Image Fusion [72.8898811120795]
我々は、赤外線と可視画像の融合を実現するために、CoCoNetと呼ばれるコントラスト学習ネットワークを提案する。
本手法は,主観的評価と客観的評価の両面において,最先端(SOTA)性能を実現する。
論文 参考訳(メタデータ) (2022-11-20T12:02:07Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - Component Tree Loss Function: Definition and Optimization [0.0]
このような階層的画像表現のノードに関連する高度が、画像ピクセル値に対してどのように区別されるかを示す。
この機能は、絶滅値などの様々な属性に基づいて画像の最大値を選択または破棄できる汎用的損失関数を設計するために使用される。
論文 参考訳(メタデータ) (2021-01-20T10:55:37Z) - Blur-Attention: A boosting mechanism for non-uniform blurred image
restoration [27.075713246257596]
非一様ぼかし画像の特徴を動的に捉えるためのぼかしアテンションモジュールを提案する。
条件生成の逆方向のフレームワークにぼやけたアテンションネットワークを導入することにより、エンド・ツー・エンドのブラインド・モーション・デブロアリング法を提案する。
実験結果から,PSNR,SSIM,主観的視覚的品質の両面において,本手法の劣化能力は優れた客観的性能を示した。
論文 参考訳(メタデータ) (2020-08-19T16:07:06Z) - A Flexible Framework for Designing Trainable Priors with Adaptive
Smoothing and Game Encoding [57.1077544780653]
我々は、前方通過を非滑らかな凸最適化問題として解釈できるニューラルネットワーク層の設計とトレーニングのための一般的なフレームワークを紹介する。
グラフのノードに代表されるローカルエージェントによって解決され、正規化関数を介して相互作用する凸ゲームに焦点を当てる。
このアプローチは、訓練可能なエンドツーエンドのディープモデル内で、古典的な画像の事前使用を可能にするため、画像の問題を解決するために魅力的である。
論文 参考訳(メタデータ) (2020-06-26T08:34:54Z) - Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。
特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文 参考訳(メタデータ) (2020-03-02T13:28:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。