論文の概要: Discriminative feature encoding for intrinsic image decomposition
- arxiv url: http://arxiv.org/abs/2209.12155v1
- Date: Sun, 25 Sep 2022 05:51:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 16:15:32.085012
- Title: Discriminative feature encoding for intrinsic image decomposition
- Title(参考訳): 固有画像分解のための識別的特徴符号化
- Authors: Zongji Wang, Yunfei Liu, and Feng Lu
- Abstract要約: 内在画像分解は、重要かつ長期にわたるコンピュータビジョン問題である。
この研究はディープラーニングを利用しており、この挑戦的なコンピュータビジョン問題を高い効率で解くことができることを示している。
- 参考スコア(独自算出の注目度): 16.77439691640257
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Intrinsic image decomposition is an important and long-standing computer
vision problem. Given an input image, recovering the physical scene properties
is ill-posed. Several physically motivated priors have been used to restrict
the solution space of the optimization problem for intrinsic image
decomposition. This work takes advantage of deep learning, and shows that it
can solve this challenging computer vision problem with high efficiency. The
focus lies in the feature encoding phase to extract discriminative features for
different intrinsic layers from an input image. To achieve this goal, we
explore the distinctive characteristics of different intrinsic components in
the high dimensional feature embedding space. We define feature distribution
divergence to efficiently separate the feature vectors of different intrinsic
components. The feature distributions are also constrained to fit the real ones
through a feature distribution consistency. In addition, a data refinement
approach is provided to remove data inconsistency from the Sintel dataset,
making it more suitable for intrinsic image decomposition. Our method is also
extended to intrinsic video decomposition based on pixel-wise correspondences
between adjacent frames. Experimental results indicate that our proposed
network structure can outperform the existing state-of-the-art.
- Abstract(参考訳): 内在画像分解は、重要かつ長期にわたるコンピュータビジョン問題である。
入力画像が与えられた場合、物理シーン特性の回復が不良となる。
物理的に動機づけられたいくつかの事前条件は、内在的な画像分解の最適化問題の解空間を制限するために用いられてきた。
この研究はディープラーニングを活用し、この難しいコンピュータビジョン問題を高い効率で解決できることを示しています。
焦点は、入力画像から異なる固有の層に対する識別的特徴を抽出する特徴符号化フェーズにある。
この目的を達成するため、我々は高次元特徴埋め込み空間における異なる固有成分の特徴を探索する。
特徴分布の分散を定義し、異なる固有成分の特徴ベクトルを効率的に分離する。
機能分布は、機能分布の一貫性を通じて実際のものに合わせて制限される。
さらに、sintelデータセットからデータ不一貫性を取り除くためのデータリファインメントアプローチも提供されており、本質的な画像分解に適している。
また,隣接フレーム間の画素ワイド対応に基づく固有映像分解にも拡張した。
実験の結果,提案するネットワーク構造は,既存のネットワーク構造よりも優れていることがわかった。
関連論文リスト
- Toward Scalable Image Feature Compression: A Content-Adaptive and Diffusion-Based Approach [44.03561901593423]
本稿では,スケーラブルな画像圧縮のためのコンテンツ適応拡散モデルを提案する。
提案手法は拡散過程を通じて微細なテクスチャを符号化し,知覚品質を向上する。
画像再構成および下流マシンビジョンタスクにおいて,提案手法の有効性を示す実験を行った。
論文 参考訳(メタデータ) (2024-10-08T15:48:34Z) - Multi-Feature Aggregation in Diffusion Models for Enhanced Face Super-Resolution [6.055006354743854]
超解像を生成するために,複数の低画質画像から抽出した特徴と組み合わせた低解像度画像を利用するアルゴリズムを開発した。
他のアルゴリズムとは異なり、我々のアプローチは属性情報を明示的に提供せずに顔の特徴を復元する。
これは、高解像度画像と低解像度画像を組み合わせて、より信頼性の高い超高解像度画像を生成するコンディショナーとして初めて使用される。
論文 参考訳(メタデータ) (2024-08-27T20:08:33Z) - Restoring Images in Adverse Weather Conditions via Histogram Transformer [75.74328579778049]
悪天候による画像の復元に有効なヒストグラム変換器(Histoformer)を提案する。
これはヒストグラム自己アテンション( histogram self-attention)と呼ばれるメカニズムで、空間的特徴を強度ベースのビンに分類し、セグメント化する。
ヒストグラムの自己アテンションを高めるために,従来のコンボリューションが類似画素上で動作できるようにするダイナミックレンジ・コンボリューションを提案する。
論文 参考訳(メタデータ) (2024-07-14T11:59:22Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - DBAT: Dynamic Backward Attention Transformer for Material Segmentation
with Cross-Resolution Patches [8.812837829361923]
クロスレゾリューション特徴を集約する動的後方アテンション変換器(DBAT)を提案する。
実験の結果,DBATの精度は86.85%であり,最先端のリアルタイムモデルの中では最高の性能であることがわかった。
さらに,提案モデルが他の手法よりも優れた材料関連特徴を抽出できることを示すため,セマンティックなラベルにアライメントし,ネットワーク分割を行う。
論文 参考訳(メタデータ) (2023-05-06T03:47:20Z) - Feature Completion Transformer for Occluded Person Re-identification [25.159974510754992]
咬合者の再同定(Re-ID)は,咬合者の破壊による課題である。
特徴空間に隠された部分の意味情報を暗黙的に補完する特徴補完変換器(FCFormer)を提案する。
FCFormerは優れたパフォーマンスを実現し、隠蔽されたデータセットに対してかなりのマージンで最先端の手法を上回ります。
論文 参考訳(メタデータ) (2023-03-03T01:12:57Z) - CoCoNet: Coupled Contrastive Learning Network with Multi-level Feature
Ensemble for Multi-modality Image Fusion [72.8898811120795]
我々は、赤外線と可視画像の融合を実現するために、CoCoNetと呼ばれるコントラスト学習ネットワークを提案する。
本手法は,主観的評価と客観的評価の両面において,最先端(SOTA)性能を実現する。
論文 参考訳(メタデータ) (2022-11-20T12:02:07Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。
特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文 参考訳(メタデータ) (2020-03-02T13:28:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。