論文の概要: SIGNet: Intrinsic Image Decomposition by a Semantic and Invariant
Gradient Driven Network for Indoor Scenes
- arxiv url: http://arxiv.org/abs/2208.14369v1
- Date: Tue, 30 Aug 2022 16:27:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-31 13:14:42.993481
- Title: SIGNet: Intrinsic Image Decomposition by a Semantic and Invariant
Gradient Driven Network for Indoor Scenes
- Title(参考訳): signet:室内シーンのための意味的・不変勾配駆動ネットワークによる内在的画像分解
- Authors: Partha Das, Sezer Karaoglu, Arjan Gijsenij, Theo Gevers
- Abstract要約: 内在画像分解は制約の少ない問題である。
従来のアプローチでは、問題を制約するために手作りの先行手法を使用する。
ディープラーニングベースのアプローチは、データを通じてこれらの制約を暗黙的に学習する。
- 参考スコア(独自算出の注目度): 16.08950544520786
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Intrinsic image decomposition (IID) is an under-constrained problem.
Therefore, traditional approaches use hand crafted priors to constrain the
problem. However, these constraints are limited when coping with complex
scenes. Deep learning-based approaches learn these constraints implicitly
through the data, but they often suffer from dataset biases (due to not being
able to include all possible imaging conditions).
In this paper, a combination of the two is proposed. Component specific
priors like semantics and invariant features are exploited to obtain
semantically and physically plausible reflectance transitions. These
transitions are used to steer a progressive CNN with implicit homogeneity
constraints to decompose reflectance and shading maps.
An ablation study is conducted showing that the use of the proposed priors
and progressive CNN increase the IID performance. State of the art performance
on both our proposed dataset and the standard real-world IIW dataset shows the
effectiveness of the proposed method. Code is made available at
https://github.com/Morpheus3000/SIGNet
- Abstract(参考訳): 内在画像分解(IID)は制約の少ない問題である。
そのため、従来の手法では問題を制約するために手作りの先行手法を用いる。
しかし、これらの制約は複雑なシーンを扱う場合に制限される。
ディープラーニングベースのアプローチは、データを通じてこれらの制約を暗黙的に学習するが、しばしばデータセットバイアス(すべての可能な撮像条件を含まないため)に悩まされる。
本稿では,これら2つの組み合わせを提案する。
セマンティクスや不変特徴のようなコンポーネント固有の事前は、セマンティクス的および物理的に妥当なリフレクタンス遷移を得るために利用される。
これらの遷移は、プログレッシブCNNを暗黙の均一性制約で操り、反射率とシェーディングマップを分解するために用いられる。
提案法とプログレッシブcnnの併用により,iid性能が向上することを示すアブレーション研究を行った。
提案するデータセットと標準実世界のiiwデータセットの両方におけるアートパフォーマンスの現状は,提案手法の有効性を示している。
コードはhttps://github.com/Morpheus3000/SIGNetで公開されている。
関連論文リスト
- Refign: Align and Refine for Adaptation of Semantic Segmentation to
Adverse Conditions [78.71745819446176]
Refignは、ドメイン間の通信を利用する自己学習ベースのUDAメソッドへの汎用的な拡張である。
Refign は,(1) 不確実性を認識した高密度マッチングネットワークを用いて,正常条件画像と対応する悪条件画像とを整列させ,(2) 適応ラベル補正機構を用いて正常予測で悪条件予測を精査する。
このアプローチでは、追加のトレーニングパラメータや、トレーニングのみの計算オーバーヘッドの最小化は導入されず、任意の自己学習ベースのUDAメソッドを改善するためにドロップイン拡張として使用することができる。
論文 参考訳(メタデータ) (2022-07-14T11:30:38Z) - PIE-Net: Photometric Invariant Edge Guided Network for Intrinsic Image
Decomposition [17.008724191799313]
固有の画像分解は、画像から画像形成成分(反射および陰影)を回収する過程である。
本稿では,固有画像分解のためのエッジ駆動ハイブリッドCNN手法を提案する。
論文 参考訳(メタデータ) (2022-03-30T20:46:15Z) - Learning Discriminative Shrinkage Deep Networks for Image Deconvolution [122.79108159874426]
本稿では,これらの用語を暗黙的にモデル化する識別的縮小関数を学習することで,効果的に非盲検デコンボリューション手法を提案する。
実験結果から,提案手法は最先端の手法に対して,効率と精度の点で好適に動作することがわかった。
論文 参考訳(メタデータ) (2021-11-27T12:12:57Z) - Contrastive Learning of Visual-Semantic Embeddings [4.7464518249313805]
本稿では,正規化されたクロスエントロピーに基づく2つの損失関数を提案する。
本研究は,画像・テキスト・テキスト・画像検索タスクにおける既存のビジュアル・セマンティックな埋め込み手法と比較する。
論文 参考訳(メタデータ) (2021-10-17T17:28:04Z) - USIS: Unsupervised Semantic Image Synthesis [9.613134538472801]
セマンティック画像合成(USIS)のための新しい教師なしパラダイムを提案する。
USISは、自己教師付きセグメンテーションロスを使用して、視覚的に分離可能なセグメンテーションクラスで画像を出力することを学ぶ。
実画像の色とテクスチャの分布を高周波数情報を失うことなく一致させるため,ウェーブレットを用いた識別手法を提案する。
論文 参考訳(メタデータ) (2021-09-29T20:48:41Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - A Flexible Framework for Designing Trainable Priors with Adaptive
Smoothing and Game Encoding [57.1077544780653]
我々は、前方通過を非滑らかな凸最適化問題として解釈できるニューラルネットワーク層の設計とトレーニングのための一般的なフレームワークを紹介する。
グラフのノードに代表されるローカルエージェントによって解決され、正規化関数を介して相互作用する凸ゲームに焦点を当てる。
このアプローチは、訓練可能なエンドツーエンドのディープモデル内で、古典的な画像の事前使用を可能にするため、画像の問題を解決するために魅力的である。
論文 参考訳(メタデータ) (2020-06-26T08:34:54Z) - Transferring and Regularizing Prediction for Semantic Segmentation [115.88957139226966]
本稿では,セマンティックセグメンテーションの本質的特性を利用して,モデル伝達におけるそのような問題を緩和する。
本稿では,モデル転送を教師なし方式で正規化するための制約として固有特性を課す予測伝達の正規化器(RPT)を提案する。
GTA5とSynTHIA(synthetic data)で訓練されたモデルの都市景観データセット(アーバンストリートシーン)への転送に関するRTPの提案を検証するため、大規模な実験を行った。
論文 参考訳(メタデータ) (2020-06-11T16:19:41Z) - Deep Semantic Matching with Foreground Detection and Cycle-Consistency [103.22976097225457]
深層ネットワークに基づく弱い教師付きセマンティックマッチングに対処する。
本研究では,背景乱れの影響を抑えるために,前景領域を明示的に推定する。
複数の画像にまたがって予測変換を強制し、幾何的に可視かつ一貫したサイクル一貫性の損失を発生させる。
論文 参考訳(メタデータ) (2020-03-31T22:38:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。