論文の概要: Intrinsic Image Decomposition using Paradigms
- arxiv url: http://arxiv.org/abs/2011.10512v1
- Date: Fri, 20 Nov 2020 17:10:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-23 06:07:21.525201
- Title: Intrinsic Image Decomposition using Paradigms
- Title(参考訳): パラダイムを用いた固有画像分解
- Authors: D. A. Forsyth and Jason J. Rock
- Abstract要約: 最新の画像手法は、レンダリングされたモデルと人間の判断を用いて、画像からアルベドへのマップを学習する。
本稿では,Wアノテーションやレンダリングデータ,あるいは地上真実データを見ることなく,本質的な画像分解を学習する手法について述べる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Intrinsic image decomposition is the classical task of mapping image to
albedo. The WHDR dataset allows methods to be evaluated by comparing
predictions to human judgements ("lighter", "same as", "darker"). The best
modern intrinsic image methods learn a map from image to albedo using rendered
models and human judgements. This is convenient for practical methods, but
cannot explain how a visual agent without geometric, surface and illumination
models and a renderer could learn to recover intrinsic images.
This paper describes a method that learns intrinsic image decomposition
without seeing WHDR annotations, rendered data, or ground truth data. The
method relies on paradigms - fake albedos and fake shading fields - together
with a novel smoothing procedure that ensures good behavior at short scales on
real images. Long scale error is controlled by averaging. Our method achieves
WHDR scores competitive with those of strong recent methods allowed to see
training WHDR annotations, rendered data, and ground truth data. Because our
method is unsupervised, we can compute estimates of the test/train variance of
WHDR scores; these are quite large, and it is unsafe to rely small differences
in reported WHDR.
- Abstract(参考訳): 内在的な画像分解は、イメージをアルベドにマッピングする古典的なタスクである。
WHDRデータセットは、予測と人間の判断("lighter", "same as", "darker")を比較することによって、メソッドを評価することができる。
画像からアルベドへの地図の学習には、レンダリングされたモデルと人間の判断が最適である。
これは実用的手法には便利であるが、幾何学的、表面的、照明的モデルのない視覚エージェントとレンダラーが本質的な画像の復元をいかに学べるかは説明できない。
本稿では,WHDRアノテーションやレンダリングデータ,あるいは地上真実データを見ることなく,固有の画像分解を学習する手法について述べる。
この方法は、偽のアルベドや偽のシェーディングフィールドといったパラダイムと、実画像の短期的な振る舞いを保証する新しい平滑化手順に依存している。
長期誤差は平均化によって制御される。
提案手法は,WHDRアノテーション,レンダリングデータ,地中真理データなどのトレーニングを行うことのできる,最近の強靭な手法と競合するWHDRスコアを実現する。
提案手法は教師なしであるため,WHDRスコアの試験・列車変動の推定値を計算することが可能であり,非常に大きく,報告されたWHDRの小さな差に頼っても安全ではない。
関連論文リスト
- Latent Intrinsics Emerge from Training to Relight [21.766083733177652]
本稿では,データ駆動型リライト方式について述べる。
我々はアルベドを例を使わずに我々の潜伏した内生生物から回収できることを示し, 回収したアルベドはSOTA法と競合することを示した。
論文 参考訳(メタデータ) (2024-05-31T17:59:12Z) - Learning to Rank Patches for Unbiased Image Redundancy Reduction [80.93989115541966]
画像は、隣接する領域の画素が空間的に相関しているため、空間的冗長性に悩まされる。
既存のアプローチでは、意味の少ない画像領域を減らし、この制限を克服しようとしている。
本稿では,Learning to Rank Patchesと呼ばれる画像冗長性低減のための自己教師型フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-31T13:12:41Z) - Detecting Generated Images by Real Images Only [64.12501227493765]
既存の画像検出手法は、生成画像中の視覚的アーティファクトを検出したり、大規模なトレーニングによって、実画像と生成画像の両方から識別的特徴を学習する。
本稿では,新たな視点から生成した画像検出問題にアプローチする。
実画像の共通性を見つけ、特徴空間内の密接な部分空間にマッピングすることで、生成した画像は生成モデルに関係なくサブ空間の外側に投影される。
論文 参考訳(メタデータ) (2023-11-02T03:09:37Z) - Annotation Cost Efficient Active Learning for Content Based Image
Retrieval [1.6624384368855525]
アノテーションコスト効率のよいアクティブラーニング(AL)手法(ANNEAL)を提案する。
提案手法は、最も情報性の高い画像対を類似または異種として注釈付けすることにより、トレーニングセットを反復的に強化することを目的としている。
ANNEALのコードはhttps://git.tu-berlin.de/rsim/ANNEALで公開されている。
論文 参考訳(メタデータ) (2023-06-20T15:33:24Z) - Region-aware Attention for Image Inpainting [33.22497212024083]
本稿では,画像の描画のための新しい領域認識アテンション (RA) モジュールを提案する。
単一サンプルにおける各画素対間の相関を直接計算することを避けることにより、ホール内の無効情報の誤認を回避することができる。
学習可能な領域辞書(LRD)を導入し、データセット全体に重要な情報を格納する。
我々の手法は、現実的な詳細で意味論的に妥当な結果を生成することができる。
論文 参考訳(メタデータ) (2022-04-03T06:26:22Z) - Perspective Flow Aggregation for Data-Limited 6D Object Pose Estimation [121.02948087956955]
宇宙や水中の深層などのいくつかのアプリケーションでは、実際の画像を取得することは、注釈のないものであっても、事実上不可能である。
本稿では,合成画像のみに限定してトレーニングできる手法を提案する。
これは、アノテートされた実画像を必要としない場合、トレーニングのためにアノテートされた実画像を必要とするメソッドと同等に動作し、20個の実画像を使用する場合、かなりパフォーマンスが向上する。
論文 参考訳(メタデータ) (2022-03-18T10:20:21Z) - SIRfyN: Single Image Relighting from your Neighbors [14.601975066158394]
一つの画像に描かれたシーンをリライトする方法を示し、(a)全体のシェーディングが変化し、(b)得られた画像はそのシーンの自然なイメージのように見える。
論文 参考訳(メタデータ) (2021-12-08T17:05:57Z) - Contrastive Feature Loss for Image Prediction [55.373404869092866]
教師付き画像合成モデルのトレーニングでは、批評家は2つの画像を比較する必要がある。
本稿では,2つの画像間の類似度を測定するための情報理論に基づくアプローチを提案する。
この定式化により,L1損失の代替として,出力画像の知覚的リアリズムが向上することを示す。
論文 参考訳(メタデータ) (2021-11-12T20:39:52Z) - Inverse Problems Leveraging Pre-trained Contrastive Representations [88.70821497369785]
破損したデータの表現を復元するための新しい逆問題群について検討する。
コントラスト目的を用いた教師付きインバージョン手法を提案する。
提案手法は,幅広いフォワード演算子においてラベル付きデータのごく一部であっても,エンド・ツー・エンドのベースラインよりも優れる。
論文 参考訳(メタデータ) (2021-10-14T15:06:30Z) - Comparing to Learn: Surpassing ImageNet Pretraining on Radiographs By
Comparing Image Representations [39.08296644280442]
そこで本研究では,手動のアノテーションを使わずに700kのラジオグラフから学習する事前学習手法を提案する。
画像表現を比較して頑健な特徴を学習するため,本手法をC2L(Comparing to Learn)と呼ぶ。
実験結果から,C2L は ImageNet の事前学習と過去の最先端アプローチを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2020-07-15T01:14:34Z) - Syn2Real Transfer Learning for Image Deraining using Gaussian Processes [92.15895515035795]
CNNに基づく画像デライニング手法は,再現誤差や視覚的品質の点で優れた性能を発揮している。
実世界の完全ラベル付き画像デライニングデータセットを取得する上での課題により、既存の手法は合成されたデータのみに基づいて訓練される。
本稿では,ガウス過程に基づく半教師付き学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-10T00:33:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。