論文の概要: Neural Photometry-guided Visual Attribute Transfer
- arxiv url: http://arxiv.org/abs/2112.02520v1
- Date: Sun, 5 Dec 2021 09:22:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-07 14:28:19.948302
- Title: Neural Photometry-guided Visual Attribute Transfer
- Title(参考訳): ニューラルフォトメトリによる視覚属性伝達
- Authors: Carlos Rodriguez-Pardo and Elena Garces
- Abstract要約: 本稿では,同じ又は類似の素材のより大きなサンプルに対して,視覚的特性を伝播する深層学習に基づく手法を提案する。
トレーニングには、複数のイルミネーションと専用データ拡張ポリシーの下で撮影された材料の画像を活用する。
我々のモデルは、教師付き画像から画像への変換フレームワークに依存しており、転送されたドメインに依存しない。
- 参考スコア(独自算出の注目度): 4.630419389180576
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present a deep learning-based method for propagating spatially-varying
visual material attributes (e.g. texture maps or image stylizations) to larger
samples of the same or similar materials. For training, we leverage images of
the material taken under multiple illuminations and a dedicated data
augmentation policy, making the transfer robust to novel illumination
conditions and affine deformations. Our model relies on a supervised
image-to-image translation framework and is agnostic to the transferred domain;
we showcase a semantic segmentation, a normal map, and a stylization. Following
an image analogies approach, the method only requires the training data to
contain the same visual structures as the input guidance. Our approach works at
interactive rates, making it suitable for material edit applications. We
thoroughly evaluate our learning methodology in a controlled setup providing
quantitative measures of performance. Last, we demonstrate that training the
model on a single material is enough to generalize to materials of the same
type without the need for massive datasets.
- Abstract(参考訳): 本稿では,空間的に変動する視覚材料属性(テクスチャマップや画像スタイライゼーションなど)を,同一または類似材料のより大きなサンプルに伝播する深層学習に基づく手法を提案する。
トレーニングでは,複数の照明と専用データ拡張ポリシーで撮影された材料の画像を活用して,新しい照明条件とアフィン変形に頑健な転送を行う。
我々のモデルは、教師付き画像から画像への翻訳フレームワークに依存し、転送されたドメインに依存しない、セマンティックセグメンテーション、正規マップ、スタイリングを提示する。
画像アナロジーアプローチに従って、この方法は、入力ガイダンスと同じ視覚構造を含む訓練データのみを必要とする。
我々の手法はインタラクティブなレートで動作し、マテリアル編集アプリケーションに適している。
我々は,性能の定量的指標を提供する制御環境において,学習方法論を徹底的に評価する。
最後に、単一材料上でモデルをトレーニングすることは、大量のデータセットを必要とせずに、同じタイプの材料に一般化するのに十分であることを示す。
関連論文リスト
- Intrinsic Image Diffusion for Indoor Single-view Material Estimation [55.276815106443976]
室内シーンの外観分解のための生成モデルIntrinsic Image Diffusionを提案する。
1つの入力ビューから、アルベド、粗さ、および金属地図として表される複数の材料説明をサンプリングする。
提案手法は,PSNRで1.5dB$,アルベド予測で45%のFIDスコアを達成し,よりシャープで,より一貫性があり,より詳細な資料を生成する。
論文 参考訳(メタデータ) (2023-12-19T15:56:19Z) - Dense Text-to-Image Generation with Attention Modulation [49.287458275920514]
既存のテキストと画像の拡散モデルは、高密度キャプションを与えられた現実的なイメージを合成するのに苦労する。
そこで我々はDenseDiffusionを提案する。DenseDiffusionは、訓練済みのテキスト・ツー・イメージ・モデルを用いて、そのような高密度キャプションを扱う訓練自由な方法である。
レイアウト条件に特化して訓練したモデルを用いて、同様の品質の視覚的結果を得る。
論文 参考訳(メタデータ) (2023-08-24T17:59:01Z) - Materialistic: Selecting Similar Materials in Images [30.85562156542794]
アーティスト・ちょうせんエリアと同じ素材を示す写真の領域を選択する方法を提案する。
提案手法は、シェーディング、スペックハイライト、キャストシャドーに対して堅牢であり、実際の画像の選択を可能にする。
本モデルでは,画像編集,動画内選択,類似した素材を用いたオブジェクト画像の検索など,一連の応用について実演する。
論文 参考訳(メタデータ) (2023-05-22T17:50:48Z) - Few-shot Semantic Image Synthesis with Class Affinity Transfer [23.471210664024067]
そこで本研究では,大規模なデータセット上でトレーニングされたモデルを利用して,小規模なターゲットデータセット上での学習能力を向上させるトランスファー手法を提案する。
クラス親和性行列は、ターゲットラベルマップと互換性を持たせるために、ソースモデルの第一層として導入される。
セマンティック・セマンティック・シンセサイザー(セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・アーキテクチャー)にアプローチを適用する。
論文 参考訳(メタデータ) (2023-04-05T09:24:45Z) - Neural Congealing: Aligning Images to a Joint Semantic Atlas [14.348512536556413]
画像の集合を横断的に意味的に共通するコンテンツを調整するための,ゼロショットの自己教師型フレームワークを提案する。
提案手法は,DINO-ViTの事前学習能力を利用して学習する。
提案手法は,大規模データセットに対する広範囲なトレーニングを必要とする最先端の手法と比較して,好適に動作することを示す。
論文 参考訳(メタデータ) (2023-02-08T09:26:22Z) - Photo-to-Shape Material Transfer for Diverse Structures [15.816608726698986]
本稿では,3次元形状に光写実的可照性材料を自動的に割り当てる手法を提案する。
本手法は,画像翻訳ニューラルネットワークと物質割当ニューラルネットワークを組み合わせる。
本手法により, 材料を形状に割り当てることができ, 外観が入力例によく似ていることを示す。
論文 参考訳(メタデータ) (2022-05-09T03:37:01Z) - Retrieval-based Spatially Adaptive Normalization for Semantic Image
Synthesis [68.1281982092765]
本稿では,Retrieval-based spatially AdaptIve normalization (RESAIL) と呼ばれる新しい正規化モジュールを提案する。
RESAILは、正規化アーキテクチャに対するピクセルレベルのきめ細かいガイダンスを提供する。
いくつかの挑戦的なデータセットの実験により、RESAILは定量的メトリクス、視覚的品質、主観的評価の観点から、最先端技術に対して好意的に機能することが示された。
論文 参考訳(メタデータ) (2022-04-06T14:21:39Z) - Multimodal Contrastive Training for Visual Representation Learning [45.94662252627284]
マルチモーダルデータを取り入れた視覚表現の学習手法を開発した。
本手法は,各モダリティおよびセマンティクス情報内の本質的なデータ特性をクロスモーダル相関から同時に利用する。
統合フレームワークにマルチモーダルトレーニングを組み込むことで,より強力で汎用的な視覚的特徴を学習することができる。
論文 参考訳(メタデータ) (2021-04-26T19:23:36Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z) - Learning to Compose Hypercolumns for Visual Correspondence [57.93635236871264]
本稿では,画像に条件付けされた関連レイヤを活用することで,動的に効率的な特徴を構成する視覚対応手法を提案する。
提案手法はダイナミックハイパーピクセルフロー(Dynamic Hyperpixel Flow)と呼ばれ,深層畳み込みニューラルネットワークから少数の関連層を選択することにより,高速にハイパーカラム機能を構成することを学習する。
論文 参考訳(メタデータ) (2020-07-21T04:03:22Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。