Fugu-MT 論文翻訳(概要): One-shot recognition of any material anywhere using contrastive learning with physics-based rendering

論文の概要: One-shot recognition of any material anywhere using contrastive learning with physics-based rendering

arxiv url: http://arxiv.org/abs/2212.00648v1
Date: Thu, 1 Dec 2022 16:49:53 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-02 16:21:29.091043
Title: One-shot recognition of any material anywhere using contrastive learning with physics-based rendering
Title（参考訳）: コントラスト学習と物理レンダリングを用いた任意の物体のワンショット認識
Authors: Manuel S. Drehwald (3), Sagi Eppel (1 and 2 and 4), Jolina Li (2 and 4), Han Hao (2), Alan Aspuru-Guzik (1 and 2) ((1) Vector institute, (2) University of Toronto, (3) Karlsruhe Institute of Technology, (4) Innoviz)
Abstract要約: 材料とテクスチャ間の類似点と遷移点をコンピュータビジョンで認識するための合成データセットMateSim、ベンチマーク、および方法を提案する。食材を視覚的に認識することは、調理中に食品を調べること、農業、化学、工業製品を調べることなど、あらゆることに不可欠である。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present MatSim: a synthetic dataset, a benchmark, and a method for computer vision based recognition of similarities and transitions between materials and textures, focusing on identifying any material under any conditions using one or a few examples (one-shot learning). The visual recognition of materials is essential to everything from examining food while cooking to inspecting agriculture, chemistry, and industrial products. In this work, we utilize giant repositories used by computer graphics artists to generate a new CGI dataset for material similarity. We use physics-based rendering (PBR) repositories for visual material simulation, assign these materials random 3D objects, and render images with a vast range of backgrounds and illumination conditions (HDRI). We add a gradual transition between materials to support applications with a smooth transition between states (like gradually cooked food). We also render materials inside transparent containers to support beverage and chemistry lab use cases. We then train a contrastive learning network to generate a descriptor that identifies unfamiliar materials using a single image. We also present a new benchmark for a few-shot material recognition that contains a wide range of real-world examples, including the state of a chemical reaction, rotten/fresh fruits, states of food, different types of construction materials, types of ground, and many other use cases involving material states, transitions and subclasses. We show that a network trained on the MatSim synthetic dataset outperforms state-of-the-art models like Clip on the benchmark, despite being tested on material classes that were not seen during training. The dataset, benchmark, code and trained models are available online.
Abstract（参考訳）: matsim: 材料とテクスチャの類似性と遷移をコンピュータビジョンベースで認識する合成データセット、ベンチマーク、および方法を提案する。1つまたは数個の例(ワンショット学習)を用いて、任意の条件下で任意の素材を識別することにフォーカスする。材料の視覚的な認識は、調理中の食品の検査から農業、化学、工業製品の検査まで、あらゆるものにとって不可欠である。本研究では,コンピュータグラフィックスアーティストが使用する巨大リポジトリを用いて,材料類似性のための新しいCGIデータセットを作成する。我々は物理ベースレンダリング(PBR)レポジトリを用いて視覚材料シミュレーションを行い、これらの材料をランダムな3Dオブジェクトに割り当て、背景と照明条件の広い画像をレンダリングする。材料間の段階的な遷移を加えて、状態間のスムーズな遷移を支援する(徐々に調理される食品のように)。また、透明容器内に材料をレンダリングして飲料や化学実験室のユースケースをサポートします。次に, コントラスト学習ネットワークを訓練し, 1つの画像を用いて不慣れな資料を識別する記述子を生成する。また, 化学反応の状態, 腐った果実, 食品の状態, 建設材料の種類, 地盤の種類, および物質状態, 遷移, サブクラスを含む多くのユースケースを含む, 幅広い実世界の実例を含む, 数発の物質認識のための新しいベンチマークを提示する。 MatSim合成データセットでトレーニングされたネットワークは、トレーニング中に見られなかった物質クラスでテストされているにもかかわらず、ベンチマークでClipのような最先端のモデルを上回っていることを示す。データセット、ベンチマーク、コード、トレーニングされたモデルはオンラインで利用可能だ。

関連論文リスト

MARBLE: Material Recomposition and Blending in CLIP-Space [34.22278569839714]
材料をCLIP空間に埋没させることにより, 微細な材料特性をブレンディングし, 再合成する手法を提案する。資料帰属に責任を負うUNetのブロックを見つけることにより,既存の素材編集を改善する。
論文参考訳（メタデータ） (2025-06-05T17:55:16Z)
MatPredict: a dataset and benchmark for learning material properties of diverse indoor objects [2.201843972706244]
MatPredictは、Replicaデータセットの高品質な合成オブジェクトとMat Synthのマテリアルプロパティクラスを組み合わせたデータセットである。我々は、特定の前景オブジェクトの3Dメッシュを選択し、異なる材料特性でそれらをレンダリングする。異なる物質との光相互作用を正確にシミュレートすることで、我々は現実性を高めることができる。
論文参考訳（メタデータ） (2025-05-19T14:54:04Z)
MaRI: Material Retrieval Integration across Domains [13.686066106732696]
既存の手法は、形状不変および光に照らされた材料表現をキャプチャするデータセットに依存している。合成材料と実世界の材料間の特徴空間ギャップを橋渡しするフレームワークであるMaRIを紹介する。
論文参考訳（メタデータ） (2025-03-11T07:23:11Z)
MatSwap: Light-aware material transfers in images [18.37330769828654]
MatSwap(マットスワップ)は、画像内の指定された表面に物質を移す方法である。我々は、露光紫外線マッピングを必要とせずに、入力材料とシーン内の外観の関係を学習する。本手法では,シーンの同一性を保ちながら,所望の素材を写真中のターゲット位置にシームレスに統合する。
論文参考訳（メタデータ） (2025-02-11T18:59:59Z)
Materialist: Physically Based Editing Using Single-Image Inverse Rendering [50.39048790589746]
本稿では、学習に基づくアプローチとプログレッシブな微分可能レンダリングを組み合わせた手法を提案する。提案手法は,より現実的な光物質相互作用,正確な影,大域的な照明を実現する。また,全シーン形状を必要とせず,効果的に機能する材料透過性編集手法を提案する。
論文参考訳（メタデータ） (2025-01-07T11:52:01Z)
MaPa: Text-driven Photorealistic Material Painting for 3D Shapes [80.66880375862628]
本稿では,テキスト記述から3次元メッシュの材料を作成することを目的とする。テクスチャマップを合成する既存の方法とは異なり、我々はセグメントワイドな手続き的な材料グラフを生成することを提案する。我々のフレームワークは高品質なレンダリングをサポートし、編集にかなりの柔軟性を提供します。
論文参考訳（メタデータ） (2024-04-26T17:54:38Z)
Make-it-Real: Unleashing Large Multimodal Model for Painting 3D Objects with Realistic Materials [108.59709545364395]
GPT-4Vは、材料を効果的に認識し、記述することができ、詳細な材料ライブラリを構築することができる。そして、整合した材料を、新たなSVBRDF材料生成の基準として慎重に適用する。 Make-it-Realは、3Dコンテンツ作成ワークフローに合理化された統合を提供する。
論文参考訳（メタデータ） (2024-04-25T17:59:58Z)
MaterialSeg3D: Segmenting Dense Materials from 2D Priors for 3D Assets [63.284244910964475]
本稿では,2次元のセマンティクスから基礎となる物質を推定する3次元アセット素材生成フレームワークを提案する。このような先行モデルに基づいて,材料を三次元空間で解析する機構を考案する。
論文参考訳（メタデータ） (2024-04-22T07:00:17Z)
Intrinsic Image Diffusion for Indoor Single-view Material Estimation [55.276815106443976]
室内シーンの外観分解のための生成モデルIntrinsic Image Diffusionを提案する。 1つの入力ビューから、アルベド、粗さ、および金属地図として表される複数の材料説明をサンプリングする。提案手法は,PSNRで1.5dB$,アルベド予測で45%のFIDスコアを達成し,よりシャープで,より一貫性があり,より詳細な資料を生成する。
論文参考訳（メタデータ） (2023-12-19T15:56:19Z)
Alchemist: Parametric Control of Material Properties with Diffusion Models [51.63031820280475]
本手法は,フォトリアリズムで知られているテキスト・イメージ・モデルの生成先行に乗じる。我々は,NeRFの材料化へのモデルの適用の可能性を示す。
論文参考訳（メタデータ） (2023-12-05T18:58:26Z)
Material Palette: Extraction of Materials from a Single Image [19.410479434979493]
実世界の1つの画像から物理ベースレンダリング(PBR)素材を抽出する手法を提案する。画像の領域を拡散モデルを用いて物質概念にマッピングし、シーン内の各材料に類似したテクスチャ画像のサンプリングを可能にする。第二に、生成したテクスチャを空間変数BRDFに分解する別のネットワークの恩恵を受ける。
論文参考訳（メタデータ） (2023-11-28T18:59:58Z)
MatFuse: Controllable Material Generation with Diffusion Models [10.993516790237503]
MatFuseは3D素材の作成と編集に拡散モデルの生成力を利用する統一的なアプローチである。本手法は,カラーパレット,スケッチ,テキスト,画像など,複数のコンディショニング源を統合し,創造性を向上する。複数の条件設定下でのMatFuseの有効性を実証し,材料編集の可能性を探る。
論文参考訳（メタデータ） (2023-08-22T12:54:48Z)
PhotoMat: A Material Generator Learned from Single Flash Photos [37.42765147463852]
既存の材料生成モデルは、合成データにのみ訓練されている。私たちは、携帯電話カメラとフラッシュで撮影したサンプルの実際の写真に特化して訓練された、最初の素材ジェネレータPhotoMatを提案する。生成した材料は、従来の合成データで訓練された材料ジェネレータよりも視覚的品質がよいことを示す。
論文参考訳（メタデータ） (2023-05-20T22:27:41Z)
Neural Photometry-guided Visual Attribute Transfer [4.630419389180576]
本稿では,同じ又は類似の素材のより大きなサンプルに対して,視覚的特性を伝播する深層学習に基づく手法を提案する。トレーニングには、複数のイルミネーションと専用データ拡張ポリシーの下で撮影された材料の画像を活用する。我々のモデルは、教師付き画像から画像への変換フレームワークに依存しており、転送されたドメインに依存しない。
論文参考訳（メタデータ） (2021-12-05T09:22:28Z)
The joint role of geometry and illumination on material recognition [16.01513204879645]
幾何学,照明,空間周波数の相互作用が物質認識タスクにおける人間のパフォーマンスに与える影響について検討した。材料認識に関する深いニューラルネットワークをトレーニングし、材料を正確に分類します。
論文参考訳（メタデータ） (2021-01-07T11:29:52Z)
Fed-Sim: Federated Simulation for Medical Imaging [131.56325440976207]
本稿では、2つの学習可能なニューラルモジュールからなる物理駆動型生成手法を提案する。データ合成フレームワークは、複数のデータセットの下流セグメンテーション性能を改善する。
論文参考訳（メタデータ） (2020-09-01T19:17:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。