論文の概要: The joint role of geometry and illumination on material recognition
- arxiv url: http://arxiv.org/abs/2101.02496v2
- Date: Thu, 4 Feb 2021 12:35:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-10 13:46:23.656595
- Title: The joint role of geometry and illumination on material recognition
- Title(参考訳): 材料認識における幾何学と照明の役割
- Authors: Manuel Lagunas, Ana Serrano, Diego Gutierrez, Belen Masia
- Abstract要約: 幾何学,照明,空間周波数の相互作用が物質認識タスクにおける人間のパフォーマンスに与える影響について検討した。
材料認識に関する深いニューラルネットワークをトレーニングし、材料を正確に分類します。
- 参考スコア(独自算出の注目度): 16.01513204879645
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Observing and recognizing materials is a fundamental part of our daily life.
Under typical viewing conditions, we are capable of effortlessly identifying
the objects that surround us and recognizing the materials they are made of.
Nevertheless, understanding the underlying perceptual processes that take place
to accurately discern the visual properties of an object is a long-standing
problem. In this work, we perform a comprehensive and systematic analysis of
how the interplay of geometry, illumination, and their spatial frequencies
affects human performance on material recognition tasks. We carry out
large-scale behavioral experiments where participants are asked to recognize
different reference materials among a pool of candidate samples. In the
different experiments, we carefully sample the information in the frequency
domain of the stimuli. From our analysis, we find significant first-order
interactions between the geometry and the illumination, of both the reference
and the candidates. In addition, we observe that simple image statistics and
higher-order image histograms do not correlate with human performance.
Therefore, we perform a high-level comparison of highly non-linear statistics
by training a deep neural network on material recognition tasks. Our results
show that such models can accurately classify materials, which suggests that
they are capable of defining a meaningful representation of material appearance
from labeled proximal image data. Last, we find preliminary evidence that these
highly non-linear models and humans may use similar high-level factors for
material recognition tasks.
- Abstract(参考訳): 素材の観察と認識は私たちの日常生活の基本的な部分です。
一般的な観察条件下では、私たちを取り囲む物体を無作為に識別し、それらの材料を認識することができる。
それでも、物体の視覚特性を正確に識別するために起こる知覚過程を理解することは長年の課題である。
本研究では,幾何,照明,空間周波数の相互作用が物質認識課題のヒューマンパフォーマンスに与える影響を包括的かつ体系的に分析する。
対象サンプルのプール内において,参加者に異なる基準資料の認識を依頼する大規模行動実験を行った。
異なる実験では、刺激の周波数領域の情報を慎重にサンプリングする。
解析結果から,参照と候補の両方について,幾何学と照明との間に有意な一階間相互作用がみられた。
また,単純な画像統計と高次画像ヒストグラムは,人間のパフォーマンスと相関しないことを示した。
そこで本研究では,深層ニューラルネットワークを材料認識タスクで訓練することにより,高非線形統計の高レベル比較を行う。
以上の結果から,これらのモデルでは材料を正確に分類することができ,ラベル付き近位画像データから材料外観の有意義な表現を定義できることが示唆された。
最後に、これらの高非線形モデルと人間は、物質認識タスクに同様の高レベル要素を使用する可能性があるという予備的な証拠を見出した。
関連論文リスト
- Material Fingerprinting: Identifying and Predicting Perceptual Attributes of Material Appearance [2.2284248642626103]
本稿では,動的視覚刺激から得られる知覚的特徴を符号化することで,物質識別への新たなアプローチを提案する。
心理物理学的な実験を行い,347本の映像から得られた16個の重要な知覚特性を選定し,検証した。
次に、各材料について20人以上の被験者から属性評価を収集し、各材料固有の知覚特性を符号化する「材料指紋」を作成しました。
論文 参考訳(メタデータ) (2024-10-17T14:47:53Z) - AI-based Density Recognition [7.106165417217771]
本稿では、関連画像を用いて物体に物理的特性を割り当てるAIベースの概念を提案する。
ニューラルネットワークを用いて2次元画像から特定のパターンを抽出し、ボリューム、材料、密度などのさらなる情報を抽出する。
論文 参考訳(メタデータ) (2024-07-24T07:45:37Z) - Semantic-Based Active Perception for Humanoid Visual Tasks with Foveal Sensors [49.99728312519117]
この研究の目的は、最近の意味に基づくアクティブな知覚モデルが、人間が定期的に行う視覚的なタスクをいかに正確に達成できるかを確立することである。
このモデルは、現在のオブジェクト検出器が多数のオブジェクトクラスをローカライズし、分類し、複数の固定にまたがるシーンのセマンティック記述を更新する能力を利用する。
シーン探索の課題では、セマンティック・ベースの手法は従来のサリエンシ・ベース・モデルよりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-04-16T18:15:57Z) - Intrinsic Image Diffusion for Indoor Single-view Material Estimation [55.276815106443976]
室内シーンの外観分解のための生成モデルIntrinsic Image Diffusionを提案する。
1つの入力ビューから、アルベド、粗さ、および金属地図として表される複数の材料説明をサンプリングする。
提案手法は,PSNRで1.5dB$,アルベド予測で45%のFIDスコアを達成し,よりシャープで,より一貫性があり,より詳細な資料を生成する。
論文 参考訳(メタデータ) (2023-12-19T15:56:19Z) - The Influences of Color and Shape Features in Visual Contrastive
Learning [0.0]
本稿では,個々の画像特徴(色や形状など)がモデル性能に与える影響について検討する。
実験結果から、教師付き表現と比較して、コントラスト表現は類似した色を持つオブジェクトとクラスタリングする傾向にあることが示された。
論文 参考訳(メタデータ) (2023-01-29T15:10:14Z) - One-shot recognition of any material anywhere using contrastive learning
with physics-based rendering [0.0]
材料とテクスチャ間の類似点と遷移点をコンピュータビジョンで認識するための合成データセットMateSim、ベンチマーク、および方法を提案する。
食材を視覚的に認識することは、調理中に食品を調べること、農業、化学、工業製品を調べることなど、あらゆることに不可欠である。
論文 参考訳(メタデータ) (2022-12-01T16:49:53Z) - A Symbolic Representation of Human Posture for Interpretable Learning
and Reasoning [2.678461526933908]
我々は,人間の姿勢を,より親しみやすい言葉で表現する質的空間推論手法を導入する。
本稿では,2つのレベルでのシンボル表現の導出と,その予備的利用について述べる。
論文 参考訳(メタデータ) (2022-10-17T12:22:13Z) - ComPhy: Compositional Physical Reasoning of Objects and Events from
Videos [113.2646904729092]
目に見える性質と隠れた性質の間の構成性は、物理的な世界から推論するAIモデルに固有の課題をもたらす。
ビデオ推論に関する既存の研究は、主に物体の外観、動き、接触相互作用などの視覚的に観察可能な要素に焦点を当てている。
本稿では,視覚知覚,物理特性学習,動的予測,記号実行を組み合わせた,構成物理学学習(CPL)と呼ばれるオラクルニューラルシンボリックフレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-02T17:59:13Z) - Exploring Visual Engagement Signals for Representation Learning [56.962033268934015]
VisEは、クラスタ化されたエンゲージメント信号から派生した擬似ラベルにソーシャルイメージをマップする弱い教師付き学習アプローチである。
この方法でトレーニングされたモデルが、感情認識や政治的バイアス検出といった主観的なコンピュータビジョンタスクにどのように役立つかを研究する。
論文 参考訳(メタデータ) (2021-04-15T20:50:40Z) - Affect Analysis in-the-wild: Valence-Arousal, Expressions, Action Units
and a Unified Framework [83.21732533130846]
Aff-Wild と Aff-Wild2 の2つである。
これは、これらのデータベースで訓練された深層ニューラルネットワークの2つのクラスの設計を示す。
インパクト認識を共同で学び、効果的に一般化し、実行することができる新しいマルチタスクおよび全体主義のフレームワークが提示されます。
論文 参考訳(メタデータ) (2021-03-29T17:36:20Z) - What Can You Learn from Your Muscles? Learning Visual Representation
from Human Interactions [50.435861435121915]
視覚のみの表現よりも優れた表現を学べるかどうかを調べるために,人間のインタラクションとアテンション・キューを用いている。
実験の結果,我々の「音楽監督型」表現は,視覚のみの最先端手法であるMoCoよりも優れていた。
論文 参考訳(メタデータ) (2020-10-16T17:46:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。