論文の概要: Human-Aligned Evaluation of a Pixel-wise DNN Color Constancy Model
- arxiv url: http://arxiv.org/abs/2602.13887v1
- Date: Sat, 14 Feb 2026 21:03:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 14:17:28.540014
- Title: Human-Aligned Evaluation of a Pixel-wise DNN Color Constancy Model
- Title(参考訳): 画素ワイドDNN色一致モデルの人為的評価
- Authors: Hamed Heidari-Gorji, Raquel Gil Rodriguez, Karl R. Gegenfurtner,
- Abstract要約: モデルと人間のパフォーマンスを、確立された色の一貫性メカニズムと比較し、研究する。
モデル性能は, 人体実験で使用したのと同じ無彩色物体選択タスクを用いて評価した。
結果は,モデルと人間の行動との間に強い対応性を示す。
- 参考スコア(独自算出の注目度): 0.06554326244334864
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We previously investigated color constancy in photorealistic virtual reality (VR) and developed a Deep Neural Network (DNN) that predicts reflectance from rendered images. Here, we combine both approaches to compare and study a model and human performance with respect to established color constancy mechanisms: local surround, maximum flux and spatial mean. Rather than evaluating the model against physical ground truth, model performance was assessed using the same achromatic object selection task employed in the human experiments. The model, a ResNet based U-Net from our previous work, was pre-trained on rendered images to predict surface reflectance. We then applied transfer learning, fine-tuning only the network's decoder on images from the baseline VR condition. To parallel the human experiment, the model's output was used to perform the same achromatic object selection task across all conditions. Results show a strong correspondence between the model and human behavior. Both achieved high constancy under baseline conditions and showed similar, condition-dependent performance declines when the local surround or spatial mean color cues were removed.
- Abstract(参考訳): 我々は以前、フォトリアリスティックバーチャルリアリティ(VR)における色の一貫性を調査し、レンダリング画像から反射率を予測するディープニューラルネットワーク(DNN)を開発した。
そこで本研究では,局所的なサラウンド,最大フラックス,空間平均といった,確立された色の一致メカニズムについて,モデルと人的性能を比較し,比較するアプローチを併用する。
実地真実に対してモデルを評価するのではなく、人体実験で用いられるのと同じ無彩色オブジェクト選択タスクを用いてモデル性能を評価した。
前回の研究から得られたResNetベースのU-Netであるこのモデルは、表面反射率を予測するためにレンダリング画像に事前トレーニングされた。
次に、転送学習を適用し、ネットワークのデコーダのみをベースラインVR条件の画像に微調整した。
人間の実験と並行して、モデルの出力は、すべての条件で同じ無彩色オブジェクト選択タスクを実行するために使用された。
結果は,モデルと人間の行動との間に強い対応性を示す。
両者とも基線条件下では高濃度を実現し, 局所的な周囲色や空間的な平均色を除去した場合に, 類似した条件に依存した性能低下を示した。
関連論文リスト
- Differentiable Inverse Graphics for Zero-shot Scene Reconstruction and Robot Grasping [0.820984376071696]
我々は,ニューラルネットワークモデルと物理に基づく微分可能レンダリングを組み合わせて,ゼロショットシーン再構成とロボットの把握を行う,微分可能なニューログラフィックモデルを提案する。
我々のアプローチは、新しい環境におけるよりデータ効率が高く、解釈可能で、一般化可能なロボット自律性への道筋を提供する。
論文 参考訳(メタデータ) (2026-02-04T20:33:50Z) - COLIBRI Fuzzy Model: Color Linguistic-Based Representation and Interpretation [0.0]
本稿では,人間の知覚に基づくファジィカラーモデル(COLIBRI)を導入し,計算色表現と人間の視覚知覚のギャップを埋める。
提案モデルはファジィ集合と論理を用いて色分類のためのフレームワークを作成する。
我々の発見は、デザイン、人工知能、マーケティング、人間とコンピュータの相互作用といった分野において重要である。
論文 参考訳(メタデータ) (2025-07-15T17:01:45Z) - Object Pose Estimation Using Implicit Representation For Transparent Objects [0.0]
レンダリング・アンド・コンペア法は、オブジェクトを複数のビューからレンダリングし、与えられた2D画像と比較する。
物体がニューラルラジアンス場(NeRF)の形で暗黙(ニューラル)表現として表現されている場合、実際のシーンをよりリアルに表現できることが示される。
我々は、透過的なデータセット上でのレンダリング・アンド・コンペア法のNeRF実装を評価し、現在の最先端結果を上回る結果を得た。
論文 参考訳(メタデータ) (2024-10-17T11:51:12Z) - Divergences in Color Perception between Deep Neural Networks and Humans [3.0315685825606633]
我々はディープニューラルネットワーク(DNN)におけるカラー埋め込みの知覚的コヒーレンスを評価する実験を開発した。
これらのアルゴリズムがオンライン調査によって収集された人間の色類似性判定の精度を評価する。
本研究では,ウェーブレット分解に基づく色知覚モデルとDNN性能を比較した。
論文 参考訳(メタデータ) (2023-09-11T20:26:40Z) - Relightify: Relightable 3D Faces from a Single Image via Diffusion
Models [86.3927548091627]
単一画像からの3次元顔BRDF再構成を高精度に行うために,拡散モデルを用いた最初のアプローチを提案する。
既存の手法とは対照的に,観測されたテクスチャを直接入力画像から取得することで,より忠実で一貫した推定が可能となる。
論文 参考訳(メタデータ) (2023-05-10T11:57:49Z) - NeRF-DS: Neural Radiance Fields for Dynamic Specular Objects [63.04781030984006]
ダイナミック・ニューラル・ラジアンス・フィールド(英語版)(NeRF)は、動的シーンの単眼RGBビデオからフォトリアリスティック・ノベル・ビュー・イメージをレンダリングできる強力なアルゴリズムである。
観測空間の表面位置と配向に条件付される神経放射場関数を再構成することにより,その限界に対処する。
本研究では,現実的な環境下での異なる移動スペクトルオブジェクトの自己合成データセットを用いて,新しいビュー合成品質に基づくモデルの評価を行った。
論文 参考訳(メタデータ) (2023-03-25T11:03:53Z) - DeepDC: Deep Distance Correlation as a Perceptual Image Quality
Evaluator [53.57431705309919]
ImageNet Pre-trained Deep Neural Network (DNN)は、効果的な画像品質評価(IQA)モデルを構築するための顕著な転送性を示す。
我々は,事前学習DNN機能のみに基づく新しいフル参照IQA(FR-IQA)モデルを開発した。
5つの標準IQAデータセット上で,提案した品質モデルの優位性を示すため,包括的実験を行った。
論文 参考訳(メタデータ) (2022-11-09T14:57:27Z) - CONVIQT: Contrastive Video Quality Estimator [63.749184706461826]
知覚ビデオ品質評価(VQA)は、多くのストリーミングおよびビデオ共有プラットフォームにおいて不可欠な要素である。
本稿では,視覚的に関連のある映像品質表現を自己指導的に学習する問題について考察する。
本研究は, 自己教師型学習を用いて, 知覚力による説得力のある表現が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T15:22:01Z) - Bayesian deep learning of affordances from RGB images [5.939410304994348]
本稿では,RGB画像から直接,環境の可利用性を予測するための深層学習手法を提案する。
社会的に受け入れられた価格に関するこれまでの研究に基づいて,本モデルでは,対象物と全画像の局所的・グローバル的情報を組み合わせたマルチスケールCNNをベースとした。
以上の結果から,Brierスコアと予測誤差のMC-dropoutと比較すると,深層アンサンブルの限界性能が向上した。
論文 参考訳(メタデータ) (2021-09-27T07:39:47Z) - Appearance Consensus Driven Self-Supervised Human Mesh Recovery [67.20942777949793]
単眼画像から人間のポーズや形状を推定する自己教師付きメッシュ回復フレームワークを提案する。
標準モデルに基づく3次元ポーズ推定ベンチマークの最先端結果を得る。
その結果、色付きメッシュ予測により、ポーズや形状推定以外にも、さまざまな外観関連タスクにフレームワークの使用が開放される。
論文 参考訳(メタデータ) (2020-08-04T05:40:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。