論文の概要: RGB-to-Polarization Estimation: A New Task and Benchmark Study
- arxiv url: http://arxiv.org/abs/2505.13050v1
- Date: Mon, 19 May 2025 12:38:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.591272
- Title: RGB-to-Polarization Estimation: A New Task and Benchmark Study
- Title(参考訳): RGB-to-Polarizationの推定:新しいタスクとベンチマーク
- Authors: Beibei Lin, Zifeng Yuan, Tingting Chen,
- Abstract要約: RGB画像から直接偏光情報を推定することを目的としたRGB偏光画像推定という新しいタスクを導入する。
我々は、既存の偏極データセットを活用し、最先端のディープラーニングモデルの多様なセットを評価することで、このタスクのための最初の包括的なベンチマークを確立する。
このベンチマークは、標準RGB入力からの偏極推定のための将来の手法の設計と評価を容易にするための基礎的なリソースとして機能することを目的としている。
- 参考スコア(独自算出の注目度): 9.988121094189227
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Polarization images provide rich physical information that is fundamentally absent from standard RGB images, benefiting a wide range of computer vision applications such as reflection separation and material classification. However, the acquisition of polarization images typically requires additional optical components, which increases both the cost and the complexity of the applications. To bridge this gap, we introduce a new task: RGB-to-polarization image estimation, which aims to infer polarization information directly from RGB images. In this work, we establish the first comprehensive benchmark for this task by leveraging existing polarization datasets and evaluating a diverse set of state-of-the-art deep learning models, including both restoration-oriented and generative architectures. Through extensive quantitative and qualitative analysis, our benchmark not only establishes the current performance ceiling of RGB-to-polarization estimation, but also systematically reveals the respective strengths and limitations of different model families -- such as direct reconstruction versus generative synthesis, and task-specific training versus large-scale pre-training. In addition, we provide some potential directions for future research on polarization estimation. This benchmark is intended to serve as a foundational resource to facilitate the design and evaluation of future methods for polarization estimation from standard RGB inputs.
- Abstract(参考訳): 偏光画像は、標準のRGB画像に基本的に欠落しているリッチな物理情報を提供し、反射分離や物質分類といった幅広いコンピュータビジョンの応用に有用である。
しかし、偏光画像の取得は通常、追加の光学部品を必要とするため、アプリケーションのコストと複雑さが増大する。
このギャップを埋めるために、RGB画像から直接偏光情報を推定することを目的としたRGB偏光画像推定という新しいタスクを導入する。
本研究では、既存の偏極データセットを活用し、復元指向アーキテクチャと生成アーキテクチャの両方を含む最先端のディープラーニングモデルの多様なセットを評価することで、このタスクのための最初の包括的なベンチマークを確立する。
定量的および定性的な分析を通じて、我々のベンチマークは、RGB-分極推定の現在のパフォーマンス天井を確立するだけでなく、直接再構成対生成合成、タスク固有のトレーニング対大規模事前学習といった、異なるモデルファミリーのそれぞれの長所と短所を体系的に明らかにする。
さらに,偏光推定の今後の研究の方向性についても検討する。
このベンチマークは、標準RGB入力からの偏極推定のための将来の手法の設計と評価を容易にするための基礎的なリソースとして機能することを目的としている。
関連論文リスト
- Glossy Object Reconstruction with Cost-effective Polarized Acquisition [41.96986483856648]
この研究は、コスト効率の良い取得ツールを使用するスケーラブルな分極支援アプローチを導入している。
提案手法は,物体表面の分極的BRDF,ストークスベクトル,偏光状態をニューラル暗黙的場として表現する。
偏光レンダリングの暗黙的な表現に基本的な物理原理を活用することにより,本手法は既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-04-09T16:38:51Z) - A Survey on All-in-One Image Restoration: Taxonomy, Evaluation and Future Trends [67.43992456058541]
画像復元(IR)とは、ノイズ、ぼかし、気象効果などの劣化を除去しながら、画像の視覚的品質を改善する過程である。
従来のIR手法は、一般的に特定の種類の劣化をターゲットとしており、複雑な歪みを伴う現実のシナリオにおいて、その効果を制限している。
オールインワン画像復元(AiOIR)パラダイムが登場し、複数の劣化タイプに順応的に対処する統一されたフレームワークを提供する。
論文 参考訳(メタデータ) (2024-10-19T11:11:09Z) - psPRF:Pansharpening Planar Neural Radiance Field for Generalized 3D Reconstruction Satellite Imagery [0.6445605125467574]
現在の衛星用NeRF変種のほとんどは特定のシーンのために設計されており、新しい幾何学への一般化には至っていない。
本稿では,低分解能RGB(LR-RGB)と高分解能パノクロマティック(HR-PAN)の画像にRational Polynomial Camera(RPC)を併用した平面ニューラルレージアンスフィールドであるpsPRFを紹介する。
シーン間におけるpsRPFの一般化能力を支援するため、プロジェクションロスを採用し、強力な幾何学的自己監督を実現する。
論文 参考訳(メタデータ) (2024-06-22T02:02:32Z) - Towards RGB-NIR Cross-modality Image Registration and Beyond [21.475871648254564]
本稿では,RGB(可視)-NIR(近赤外)クロスモダリティ画像登録の領域に着目した。
まずRGB-NIR画像登録(RGB-NIR-IRegis)ベンチマークを示す。
次に、可視画像と赤外線画像の非一貫性な局所的特徴がモデル性能に与える影響を明らかにするために、いくつかの指標を設計する。
論文 参考訳(メタデータ) (2024-05-30T10:25:50Z) - Deep learning-based hyperspectral image reconstruction for quality assessment of agro-product [0.0]
本研究の目的は,農業用深層学習によるRGB画像からのハイパースペクトル画像の再構成である。
アルゴリズムは、RGB画像からのハイパースペクトル画像を正確に再構成し、その結果のスペクトルは、地上構造と密接に一致した。
これらの知見は,様々な農業用ツールとして,ディープラーニングに基づくハイパースペクトル画像再構成の可能性を強調した。
論文 参考訳(メタデータ) (2024-05-20T18:15:20Z) - Confidence-Aware RGB-D Face Recognition via Virtual Depth Synthesis [48.59382455101753]
2D顔認証は、照明、閉塞、ポーズの変化により、制約のない環境において課題に遭遇する。
近年の研究では、深度情報を組み込んだRGB-D顔認証に焦点が当てられている。
本研究では,まず,深度モデル事前学習のための3次元Morphable Modelsによって生成された多様な深度データセットを構築する。
そこで本研究では,手軽に利用できるRGBと深度モデルを利用したドメイン非依存の事前学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-11T09:12:24Z) - Ternary-Type Opacity and Hybrid Odometry for RGB NeRF-SLAM [58.736472371951955]
表面を交差する光線上の点を3つの領域(前・前・後・後)に分類する3成分式不透明度モデルを導入する。
これにより、より正確な深度のレンダリングが可能となり、画像ワープ技術の性能が向上する。
TTとHOの統合アプローチは,合成および実世界のデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-20T18:03:17Z) - RGB-based Category-level Object Pose Estimation via Decoupled Metric
Scale Recovery [72.13154206106259]
本研究では、6次元のポーズとサイズ推定を分離し、不完全なスケールが剛性変換に与える影響を緩和するパイプラインを提案する。
具体的には,事前学習した単分子推定器を用いて局所的な幾何学的情報を抽出する。
別個のブランチは、カテゴリレベルの統計に基づいてオブジェクトのメートル法スケールを直接復元するように設計されている。
論文 参考訳(メタデータ) (2023-09-19T02:20:26Z) - High-Quality RGB-D Reconstruction via Multi-View Uncalibrated
Photometric Stereo and Gradient-SDF [48.29050063823478]
本稿では、カメラのポーズ、照明、アルベド、表面の正規化に取り組み、新しい多視点RGB-Dベースの再構成手法を提案する。
提案手法は,特定の物理モデルを用いて画像描画過程を定式化し,実際の表面の体積量を最適化する。
論文 参考訳(メタデータ) (2022-10-21T19:09:08Z) - Simultaneous Acquisition of High Quality RGB Image and Polarization
Information using a Sparse Polarization Sensor [2.4087148947930634]
高品質なRGB画像と偏光情報を得るために,新しい偏光センサ構造とネットワークアーキテクチャを提案する。
従来の偏光センサは同時にRGB画像と偏光情報を取得することができるが、センサ上の偏光器はRGB画像の品質を低下させる。
センサ上に偏光画素を疎に配置し、RGB画像をガイドとして高分解能で低分解能偏光情報を補償することでトレードオフを解決する手法を提案する。
論文 参考訳(メタデータ) (2022-09-27T01:41:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。