論文の概要: MSF-Net: Multi-Stage Feature Extraction and Fusion for Robust Photometric Stereo
- arxiv url: http://arxiv.org/abs/2510.25221v1
- Date: Wed, 29 Oct 2025 06:56:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 15:50:45.190881
- Title: MSF-Net: Multi-Stage Feature Extraction and Fusion for Robust Photometric Stereo
- Title(参考訳): MSF-Net:ロバストな測光ステレオのためのマルチステージ特徴抽出と融合
- Authors: Shiyu Qin, Zhihao Cai, Kaixuan Wang, Lin Qi, Junyu Dong,
- Abstract要約: 光度ステレオ(英: Photometric stereo)は、異なる照明条件下で撮影された画像から得られるシェーディングキューを利用して表面の正常度を決定する技術である。
既存の学習ベースのアプローチは、複数の段階の機能を正確に捉えることができず、これらの機能間の相互作用を適切に促進しないことが多い。
本稿では,複数段階で情報を抽出する新しいフレームワークであるMSF-Netと,選択的な更新戦略を組み合わせて提案する。
- 参考スコア(独自算出の注目度): 38.34096529700518
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Photometric stereo is a technique aimed at determining surface normals through the utilization of shading cues derived from images taken under different lighting conditions. However, existing learning-based approaches often fail to accurately capture features at multiple stages and do not adequately promote interaction between these features. Consequently, these models tend to extract redundant features, especially in areas with intricate details such as wrinkles and edges. To tackle these issues, we propose MSF-Net, a novel framework for extracting information at multiple stages, paired with selective update strategy, aiming to extract high-quality feature information, which is critical for accurate normal construction. Additionally, we have developed a feature fusion module to improve the interplay among different features. Experimental results on the DiLiGenT benchmark show that our proposed MSF-Net significantly surpasses previous state-of-the-art methods in the accuracy of surface normal estimation.
- Abstract(参考訳): 光度ステレオ(英: Photometric stereo)は、異なる照明条件下で撮影された画像から得られるシェーディングキューを利用して表面の正常度を決定する技術である。
しかし、既存の学習ベースのアプローチは、複数の段階で正確に特徴をキャプチャできず、これらの特徴間の相互作用を適切に促進しないことが多い。
結果としてこれらのモデルは、特にしわや縁のような複雑な細部を持つ領域において、余分な特徴を抽出する傾向にある。
これらの課題に対処するため,我々は,複数段階の情報を抽出する新しいフレームワークであるMSF-Netを提案する。
さらに,異なる機能間の相互作用を改善するために,機能融合モジュールを開発した。
DiLiGenT ベンチマークによる実験結果から,提案した MSF-Net は表面正規分布推定の精度において,従来の最先端手法をはるかに上回っていることがわかった。
関連論文リスト
- PIF-Net: Ill-Posed Prior Guided Multispectral and Hyperspectral Image Fusion via Invertible Mamba and Fusion-Aware LoRA [0.16385815610837165]
マルチスペクトル・ハイパースペクトル画像融合(MHIF)の目的は、豊富なスペクトル情報と細かな空間的詳細を同時に持つ高品質な画像を生成することである。
これまでの研究では、データ修正が原因で生じる不適切な性質を効果的に扱っていなかった。
PIF-Net という名前の融合フレームワークを提案し,多重スペクトル画像とハイパースペクトル画像とを効果的に融合させる。
論文 参考訳(メタデータ) (2025-08-01T09:17:17Z) - Multi-Head Attention Residual Unfolded Network for Model-Based Pansharpening [2.874893537471256]
展開融合法は、ディープラーニングの強力な表現能力とモデルベースアプローチの堅牢性を統合する。
本稿では,衛星画像融合のためのモデルに基づく深部展開手法を提案する。
PRISMA、Quickbird、WorldView2データセットの実験結果から、本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2024-09-04T13:05:00Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Contrastive Learning-Based Spectral Knowledge Distillation for
Multi-Modality and Missing Modality Scenarios in Semantic Segmentation [2.491548070992611]
CSK-Netと呼ばれる新しいマルチモーダル融合手法を提案する。
対照的な学習に基づくスペクトル知識蒸留技術を用いる。
実験の結果、CSK-Netはマルチモーダルタスクや欠落したモダリティにおいて最先端のモデルを上回ることがわかった。
論文 参考訳(メタデータ) (2023-12-04T10:27:09Z) - Multi-View Photometric Stereo Revisited [100.97116470055273]
多視点測光ステレオ(MVPS)は、画像から被写体を詳細に正確に3D取得する方法として好まれる。
MVPSは異方性や光沢などの他の対象物質と同様に,等方性に対しても有効である。
提案手法は、複数のベンチマークデータセットで広範囲にテストした場合に、最先端の結果を示す。
論文 参考訳(メタデータ) (2022-10-14T09:46:15Z) - Interactive Multi-scale Fusion of 2D and 3D Features for Multi-object
Tracking [23.130490413184596]
我々は、PointNet++を導入し、ポイントクラウドのマルチスケールのディープ表現を取得し、提案したInteractive Feature Fusionに適応させる。
提案手法は,KITTIベンチマークにおいて,マルチスケールな特徴融合を使わずに優れた性能を実現し,他の手法よりも優れる。
論文 参考訳(メタデータ) (2022-03-30T13:00:27Z) - DeepMultiCap: Performance Capture of Multiple Characters Using Sparse
Multiview Cameras [63.186486240525554]
deep multicapは、スパースマルチビューカメラを用いたマルチパーソンパフォーマンスキャプチャのための新しい手法である。
本手法では,事前走査型テンプレートモデルを用いることなく,時間変化した表面の詳細をキャプチャできる。
論文 参考訳(メタデータ) (2021-05-01T14:32:13Z) - Efficient and Accurate Multi-scale Topological Network for Single Image
Dehazing [31.543771270803056]
本稿では,入力画像自体の特徴抽出と利用に注意を払います。
本稿では,マルチスケールトポロジカルネットワーク (mstn) を提案する。
一方、我々は、異なるスケールで機能の選択と融合を達成するために、マルチスケール機能融合モジュール(MFFM)と適応機能選択モジュール(AFSM)を設計します。
論文 参考訳(メタデータ) (2021-02-24T08:53:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。