論文の概要: Diagnosing and Repairing Shape-Prior Shortcuts in Long-Range Single-Shot Fringe Projection Profilometry
- arxiv url: http://arxiv.org/abs/2606.17093v1
- Date: Sat, 13 Jun 2026 04:17:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.052333
- Title: Diagnosing and Repairing Shape-Prior Shortcuts in Long-Range Single-Shot Fringe Projection Profilometry
- Title(参考訳): ロングランジ単ショットフランジプロジェクションプロファイロメトリーの診断と修復
- Authors: Adam Haroon, Anush Lakshman, Cody Fleming, Beiwen Li,
- Abstract要約: 学習に基づく単発フリンジプロファイロメトリーは概ね近距離で研究されている。
逆二乗の強度低下は、フリンジ信号-雑音比を下げ、物理的基底真理を低下させる。
機械的解釈可能性 (MI) と共形不確実性定量化 (UQ) を用いた診断・妥当性検証研究について述べる。
- 参考スコア(独自算出の注目度): 0.027998963147546144
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning-based single-shot fringe projection profilometry (FPP) has been studied mostly at close range. The long-range regime (standoff beyond 1 m) remains largely unaddressed: inverse-square intensity falloff lowers fringe signal-to-noise ratio and degrades physical ground truth, the single-shot problem is ill-posed because fringe-order information is absent from one image, and these architectures have not been studied mechanistically. We present a diagnose-repair-verify study using mechanistic interpretability (MI) and conformal uncertainty quantification (UQ) as convergent diagnostics: they agree on one physical failure locus, driving and verifying an architectural repair. On a photorealistic synthetic benchmark (15,600 fringe images, 50 objects at 1.5-2.1 m), a best UNet baseline reaches 14.54 mm object mean absolute error (MAE). Three probes (linear probing, Grad-CAM, flat-plane out-of-distribution test) converge: the baseline solves the task via object-boundary shape priors rather than fringe-phase decoding. We repair this with PhiCalNet, which outputs wrapped phase rather than depth and applies a fixed differentiable calibration layer mapping phase to depth, removing the shape-prior solution from the hypothesis space architecturally rather than by a loss penalty. A physics-informed loss that enforces the same physics as a soft penalty on a depth-regressing network yields no measurable gain, isolating the architecture as the operative factor. PhiCalNet reduces object MAE 3.3x to 4.46 mm; the residual is carried by 0.103% of pixels at the +/-pi wrap discontinuity. Pixel-wise conformal UQ confirms the diagnosis: rejecting the top 5% of object pixels by snapshot disagreement cuts PhiCalNet RMSE by 64% (20.6->7.4 mm) versus 3.5% for the baseline. MI and UQ converge on the same failure locus.
- Abstract(参考訳): FPP (Learning-based single-shot fringe projection profilometry) は、主に近距離で研究されている。
逆二乗の強度降下は、フリンジ信号とノイズ比を低下させ、物理基底の真実を低下させ、単一ショット問題は、1つの画像から外されるため、一階情報が欠落しており、これらのアーキテクチャは機械的に研究されていない。
本稿では,機械的解釈可能性 (MI) と共形不確実性定量化 (UQ) を収束診断として用いて, 一つの物理的故障点に一致し, 運転し, 建築修復の検証を行う。
フォトリアリスティックな合成ベンチマーク(15,600 fringe image, 50 object at 1.5-2.1 m)では、最高のUNetベースラインが14.54 mmオブジェクト平均絶対誤差(MAE)に達する。
3つのプローブ(線形プローブ、Grad-CAM、平板外分布試験)が収束する。
我々はPhiCalNetを用いてこれを修復する。これは、深さよりもラップフェーズを出力し、固定された微分可能なキャリブレーション層マッピングフェーズを深さに適用し、損失ペナルティではなく、アーキテクチャ上、仮説空間から形状優先の解を除去する。
深度回帰ネットワーク上でのソフトペナルティと同じ物理を強制する物理インフォームド損失は、測定可能な利得を得られず、アーキテクチャを操作因子として分離する。
PhiCalNet はオブジェクト MAE 3.3x を 4.46 mm に減らし、残像は +/-pi ラップ不連続で 0.103% のピクセルで搬送される。
PhiCalNet RMSEを64%(20.6->7.4 mm)削減し、ベースラインは3.5%とした。
MI と UQ は同じ障害点に収束する。
関連論文リスト
- Pressure-Testing Deception Probes in LLMs: Scaling, Robustness, and the Geometry of Deceptive Representations [5.218766876318545]
LLMのアクティベーションをトレーニングした線形プローブは、騙し検出指標としてますます提案されているが、AUROCは分布シフトの下で崩壊しながらクリーンなベンチマークで0.96を超えることを報告している。
本稿では, Gemma 3 モデルファミリ(1B-27B パラメータ)における圧力-プローブ-ベースの測定値について, 系統的に検討する。
1) 単線方向, (2) 多次元部分空間, (3) 凸円錐殻, (4) エントロピープロキシの4つの仮説を検証した。
論文 参考訳(メタデータ) (2026-05-27T04:51:55Z) - Pointwise Metrics Mislead: An Evaluation Protocol for Multimodal Inverse Problems [33.72751145910978]
マルチモーダル後部における逆問題に対して,低い誤差がより良い再構成を意味するという暗黙の仮定が構造的に失敗することを示す。
本稿では,各ステップがフェールモードを目標とし,他のステップが見逃すような3部評価プロトコルを提案する。
論文 参考訳(メタデータ) (2026-05-21T13:30:33Z) - Do Foundation Models Know Geometry? Probing Frozen Features for Continuous Physical Measurement [0.0]
視覚言語モデルは、それらのテキスト経路が表現できないような幾何学を符号化する。
ロラ微調整(r=16, 2,000枚)は、このギャップを6.5度に縮める。
これらの知見は、単一の凍結したバックボーンがマルチタスク幾何学的センサーとして機能することを可能にした。
論文 参考訳(メタデータ) (2026-03-06T16:48:27Z) - Learning Sub-Pixel Disparity Distribution for Light Field Depth
Estimation [16.966255245189114]
本稿では,ディープネットワークのパワーをフル活用して,サブピクセルの差分分布を学習するための,単純かつ効果的な手法を提案する。
提案手法は,HCI 4D LF Benchmarkにおける最近の最先端のLF深度アルゴリズムを4つの精度の指標で大きく上回っている。
論文 参考訳(メタデータ) (2022-08-20T14:15:35Z) - Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文 参考訳(メタデータ) (2021-07-08T15:19:36Z) - 3D Human Pose and Shape Regression with Pyramidal Mesh Alignment
Feedback Loop [128.07841893637337]
回帰に基づく手法は最近、単眼画像からヒトのメッシュを再構成する有望な結果を示した。
パラメータの小さな偏差は、推定メッシュと画像のエビデンスの間に顕著な不一致を引き起こす可能性がある。
本稿では,特徴ピラミッドを活用し,予測パラメータを補正するために,ピラミッドメッシュアライメントフィードバック(pymaf)ループを提案する。
論文 参考訳(メタデータ) (2021-03-30T17:07:49Z) - On the Practicality of Differential Privacy in Federated Learning by
Tuning Iteration Times [51.61278695776151]
フェデレートラーニング(FL)は、分散クライアント間で機械学習モデルを協調的にトレーニングする際のプライバシ保護でよく知られている。
最近の研究では、naive flは勾配リーク攻撃の影響を受けやすいことが指摘されている。
ディファレンシャルプライバシ(dp)は、勾配漏洩攻撃を防御するための有望な対策として現れる。
論文 参考訳(メタデータ) (2021-01-11T19:43:12Z) - Analytic Signal Phase in $N-D$ by Linear Symmetry Tensor--fingerprint
modeling [69.35569554213679]
解析信号位相とその勾配は2-D$以上の不連続性を持つことを示す。
この欠点は深刻なアーティファクトをもたらす可能性があるが、問題は1-D $シグナルには存在しない。
本稿では,複数のGaborフィルタに頼って線形シンメトリー位相を用いることを提案する。
論文 参考訳(メタデータ) (2020-05-16T21:17:26Z) - Enhancing Geometric Factors in Model Learning and Inference for Object
Detection and Instance Segmentation [91.12575065731883]
境界ボックス回帰および非最大抑圧(NMS)における幾何学的要素の強化を目的とした完全IoU損失とクラスタNMSを提案する。
CIoU損失を用いたディープラーニングモデルのトレーニングは、広く採用されている$ell_n$-norm損失とIoUベースの損失と比較して、一貫性のあるAPとARの改善をもたらす。
クラスタ-NMSは、純粋なGPU実装のため非常に効率的であり、APとARの両方を改善するために幾何学的要素を組み込むことができる。
論文 参考訳(メタデータ) (2020-05-07T16:00:27Z) - Convolutional Neural Networks with Intermediate Loss for 3D
Super-Resolution of CT and MRI Scans [25.089517950882527]
3次元CTやMRIの単一画像超解像へのアプローチを提案する。
提案手法は,10層からなる深層畳み込みニューラルネットワーク(CNN)に基づく。
2つのデータベースからのCTとMRIの2次元および3次元超解像の文脈において,本手法の評価を行った。
論文 参考訳(メタデータ) (2020-01-05T23:21:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。