論文の概要: Mesoscopic photogrammetry with an unstabilized phone camera
- arxiv url: http://arxiv.org/abs/2012.06044v1
- Date: Fri, 11 Dec 2020 00:09:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-11 02:54:22.113910
- Title: Mesoscopic photogrammetry with an unstabilized phone camera
- Title(参考訳): 不安定電話カメラを用いたメソスコピックフォトグラメトリー
- Authors: Kevin C. Zhou, Colin Cooke, Jaehee Park, Ruobing Qian, Roarke
Horstmeyer, Joseph A. Izatt, Sina Farsiu
- Abstract要約: 本稿では,3次元mesoscopic (mm-scale height variation)画像の定量化を可能にする特徴のないフォトグラム計算手法を提案する。
当社のエンドツーエンドのピクセル強度ベースのアプローチは、すべての画像を共同で登録し、整列高さマップを推定します。
また,他の複数フレーム登録問題に適用可能な時間とメモリの削減戦略を提案する。
- 参考スコア(独自算出の注目度): 8.210210271599134
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a feature-free photogrammetric technique that enables quantitative
3D mesoscopic (mm-scale height variation) imaging with tens-of-micron accuracy
from sequences of images acquired by a smartphone at close range (several cm)
under freehand motion without additional hardware. Our end-to-end,
pixel-intensity-based approach jointly registers and stitches all the images by
estimating a coaligned height map, which acts as a pixel-wise radial
deformation field that orthorectifies each camera image to allow homographic
registration. The height maps themselves are reparameterized as the output of
an untrained encoder-decoder convolutional neural network (CNN) with the raw
camera images as the input, which effectively removes many reconstruction
artifacts. Our method also jointly estimates both the camera's dynamic 6D pose
and its distortion using a nonparametric model, the latter of which is
especially important in mesoscopic applications when using cameras not designed
for imaging at short working distances, such as smartphone cameras. We also
propose strategies for reducing computation time and memory, applicable to
other multi-frame registration problems. Finally, we demonstrate our method
using sequences of multi-megapixel images captured by an unstabilized
smartphone on a variety of samples (e.g., painting brushstrokes, circuit board,
seeds).
- Abstract(参考訳): 本研究では,スマートフォンが手動で手動で近距離(数cm)で取得した画像列から,10マイクロンの精度で3次元メソスコピック(mmスケールの高度変化)を定量化できる機能フリーフォトグラム技術を提案する。
本手法は,各カメラ画像の立体的変形場として振る舞うコアライメント高さマップを推定し,全画像の相互登録と縫い合わせを行う。
高さマップ自体は、未学習エンコーダデコーダ畳み込みニューラルネットワーク(cnn)の出力として再パラメータ化され、生のカメライメージを入力とし、多くの再構築アーティファクトを効果的に除去する。
また、カメラのダイナミックな6Dポーズと非パラメトリックモデルによる歪みを共同で推定し、後者は、スマートフォンカメラのような短い作業距離で撮影するために設計されていないカメラを使用する場合、メソスコピック・アプリケーションにおいて特に重要である。
また,他の複数フレーム登録問題に適用可能な計算時間とメモリの削減戦略を提案する。
最後に, 様々なサンプル(例えば, ブラシストローク, 回路基板, シードなど)上で, 不安定なスマートフォンが捉えたマルチメガピクセル画像のシーケンスを用いて本手法を実証する。
関連論文リスト
- Boost 3D Reconstruction using Diffusion-based Monocular Camera Calibration [34.18403601269181]
DM-Calibは単一の入力画像からピンホールカメラ固有のパラメータを推定するための拡散に基づくアプローチである。
我々は、カメラ画像と呼ばれる新しい画像ベース表現を導入し、数値カメラの内在を無意味に符号化する。
一つのRGB入力からカメラ画像を生成するための安定拡散モデルを微調整することにより、RANSAC操作を介してカメラ固有の特徴を抽出することができる。
論文 参考訳(メタデータ) (2024-11-26T09:04:37Z) - Single-image camera calibration with model-free distortion correction [0.0]
本稿では,センサ全体をカバーする平面スペックルパターンの単一画像から,キャリブレーションパラメータの完全な集合を推定する方法を提案する。
デジタル画像相関を用いて校正対象の画像点と物理点との対応を求める。
プロシージャの最後には、画像全体にわたって、密度が高く均一なモデルフリーな歪みマップが得られる。
論文 参考訳(メタデータ) (2024-03-02T16:51:35Z) - Learning Robust Multi-Scale Representation for Neural Radiance Fields
from Unposed Images [65.41966114373373]
コンピュータビジョンにおけるニューラルイメージベースのレンダリング問題に対する改善された解決策を提案する。
提案手法は,テスト時に新たな視点からシーンのリアルなイメージを合成することができる。
論文 参考訳(メタデータ) (2023-11-08T08:18:23Z) - MC-NeRF: Multi-Camera Neural Radiance Fields for Multi-Camera Image Acquisition Systems [22.494866649536018]
ニューラル・ラジアンス・フィールド(NeRF)は3次元シーン表現にマルチビュー・イメージを使用し、顕著な性能を示す。
以前のNeRFベースの手法のほとんどは、ユニークなカメラを前提としており、マルチカメラのシナリオをめったに考慮していない。
提案するMC-NeRFは,内在パラメータと外在パラメータの両方を,NeRFと併用して共同最適化する手法である。
論文 参考訳(メタデータ) (2023-09-14T16:40:44Z) - Towards Nonlinear-Motion-Aware and Occlusion-Robust Rolling Shutter
Correction [54.00007868515432]
既存の手法では、一様速度仮定による補正の精度を推定する上で、課題に直面している。
本稿では,個々の画素の高次補正場を正確に推定する,幾何的回転シャッター(QRS)運動解法を提案する。
提案手法は,Carla-RS,Fastec-RS,BS-RSCの各データセット上で,PSNRの+4.98,+0.77,+4.33を超える。
論文 参考訳(メタデータ) (2023-03-31T15:09:18Z) - Robust Camera Pose Refinement for Multi-Resolution Hash Encoding [19.655282240361835]
ニューラルレンダリングの計算コストを削減するため,マルチレゾリューションハッシュ符号化が提案されている。
カメラのポーズを校正し、効率的なマルチ解像度ハッシュ符号化を用いて幾何学的表現を学習するための共同最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-03T06:49:27Z) - Robustifying the Multi-Scale Representation of Neural Radiance Fields [86.69338893753886]
実世界の画像の両問題を克服するために,頑健なマルチスケールニューラルラジアンス場表現手法を提案する。
提案手法は,NeRFにインスパイアされたアプローチを用いて,マルチスケール画像効果とカメラ位置推定問題に対処する。
例えば、日常的に取得したマルチビュー画像からオブジェクトの正確な神経表現を行うためには、カメラの正確な位置推定が不可欠であることを示す。
論文 参考訳(メタデータ) (2022-10-09T11:46:45Z) - Towards Model Generalization for Monocular 3D Object Detection [57.25828870799331]
我々は,Mono3Dオブジェクト検出に有効な統合カメラ一般化パラダイム(CGP)を提案する。
また,インスタンスレベルの拡張によりギャップを埋める2D-3D幾何一貫性オブジェクトスケーリング戦略(GCOS)を提案する。
DGMono3Dと呼ばれる手法は、評価された全てのデータセットに対して顕著な性能を達成し、SoTAの教師なしドメイン適応スキームを上回ります。
論文 参考訳(メタデータ) (2022-05-23T23:05:07Z) - Self-Supervised Camera Self-Calibration from Video [34.35533943247917]
汎用カメラモデルの効率的なファミリーを用いてシーケンスごとのキャリブレーションパラメータを回帰する学習アルゴリズムを提案する。
提案手法は,サブピクセル再投射誤差による自己校正を行い,他の学習手法よりも優れる。
論文 参考訳(メタデータ) (2021-12-06T19:42:05Z) - Self-Calibrating Neural Radiance Fields [68.64327335620708]
キャリブレーション対象のないシーンの幾何学と正確なカメラパラメータを共同で学習する。
我々のカメラモデルは、ピンホールモデル、第4次ラジアル歪み、および任意の非線形カメラ歪みを学習可能な汎用ノイズモデルで構成されている。
論文 参考訳(メタデータ) (2021-08-31T13:34:28Z) - Lightweight Multi-View 3D Pose Estimation through Camera-Disentangled
Representation [57.11299763566534]
空間校正カメラで撮影した多視点画像から3次元ポーズを復元する手法を提案する。
我々は3次元形状を利用して、入力画像をカメラ視点から切り離したポーズの潜在表現に融合する。
アーキテクチャは、カメラプロジェクション演算子に学習した表現を条件付け、ビュー当たりの正確な2次元検出を生成する。
論文 参考訳(メタデータ) (2020-04-05T12:52:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。