論文の概要: CTRL-C: Camera calibration TRansformer with Line-Classification
- arxiv url: http://arxiv.org/abs/2109.02259v1
- Date: Mon, 6 Sep 2021 06:30:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-07 16:34:35.809162
- Title: CTRL-C: Camera calibration TRansformer with Line-Classification
- Title(参考訳): CTRL-C:線分別カメラキャリブレーションTRansformer
- Authors: Jinwoo Lee and Hyunsung Go and Hyunjoon Lee and Sunghyun Cho and
Minhyuk Sung and Junho Kim
- Abstract要約: そこで我々は,CTRL-Cを用いたカメラキャリブレーションTRansformerを提案する。
我々の実験では、ベンチマーク-CがGoogleストリートビューとSUN360データセットで過去の最先端の手法より優れていることを示した。
- 参考スコア(独自算出の注目度): 22.092637979495358
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single image camera calibration is the task of estimating the camera
parameters from a single input image, such as the vanishing points, focal
length, and horizon line. In this work, we propose Camera calibration
TRansformer with Line-Classification (CTRL-C), an end-to-end neural
network-based approach to single image camera calibration, which directly
estimates the camera parameters from an image and a set of line segments. Our
network adopts the transformer architecture to capture the global structure of
an image with multi-modal inputs in an end-to-end manner. We also propose an
auxiliary task of line classification to train the network to extract the
global geometric information from lines effectively. Our experiments
demonstrate that CTRL-C outperforms the previous state-of-the-art methods on
the Google Street View and SUN360 benchmark datasets.
- Abstract(参考訳): 単一画像カメラのキャリブレーション(single image camera calibration)は、消失点、焦点距離、地平線などの単一の入力画像からカメラパラメータを推定するタスクである。
本研究では,CTRL-Cを用いたカメラキャリブレーションTRansformerを提案する。これは,画像と線分からカメラパラメータを直接推定する,単一画像カメラキャリブレーションに対するエンドツーエンドのニューラルネットワークによるアプローチである。
本ネットワークは,マルチモーダル入力を用いた画像の全体構造をエンドツーエンドで捉えるためにトランスフォーマティブアーキテクチャを採用している。
また,回線からグローバルな幾何学的情報を効果的に抽出するために,ネットワークを訓練するためのライン分類の補助的タスクを提案する。
実験の結果,CTRL-CはGoogle Street ViewとSUN360ベンチマークのベンチマークデータにおいて,従来の最先端手法よりも優れていた。
関連論文リスト
- SOFI: Multi-Scale Deformable Transformer for Camera Calibration with Enhanced Line Queries [0.0]
我々は、カメラキャリブレットIon用のtextitmulti-Scale defOrmable transFormerを導入し、拡張された行クエリ、SOFIを提案する。
SOFIは、ライン内容とライン幾何学的特徴の両方を用いて、MSC-CとMSCCで使用される行クエリを改善している。
テキストGoogleストリートビュー、WildのテキストHorizon Line、テキストHollicityデータセットの既存のメソッドよりも優れており、競合する推論速度を維持している。
論文 参考訳(メタデータ) (2024-09-23T21:17:38Z) - LiFCal: Online Light Field Camera Calibration via Bundle Adjustment [38.2887165481751]
LiFCalは、MLAベースの光フィールドカメラのためのオンラインキャリブレーションパイプラインである。
正確な校正対象のない移動カメラシーケンスからモデルパラメータを正確に決定する。
ターゲットのないシーンに適用可能で、完全な継続的パイプラインでオンラインに実装されている。
論文 参考訳(メタデータ) (2024-08-21T15:04:49Z) - Anyview: Generalizable Indoor 3D Object Detection with Variable Frames [63.51422844333147]
我々は,AnyViewという新しい3D検出フレームワークを実用化するために提案する。
本手法は, 単純かつクリーンなアーキテクチャを用いて, 高い一般化性と高い検出精度を実現する。
論文 参考訳(メタデータ) (2023-10-09T02:15:45Z) - Deep Learning for Camera Calibration and Beyond: A Survey [100.75060862015945]
カメラキャリブレーションでは、キャプチャされたシーケンスから幾何学的特徴を推測するために、カメラパラメータを推定する。
近年の取り組みでは,手動キャリブレーションの繰り返し作業に代えて,学習ベースのソリューションが活用される可能性が示唆されている。
論文 参考訳(メタデータ) (2023-03-19T04:00:05Z) - CVLNet: Cross-View Semantic Correspondence Learning for Video-based
Camera Localization [89.69214577915959]
本稿では,クロスビューカメラのローカライゼーション問題に対処する。
本稿では、類似性マッチングの前に、問合せカメラの衛星画像に対する相対変位を推定する。
実験は、単一の画像に基づく位置決めよりもビデオベースの位置決めの有効性を実証した。
論文 参考訳(メタデータ) (2022-08-07T07:35:17Z) - Self-Supervised Camera Self-Calibration from Video [34.35533943247917]
汎用カメラモデルの効率的なファミリーを用いてシーケンスごとのキャリブレーションパラメータを回帰する学習アルゴリズムを提案する。
提案手法は,サブピクセル再投射誤差による自己校正を行い,他の学習手法よりも優れる。
論文 参考訳(メタデータ) (2021-12-06T19:42:05Z) - Unsupervised Depth Completion with Calibrated Backprojection Layers [79.35651668390496]
画像とスパース点雲から深度を推定するディープニューラルネットワークアーキテクチャを提案する。
LIDARや他のレンジセンサーから得られるビデオストリームとそれに対応するスパース点雲と、カメラの固有のキャリブレーションパラメータを用いてトレーニングする。
推論時に、トレーニングに用いるものと異なるカメラの校正を、スパース点雲と1つの画像とともにネットワークへの入力として行う。
論文 参考訳(メタデータ) (2021-08-24T05:41:59Z) - TransCamP: Graph Transformer for 6-DoF Camera Pose Estimation [77.09542018140823]
本稿では、カメラ再配置問題に対処するため、グラフトランスフォーマーバックボーン、すなわちTransCamPを用いたニューラルネットワークアプローチを提案する。
TransCamPは、画像の特徴、カメラポーズ情報、フレーム間の相対的なカメラモーションを、エンコードされたグラフ属性に効果的に融合する。
論文 参考訳(メタデータ) (2021-05-28T19:08:43Z) - How to Calibrate Your Event Camera [58.80418612800161]
画像再構成を用いた汎用イベントカメラキャリブレーションフレームワークを提案する。
ニューラルネットワークに基づく画像再構成は,イベントカメラの内在的・外在的キャリブレーションに適していることを示す。
論文 参考訳(メタデータ) (2021-05-26T07:06:58Z) - Neural Geometric Parser for Single Image Camera Calibration [17.393543270903653]
そこで本研究では,人為的なシーンに対して,ニューラルネットワークによる一眼レフカメラキャリブレーションを提案する。
提案手法は意味的手法と幾何学的手法の両方を考慮し,精度を著しく向上させる。
実験の結果,既存の最先端カメラキャリブレーション技術に比べて,ニューラルネットワークの性能は著しく高いことがわかった。
論文 参考訳(メタデータ) (2020-07-23T08:29:00Z) - On-line non-overlapping camera calibration net [2.4569090161971743]
カメラ間ポーズ推定のオンライン手法を提案する。
シミュレーションとKITTIデータセットを用いた実験は,シミュレーションに有効であることを示す。
論文 参考訳(メタデータ) (2020-02-19T04:59:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。