論文の概要: Single image calibration using knowledge distillation approaches
- arxiv url: http://arxiv.org/abs/2212.02379v1
- Date: Mon, 5 Dec 2022 15:59:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-06 17:52:13.560061
- Title: Single image calibration using knowledge distillation approaches
- Title(参考訳): 知識蒸留法による単一画像校正
- Authors: Khadidja Ould Amer, Oussama Hadjerci, Mohamed Abbas Hedjazi, Antoine
Letienne
- Abstract要約: カメラパラメータを自動的に推定するCNNアーキテクチャを構築した。
我々は、新しいデータ配信のためのネットワークを更新する際に、知識を保存するために4つの一般的な漸進学習戦略を適用した。
実験結果は, カメラキャリブレーションのキャリブレーション推定において, いずれの手法が優れているかが示唆された。
- 参考スコア(独自算出の注目度): 1.7205106391379026
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Although recent deep learning-based calibration methods can predict extrinsic
and intrinsic camera parameters from a single image, their generalization
remains limited by the number and distribution of training data samples. The
huge computational and space requirement prevents convolutional neural networks
(CNNs) from being implemented in resource-constrained environments. This
challenge motivated us to learn a CNN gradually, by training new data while
maintaining performance on previously learned data. Our approach builds upon a
CNN architecture to automatically estimate camera parameters (focal length,
pitch, and roll) using different incremental learning strategies to preserve
knowledge when updating the network for new data distributions. Precisely, we
adapt four common incremental learning, namely: LwF , iCaRL, LU CIR, and BiC by
modifying their loss functions to our regression problem. We evaluate on two
datasets containing 299008 indoor and outdoor images. Experiment results were
significant and indicated which method was better for the camera calibration
estimation.
- Abstract(参考訳): 近年の深層学習に基づくキャリブレーション手法では,1つの画像から外生・内生カメラパラメータを予測することができるが,その一般化はトレーニングデータサンプルの数と分布によって制限されている。
巨大な計算と空間要求により、リソース制約のある環境で畳み込みニューラルネットワーク(CNN)が実装されるのを防ぐ。
この課題は、以前学んだデータのパフォーマンスを維持しながら、新しいデータをトレーニングすることで、CNNを徐々に学習する動機となった。
提案手法はCNNアーキテクチャに基づいてカメラパラメータ(焦点長,ピッチ,ロール)を自動的に推定し,新たなデータ配信のためにネットワークを更新する際の知識の保存を行う。
正確には、LwF, iCaRL, LU CIR, BiCの4つの一般的な漸進学習に適応し、損失関数を回帰問題に修正する。
室内および屋外の299008画像を含む2つのデータセットについて検討した。
実験結果は有意であり,どの方法がカメラキャリブレーション推定に優れているかを示した。
関連論文リスト
- Data-efficient Event Camera Pre-training via Disentangled Masked
Modeling [20.987277885575963]
イベントカメラのための新しいデータ教師付きボクセルベースの自己教師付き学習手法を提案する。
提案手法は,時間的情報を犠牲にしたり,ペア画像データを直接利用したりする従来の手法の限界を克服する。
優れた一般化性能を示し、パラメータが少なく、計算コストも低い様々なタスクで大幅に改善されている。
論文 参考訳(メタデータ) (2024-03-01T10:02:25Z) - Leveraging Neural Radiance Fields for Uncertainty-Aware Visual
Localization [56.95046107046027]
我々は,Neural Radiance Fields (NeRF) を用いてシーン座標回帰のためのトレーニングサンプルを生成することを提案する。
レンダリングにおけるNeRFの効率にもかかわらず、レンダリングされたデータの多くはアーティファクトによって汚染されるか、最小限の情報ゲインしか含まない。
論文 参考訳(メタデータ) (2023-10-10T20:11:13Z) - Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2023-07-20T16:00:19Z) - Learning Markerless Robot-Depth Camera Calibration and End-Effector Pose
Estimation [0.0]
本研究では,ディープカメラを用いた学習型マーカーレス外部キャリブレーションシステムを提案する。
自動生成された実世界のデータから,エンドエフェクタ(EE)セグメンテーション,単一フレーム回転予測,キーポイント検出のモデルを学習する。
複数のカメラのポーズからのトレーニングデータと、未確認のポーズからのテストデータによるロバスト性は、センチメートル以下の評価と、デシラディアン以下の平均キャリブレーションを与え、推定誤差を与えます。
論文 参考訳(メタデータ) (2022-12-15T00:53:42Z) - Multi-task Learning for Camera Calibration [3.274290296343038]
一対の画像から内在性(主点オフセットと焦点長)と外因性(ベースライン,ピッチ,翻訳)を予測できるユニークな手法を提案する。
カメラモデルニューラルネットワークを用いて3Dポイントを再構成し、再構成の損失を利用してカメラ仕様を得ることにより、この革新的なカメラ投影損失(CPL)法により、所望のパラメータを推定できる。
論文 参考訳(メタデータ) (2022-11-22T17:39:31Z) - Agricultural Plantation Classification using Transfer Learning Approach
based on CNN [0.0]
深層学習により高スペクトル画像認識の効率は著しく向上した。
CNNとMulti-Layer Perceptron(MLP)は画像の分類に優れたプロセスであることが示されている。
本稿では,移動学習の手法を用いて,学習時間を短縮し,ラベル付き大規模データセットへの依存を減らすことを提案する。
論文 参考訳(メタデータ) (2022-06-19T14:43:31Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - RIFLE: Backpropagation in Depth for Deep Transfer Learning through
Re-Initializing the Fully-connected LayEr [60.07531696857743]
事前訓練されたモデルを用いたディープ畳み込みニューラルネットワーク(CNN)の微調整は、より大きなデータセットから学習した知識をターゲットタスクに転送するのに役立つ。
転送学習環境におけるバックプロパゲーションを深める戦略であるRIFLEを提案する。
RIFLEは、深いCNN層の重み付けに意味のあるアップデートをもたらし、低レベルの機能学習を改善する。
論文 参考訳(メタデータ) (2020-07-07T11:27:43Z) - Curriculum By Smoothing [52.08553521577014]
畳み込みニューラルネットワーク(CNN)は、画像分類、検出、セグメンテーションなどのコンピュータビジョンタスクにおいて顕著な性能を示している。
アンチエイリアスフィルタやローパスフィルタを用いてCNNの機能埋め込みを円滑化するエレガントなカリキュラムベースのスキームを提案する。
トレーニング中に特徴マップ内の情報量が増加するにつれて、ネットワークはデータのより優れた表現を徐々に学習することができる。
論文 参考訳(メタデータ) (2020-03-03T07:27:44Z) - Calibrating Deep Neural Networks using Focal Loss [77.92765139898906]
ミススキャリブレーション(Miscalibration)は、モデルの信頼性と正しさのミスマッチである。
焦点損失は、既に十分に校正されたモデルを学ぶことができることを示す。
ほぼすべてのケースにおいて精度を損なうことなく,最先端のキャリブレーションを達成できることを示す。
論文 参考訳(メタデータ) (2020-02-21T17:35:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。