論文の概要: Convolution kernel adaptation to calibrated fisheye
- arxiv url: http://arxiv.org/abs/2402.01456v1
- Date: Fri, 2 Feb 2024 14:44:50 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-05 14:50:22.195857
- Title: Convolution kernel adaptation to calibrated fisheye
- Title(参考訳): 校正魚眼における畳み込み核適応
- Authors: Bruno Berenguel-Baeta, Maria Santos-Villafranca, Jesus Bermudez-Cameo,
Alejandro Perez-Yus, Jose J. Guerrero
- Abstract要約: 畳み込み核は畳み込みニューラルネットワーク(CNN)の基本構造成分である
本稿では,カメラのキャリブレーションを利用してコンボリューションカーネルを変形させ,歪みに適応させる手法を提案する。
小型のデータセットで簡単な微調整を施すことで,漁獲魚のネットワーク性能が向上することを示す。
- 参考スコア(独自算出の注目度): 45.90423821963144
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Convolution kernels are the basic structural component of convolutional
neural networks (CNNs). In the last years there has been a growing interest in
fisheye cameras for many applications. However, the radially symmetric
projection model of these cameras produces high distortions that affect the
performance of CNNs, especially when the field of view is very large. In this
work, we tackle this problem by proposing a method that leverages the
calibration of cameras to deform the convolution kernel accordingly and adapt
to the distortion. That way, the receptive field of the convolution is similar
to standard convolutions in perspective images, allowing us to take advantage
of pre-trained networks in large perspective datasets. We show how, with just a
brief fine-tuning stage in a small dataset, we improve the performance of the
network for the calibrated fisheye with respect to standard convolutions in
depth estimation and semantic segmentation.
- Abstract(参考訳): 畳み込みカーネルは畳み込みニューラルネットワーク(CNN)の基本構造コンポーネントである。
近年、多くの用途で魚眼カメラへの関心が高まっている。
しかし、これらのカメラの放射対称投影モデルは、特に視野が非常に大きい場合、CNNの性能に影響を及ぼす高い歪みを生じさせる。
本研究では,カメラのキャリブレーションを利用してコンボリューションカーネルを変形させ,歪みに適応させる手法を提案する。
このようにして、畳み込みの受容場はパースペクティブイメージの標準的な畳み込みと似ており、大きなパースペクティブデータセットで事前訓練されたネットワークを利用することができる。
我々は,小データセットの簡単な微調整段階において,深度推定とセマンティックセグメンテーションにおける標準的な畳み込みに対して,キャリブレーション魚眼ネットワークの性能を向上させる方法を示す。
関連論文リスト
- Deformable Convolution Based Road Scene Semantic Segmentation of Fisheye Images in Autonomous Driving [4.720434481945155]
本研究では,近代的変形可能な畳み込みニューラルネットワーク(DCNN)のセマンティックセグメンテーションタスクへの応用について検討する。
実験では,WoodScapeの魚眼画像データセットを10種類の異なるクラスに分割し,複雑な空間関係を捉えるデフォルマブルネットワークの能力を評価する。
変形可能なCNNの統合によるmIoUスコアの大幅な改善は、魚眼画像に存在する幾何歪みを扱う上での有効性を示す。
論文 参考訳(メタデータ) (2024-07-23T17:02:24Z) - Adapting CNNs for Fisheye Cameras without Retraining [3.683202928838613]
多くの応用において、より広い視野の魚眼カメラのような従来のカメラを使う方が有益である。
問題は、これらの大きなFOV画像は、元の画像のかなりの刈り取らなければ、視点投影に修正できないことである。
我々は、事前学習された畳み込みネットワークを新しい非パースペクティブな画像で操作するための新しいアプローチであるRectified Convolutionsを提案する。
論文 参考訳(メタデータ) (2024-04-12T01:36:00Z) - Sorted Convolutional Network for Achieving Continuous Rotational
Invariance [56.42518353373004]
テクスチャ画像のハンドメイドな特徴に着想を得たSorting Convolution (SC)を提案する。
SCは、追加の学習可能なパラメータやデータ拡張を必要とせずに連続的な回転不変性を達成する。
以上の結果から, SCは, 上記の課題において, 最高の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-05-23T18:37:07Z) - FisheyeHDK: Hyperbolic Deformable Kernel Learning for Ultra-Wide
Field-of-View Image Recognition [0.3655021726150367]
狭視野(FoV)イメージに基づいてトレーニングされた従来の畳み込みニューラルネットワーク(CNN)は、オブジェクト認識タスクの最先端のアプローチである。
いくつかの手法は、変形可能なカーネルを学習することで、超広帯域FoV画像へのCNNの適応を提案した。
非ユークリッド空間における畳み込みカーネルの形状の学習は、既存の変形可能なカーネル法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-03-14T16:37:54Z) - Adaptable Deformable Convolutions for Semantic Segmentation of Fisheye
Images in Autonomous Driving Systems [4.231909978425546]
標準画像に訓練されたCNNが魚眼画像に容易に適応できることを示した。
我々の適応プロトコルは主に、既存の層の上に変形可能な等価性を使用することで畳み込みのサポートを変更することに依存している。
論文 参考訳(メタデータ) (2021-02-19T22:47:44Z) - PCLs: Geometry-aware Neural Reconstruction of 3D Pose with Perspective
Crop Layers [111.55817466296402]
我々は、カメラ幾何学に基づく関心領域の視点作物であるパースペクティブ・クロップ・レイヤ(PCL)を紹介する。
PCLは、エンドツーエンドのトレーニングと基礎となるニューラルネットワークのパラメータ数を残しながら、位置依存的な視点効果を決定論的に除去する。
PCLは、既存の3D再構成ネットワークを幾何学的に認識することで、容易に精度を向上させる手段を提供する。
論文 参考訳(メタデータ) (2020-11-27T08:48:43Z) - Neural Ray Surfaces for Self-Supervised Learning of Depth and Ego-motion [51.19260542887099]
カメラモデルの事前知識を必要とせずに、自己超越を用いて正確な深度とエゴモーション推定を学習できることが示される。
Grossberg と Nayar の幾何学モデルにインスパイアされた我々は、ピクセルワイド射影線を表す畳み込みネットワークである Neural Ray Surfaces (NRS) を導入する。
本研究では,多種多様なカメラシステムを用いて得られた生ビデオから,視覚計測の自己教師付き学習と深度推定にNRSを用いることを実証する。
論文 参考訳(メタデータ) (2020-08-15T02:29:13Z) - On Robustness and Transferability of Convolutional Neural Networks [147.71743081671508]
現代の深層畳み込みネットワーク(CNN)は、分散シフトの下で一般化しないとしてしばしば批判される。
現代画像分類CNNにおける分布外と転送性能の相互作用を初めて検討した。
トレーニングセットとモデルサイズを増大させることで、分散シフトロバスト性が著しく向上することがわかった。
論文 参考訳(メタデータ) (2020-07-16T18:39:04Z) - UnRectDepthNet: Self-Supervised Monocular Depth Estimation using a
Generic Framework for Handling Common Camera Distortion Models [8.484676769284578]
本研究では,未修正単眼ビデオから深度,ユークリッド距離,および視覚計測を推定するための,汎用的な規模対応型自己教師パイプラインを提案する。
提案アルゴリズムは,KITTI修正データセットでさらに評価され,最先端の結果が得られた。
論文 参考訳(メタデータ) (2020-07-13T20:35:05Z) - PSConv: Squeezing Feature Pyramid into One Compact Poly-Scale
Convolutional Layer [76.44375136492827]
畳み込みニューラルネットワーク(CNN)は、しばしばスケールに敏感である。
我々は、この後悔を、より細かい粒度でマルチスケールの機能を利用して埋める。
提案した畳み込み演算は、PSConv(Poly-Scale Convolution)と呼ばれ、拡張率のスペクトルを混合する。
論文 参考訳(メタデータ) (2020-07-13T05:14:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。