論文の概要: A Deep Single Image Rectification Approach for Pan-Tilt-Zoom Cameras
- arxiv url: http://arxiv.org/abs/2504.06965v1
- Date: Wed, 09 Apr 2025 15:19:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-10 13:06:06.833610
- Title: A Deep Single Image Rectification Approach for Pan-Tilt-Zoom Cameras
- Title(参考訳): パンティルトズームカメラの深部画像再構成手法
- Authors: Teng Xiao, Qi Hu, Qingsong Yan, Wei Liu, Zhiwei Ye, Fei Deng,
- Abstract要約: 本稿では,広義の画像修正のための新しいフレームワークであるFDBWNet(Forward Distortion and Backward Warping Network)を提案する。
フォワード歪みモデルを用いてバレル歪み画像を合成し、画素の冗長性を低減し、ぼやけを防ぐ。
このネットワークは、幾何学的詳細を含む逆向きのワープフローを生成するアテンション機構を備えたピラミッドコンテキストを採用している。
- 参考スコア(独自算出の注目度): 21.404790627439954
- License:
- Abstract: Pan-Tilt-Zoom (PTZ) cameras with wide-angle lenses are widely used in surveillance but often require image rectification due to their inherent nonlinear distortions. Current deep learning approaches typically struggle to maintain fine-grained geometric details, resulting in inaccurate rectification. This paper presents a Forward Distortion and Backward Warping Network (FDBW-Net), a novel framework for wide-angle image rectification. It begins by using a forward distortion model to synthesize barrel-distorted images, reducing pixel redundancy and preventing blur. The network employs a pyramid context encoder with attention mechanisms to generate backward warping flows containing geometric details. Then, a multi-scale decoder is used to restore distorted features and output rectified images. FDBW-Net's performance is validated on diverse datasets: public benchmarks, AirSim-rendered PTZ camera imagery, and real-scene PTZ camera datasets. It demonstrates that FDBW-Net achieves SOTA performance in distortion rectification, boosting the adaptability of PTZ cameras for practical visual applications.
- Abstract(参考訳): 広角レンズを備えたPan-Tilt-Zoom(PTZ)カメラは、監視に広く用いられているが、その固有の非線形歪みのために画像の修正が必要であることが多い。
現在のディープラーニングアプローチは、通常、きめ細かい幾何学的詳細を維持するのに苦労し、不正確な修正をもたらす。
本稿では,広角画像修正のための新しいフレームワークであるフォワード歪・バックワードウォーピングネットワーク(FDBW-Net)を提案する。
まず、前方歪みモデルを用いて、バレル歪んだ画像を合成し、ピクセルの冗長性を低減し、ぼやけを防ぐ。
このネットワークは、幾何学的詳細を含む逆向きのワープフローを生成するために、注意機構を備えたピラミッドコンテキストエンコーダを使用する。
そして、マルチスケールデコーダを用いて歪んだ特徴を復元し、補正された画像を出力する。
FDBW-Netのパフォーマンスは、公開ベンチマーク、AirSimレンダリングされたPTZカメライメージ、リアルタイムPTZカメラデータセットなど、さまざまなデータセットで検証されている。
FDBW-Netは歪み補正におけるSOTA性能を実現し,実用的な視覚応用のためのPTZカメラの適応性を高めた。
関連論文リスト
- An End-to-End Real-World Camera Imaging Pipeline [26.595914212462183]
本稿では,リアルタイムカメラ撮像性能を向上させるために,エンドツーエンドカメラ撮像パイプライン(RealCamNet)を提案する。
RealCamNetはRAWからRGBへの高品質な変換とコンパクトな画像圧縮のために設計されている。
実験の結果,RealCamNetは推論遅延を低く抑え,最高の速度歪み性能が得られることがわかった。
論文 参考訳(メタデータ) (2024-11-16T11:19:03Z) - DarSwin-Unet: Distortion Aware Encoder-Decoder Architecture [13.412728770638465]
広角レンズの歪みに適応するエンコーダデコーダモデルを提案する。
分類タスクのみを実行するオリジナルのモデルとは対照的に,画素レベルのタスク用に設計されたU-NetアーキテクチャDarSwin-Unetを導入する。
提案手法により,広角魚眼画像における画素レベルのタスクを処理できるモデル能力が向上し,実世界への応用がより効果的になる。
論文 参考訳(メタデータ) (2024-07-24T14:52:18Z) - RoFIR: Robust Fisheye Image Rectification Framework Impervious to Optical Center Deviation [88.54817424560056]
局所歪みの度合いと方向を測定する歪みベクトルマップ(DVM)を提案する。
DVMを学習することで、大域的な歪みパターンに頼ることなく、各ピクセルの局所歪みを独立に識別することができる。
事前学習段階では、歪みベクトルマップを予測し、各画素の局所歪み特徴を知覚する。
微調整段階では、魚眼画像修正のための画素単位のフローマップを予測する。
論文 参考訳(メタデータ) (2024-06-27T06:38:56Z) - Möbius Transform for Mitigating Perspective Distortions in Representation Learning [43.86985901138407]
パースペクティブ歪み(PD)は、画像の形状、大きさ、向き、角度、その他の空間的関係に前例のない変化を引き起こす。
M"オビウス変換の特定の族に対して,パラメータ制御を微粒化することにより,MPDを緩和する手法を提案する。
我々は,この新たなデータセットに対して,ディープラーニングモデルの堅牢性を評価するために,視点的に歪んだベンチマークデータセットであるImageNet-PDを提案する。
論文 参考訳(メタデータ) (2024-03-07T15:39:00Z) - Parallax-Tolerant Unsupervised Deep Image Stitching [57.76737888499145]
本稿では,パララックス耐性の非教師あり深層画像縫合技術であるUDIS++を提案する。
まず,グローバルなホモグラフィから局所的な薄板スプライン運動への画像登録をモデル化するための,頑健で柔軟なワープを提案する。
本研究では, 縫合された画像をシームレスに合成し, シーム駆動合成マスクの教師なし学習を行うことを提案する。
論文 参考訳(メタデータ) (2023-02-16T10:40:55Z) - RecRecNet: Rectangling Rectified Wide-Angle Images by Thin-Plate Spline
Model and DoF-based Curriculum Learning [62.86400614141706]
我々はRecRecNet(Rectangling Rectification Network)という新しい学習モデルを提案する。
我々のモデルは、ソース構造をターゲット領域に柔軟にワープし、エンドツーエンドの非教師なし変形を実現する。
実験により, 定量評価と定性評価の両面において, 比較法よりも解法の方が優れていることが示された。
論文 参考訳(メタデータ) (2023-01-04T15:12:57Z) - Deep Rotation Correction without Angle Prior [57.76737888499145]
我々は,高コンテンツ忠実度で傾きを自動的に補正する,回転補正という新しい実用的タスクを提案する。
このタスクは画像編集アプリケーションに簡単に統合でき、ユーザーは手動操作なしで回転した画像を修正できる。
我々はニューラルネットワークを利用して、傾斜した画像を知覚的に水平に歪めることができる光学フローを予測する。
論文 参考訳(メタデータ) (2022-07-07T02:46:27Z) - Single Image Automatic Radial Distortion Compensation Using Deep
Convolutional Network [0.12891210250935145]
本稿では,深部畳み込みニューラルネットワークに基づく単一像の自動レンズ歪み補正法を提案する。
本手法は,スポーツ放送のアプリケーション領域で動作する放射歪みモデルの2つの高次係数を用いて,実時間性能と精度を向上する。
論文 参考訳(メタデータ) (2021-12-14T13:04:03Z) - TransCamP: Graph Transformer for 6-DoF Camera Pose Estimation [77.09542018140823]
本稿では、カメラ再配置問題に対処するため、グラフトランスフォーマーバックボーン、すなわちTransCamPを用いたニューラルネットワークアプローチを提案する。
TransCamPは、画像の特徴、カメラポーズ情報、フレーム間の相対的なカメラモーションを、エンコードされたグラフ属性に効果的に融合する。
論文 参考訳(メタデータ) (2021-05-28T19:08:43Z) - Wide-angle Image Rectification: A Survey [86.36118799330802]
広角画像は、基礎となるピンホールカメラモデルに反する歪みを含む。
これらの歪みを補正することを目的とした画像修正は、これらの問題を解決することができる。
本稿では、異なるアプローチで使用されるカメラモデルについて、詳細な説明と議論を行う。
次に,従来の幾何学に基づく画像修正手法と深層学習法の両方について検討する。
論文 参考訳(メタデータ) (2020-10-30T17:28:40Z) - UnRectDepthNet: Self-Supervised Monocular Depth Estimation using a
Generic Framework for Handling Common Camera Distortion Models [8.484676769284578]
本研究では,未修正単眼ビデオから深度,ユークリッド距離,および視覚計測を推定するための,汎用的な規模対応型自己教師パイプラインを提案する。
提案アルゴリズムは,KITTI修正データセットでさらに評価され,最先端の結果が得られた。
論文 参考訳(メタデータ) (2020-07-13T20:35:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。