論文の概要: FishFormer: Annulus Slicing-based Transformer for Fisheye Rectification
with Efficacy Domain Exploration
- arxiv url: http://arxiv.org/abs/2207.01925v1
- Date: Tue, 5 Jul 2022 09:59:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-06 14:55:54.604990
- Title: FishFormer: Annulus Slicing-based Transformer for Fisheye Rectification
with Efficacy Domain Exploration
- Title(参考訳): 魚型スライシングを用いた魚眼矯正用変圧器 : 有効領域探索
- Authors: Shangrong Yang, Chunyu Lin, Kang Liao, Yao Zhao
- Abstract要約: そこで本研究では,魚眼画像をシーケンスとして処理し,世界的および地域的知覚を高めるためのフィッシュフォーマーについて紹介する。
魚眼画像の構造特性に応じてトランスフォーマーをチューニングした。
本手法は最先端の手法と比較して優れた性能を提供する。
- 参考スコア(独自算出の注目度): 44.332845280150785
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Numerous significant progress on fisheye image rectification has been
achieved through CNN. Nevertheless, constrained by a fixed receptive field, the
global distribution and the local symmetry of the distortion have not been
fully exploited. To leverage these two characteristics, we introduced
Fishformer that processes the fisheye image as a sequence to enhance global and
local perception. We tuned the Transformer according to the structural
properties of fisheye images. First, the uneven distortion distribution in
patches generated by the existing square slicing method confuses the network,
resulting in difficult training. Therefore, we propose an annulus slicing
method to maintain the consistency of the distortion in each patch, thus
perceiving the distortion distribution well. Second, we analyze that different
distortion parameters have their own efficacy domains. Hence, the perception of
the local area is as important as the global, but Transformer has a weakness
for local texture perception. Therefore, we propose a novel layer attention
mechanism to enhance the local perception and texture transfer. Our network
simultaneously implements global perception and focused local perception
decided by the different parameters. Extensive experiments demonstrate that our
method provides superior performance compared with state-of-the-art methods.
- Abstract(参考訳): 魚眼画像の修正はCNNを通じて多くの進歩を遂げている。
それにもかかわらず、一定の受容場によって制約された大域分布と歪みの局所対称性は、完全には利用されていない。
これら2つの特徴を活用するために,魚眼画像をシーケンスとして処理し,世界的および地域的知覚を高めるフィッシュフォーマーを導入した。
魚眼画像の構造特性に応じて変圧器をチューニングした。
まず,既存の2乗スライシング法によって生成されたパッチの歪み分布がネットワークを混乱させ,トレーニングが困難になる。
そこで本研究では,各パッチの歪みの一貫性を保ち,歪み分布をよく把握する環状スライシング法を提案する。
第2に、異なる歪みパラメータがそれぞれの有効領域を有することを解析する。
したがって、局所的な知覚はグローバルと同様に重要であるが、トランスフォーマーは局所的なテクスチャ知覚に弱い。
そこで本研究では,局所知覚とテクスチャ伝達を高めるための新しい層注目機構を提案する。
ネットワークはグローバルな認識と異なるパラメータによって決定される局所的な認識を同時に実装する。
実験により,本手法は最先端手法と比較して優れた性能を示すことが示された。
関連論文リスト
- RoFIR: Robust Fisheye Image Rectification Framework Impervious to Optical Center Deviation [88.54817424560056]
局所歪みの度合いと方向を測定する歪みベクトルマップ(DVM)を提案する。
DVMを学習することで、大域的な歪みパターンに頼ることなく、各ピクセルの局所歪みを独立に識別することができる。
事前学習段階では、歪みベクトルマップを予測し、各画素の局所歪み特徴を知覚する。
微調整段階では、魚眼画像修正のための画素単位のフローマップを予測する。
論文 参考訳(メタデータ) (2024-06-27T06:38:56Z) - Progressive Feedback-Enhanced Transformer for Image Forgery Localization [3.765051882812805]
本稿では,プログレッシブフィードbACkエンハンストランスフォーマー(ProFact)ネットワークを提案する。
実世界の法医学的シナリオに近い大規模な画像サンプルを自動的に生成する効果的な手法を提案する。
提案するローカライザは,画像フォージェリーのローカライゼーション能力とロバスト性において,最先端のローカライザを大きく上回っている。
論文 参考訳(メタデータ) (2023-11-15T12:31:43Z) - SimFIR: A Simple Framework for Fisheye Image Rectification with
Self-supervised Representation Learning [105.01294305972037]
自己教師型表現学習に基づく魚眼画像修正のためのフレームワークであるSimFIRを紹介する。
まず魚眼画像を複数のパッチに分割し,その表現を視覚変換器で抽出する。
下流修正作業における転送性能が著しく向上し、学習された表現の有効性が検証される。
論文 参考訳(メタデータ) (2023-08-17T15:20:17Z) - Adversarial Domain Feature Adaptation for Bronchoscopic Depth Estimation [111.89519571205778]
そこで本研究では,深度推定のためのドメイン適応手法を提案する。
提案する2段階構造は,まず,ラベル付き合成画像を用いた深度推定ネットワークを教師付きで訓練する。
実験の結果,提案手法は実画像上でのネットワーク性能をかなりの差で向上させることがわかった。
論文 参考訳(メタデータ) (2021-09-24T08:11:34Z) - SIR: Self-supervised Image Rectification via Seeing the Same Scene from
Multiple Different Lenses [82.56853587380168]
本稿では、異なるレンズからの同一シーンの歪み画像の補正結果が同一であるべきという重要な知見に基づいて、新しい自己監督画像補正法を提案する。
我々は、歪みパラメータから修正画像を生成し、再歪み画像を生成するために、微分可能なワープモジュールを利用する。
本手法は,教師付きベースライン法や代表的最先端手法と同等あるいはそれ以上の性能を実現する。
論文 参考訳(メタデータ) (2020-11-30T08:23:25Z) - A Deep Ordinal Distortion Estimation Approach for Distortion Rectification [62.72089758481803]
より高精度なパラメータを効率良く得る新しい歪み補正手法を提案する。
本研究では, 局所言語関連推定ネットワークを設計し, 順序歪みを学習し, 現実的な歪み分布を近似する。
歪み情報の冗長性を考慮すると,本手法では歪み画像の一部のみを用いて順序方向の歪み推定を行う。
論文 参考訳(メタデータ) (2020-07-21T10:03:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。