論文の概要: Hformer: Hybrid CNN-Transformer for Fringe Order Prediction in Phase
Unwrapping of Fringe Projection
- arxiv url: http://arxiv.org/abs/2112.06759v1
- Date: Mon, 13 Dec 2021 16:09:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-14 18:38:52.121801
- Title: Hformer: Hybrid CNN-Transformer for Fringe Order Prediction in Phase
Unwrapping of Fringe Projection
- Title(参考訳): フラジプロジェクションの位相アンラッピングにおけるフラジ次予測用ハイブリッドCNN変換器
- Authors: Xinjun Zhu, Zhiqiang Han, Mengkai Yuan, Qinghua Guo, Hongyi Wang
- Abstract要約: 本稿では,CNNとは異なる位相アンラッピングにトランスフォーマーを導入し,フェクトオーダー予測による位相アンラッピング専用のHformerモデルを提案する。
我々の研究は、深層学習に基づく位相アンラッピング法に代わる方法を開き、この手法は、遠近射影3次元計測においてCNNが支配している。
- 参考スコア(独自算出の注目度): 9.848635287149355
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, deep learning has attracted more and more attention in phase
unwrapping of fringe projection three-dimensional (3D) measurement, with the
aim to improve the performance leveraging the powerful Convolutional Neural
Network (CNN) models. In this paper, for the first time (to the best of our
knowledge), we introduce the Transformer into the phase unwrapping which is
different from CNN and propose Hformer model dedicated to phase unwrapping via
fringe order prediction. The proposed model has a hybrid CNN-Transformer
architecture that is mainly composed of backbone, encoder and decoder to take
advantage of both CNN and Transformer. Encoder and decoder with cross attention
are designed for the fringe order prediction. Experimental results show that
the proposed Hformer model achieves better performance in fringe order
prediction compared with the CNN models such as U-Net and DCNN. Moreover,
ablation study on Hformer is made to verify the improved feature pyramid
networks (FPN) and testing strategy with flipping in the predicted fringe
order. Our work opens an alternative way to deep learning based phase
unwrapping methods, which are dominated by CNN in fringe projection 3D
measurement.
- Abstract(参考訳): 近年,強力な畳み込みニューラルネットワーク(CNN)モデルを活用した性能向上を目的として,遠近距離射影3次元計測の位相展開に深層学習が注目されている。
本稿では、初めて(私たちの知る限り)、CNNとは異なる位相アンラッピングにトランスフォーマーを導入し、フリンジ順序予測による位相アンラッピング専用のHformerモデルを提案する。
提案モデルは,主にバックボーン,エンコーダ,デコーダで構成されるハイブリッドCNN-Transformerアーキテクチャを備え,CNNとTransformerの両方を利用する。
フリンジオーダー予測のためにクロス注意のエンコーダとデコーダが設計されている。
実験の結果,提案手法は,u-netやdcnnなどのcnnモデルと比較して,フリンジ次数予測の性能が向上することがわかった。
さらに,Hformerのアブレーション実験を行い,改良された特徴ピラミッドネットワーク (FPN) と,予測されたフランジ方向のフリップによるテスト戦略を検証する。
私たちの研究は、フリンジプロジェクション3d計測においてcnnが支配する、ディープラーニングに基づくフェーズアンラッピング法に代わる方法を開きます。
関連論文リスト
- OA-CNNs: Omni-Adaptive Sparse CNNs for 3D Semantic Segmentation [70.17681136234202]
設計上の違いを再検討し、スパースCNNが達成できることの限界をテストする。
本稿では,このギャップを埋めるために,適応受容場(親和性)と適応関係という2つの重要な要素を提案する。
この調査により、軽量モジュールを統合するネットワークのファミリーであるOmni-Adaptive 3D CNN(OA-CNN)が開発された。
論文 参考訳(メタデータ) (2024-03-21T14:06:38Z) - Gate-Shift-Fuse for Video Action Recognition [43.8525418821458]
Gate-Fuse (GSF) は、時間内相互作用を制御し、時間を通して特徴を適応的にルーティングし、それらをデータ依存的に組み合わせることを学ぶ、新しい時間的特徴抽出モジュールである。
GSFは既存の2D CNNに挿入して、パラメータや計算オーバーヘッドを無視して、効率的かつ高性能に変換することができる。
2つの人気のある2次元CNNファミリを用いてGSFを広範囲に解析し、5つの標準動作認識ベンチマークで最先端または競合性能を達成する。
論文 参考訳(メタデータ) (2022-03-16T19:19:04Z) - Enhancing Deformable Convolution based Video Frame Interpolation with
Coarse-to-fine 3D CNN [4.151439675744056]
本稿では,3次元CNNの微細化とマルチフロー予測の高速化を目的とした,変形可能な畳み込み型ビデオフレーム(VFI)を提案する。
その結果,他の最先端VFI法よりも優れた性能を示す提案手法の有効性が明らかとなった。
論文 参考訳(メタデータ) (2022-02-15T21:20:18Z) - Classification of diffraction patterns using a convolutional neural
network in single particle imaging experiments performed at X-ray
free-electron lasers [53.65540150901678]
X線自由電子レーザー(XFEL)における単一粒子イメージング(SPI)は、その自然環境における粒子の3次元構造を決定するのに特に適している。
再建を成功させるためには、単一のヒットに由来する回折パターンを多数の取得パターンから分離する必要がある。
本稿では,この課題を画像分類問題として定式化し,畳み込みニューラルネットワーク(CNN)アーキテクチャを用いて解決することを提案する。
論文 参考訳(メタデータ) (2021-12-16T17:03:14Z) - A Battle of Network Structures: An Empirical Study of CNN, Transformer,
and MLP [121.35904748477421]
畳み込みニューラルネットワーク(CNN)は、コンピュータビジョンのための支配的なディープニューラルネットワーク(DNN)アーキテクチャである。
トランスフォーマーとマルチ層パーセプトロン(MLP)ベースのモデル(Vision TransformerやVision-Mixer)が新しいトレンドを導い始めた。
本稿では,これらのDNN構造について実証的研究を行い,それぞれの長所と短所を理解しようとする。
論文 参考訳(メタデータ) (2021-08-30T06:09:02Z) - Spherical Transformer: Adapting Spherical Signal to CNNs [53.18482213611481]
Spherical Transformerは、球状信号を標準CNNで直接処理できるベクトルに変換できます。
我々は,球面MNIST認識,3次元オブジェクト分類,全方向画像セマンティックセグメンテーションの課題に対するアプローチを評価する。
論文 参考訳(メタデータ) (2021-01-11T12:33:16Z) - Exploring Deep Hybrid Tensor-to-Vector Network Architectures for
Regression Based Speech Enhancement [53.47564132861866]
我々は、CNN-TTというハイブリッドアーキテクチャが、モデルパラメータを小さくして高品質な性能を維持することができることを見出した。
CNN-TTは、音声品質を改善するために、特徴抽出のために下部に複数の畳み込み層で構成されている。
論文 参考訳(メタデータ) (2020-07-25T22:21:05Z) - Cascaded Deep Video Deblurring Using Temporal Sharpness Prior [88.98348546566675]
提案アルゴリズムは主に,中間潜水フレームと潜水フレームの復元ステップから光フローを推定する。
まず、中間潜伏フレームから光フローを推定し、推定した光フローに基づいて潜伏フレームを復元する深部CNNモデルを開発する。
ビデオデブロアリングのドメイン知識を探索することで、深層CNNモデルをよりコンパクトで効率的なものにすることができることを示す。
論文 参考訳(メタデータ) (2020-04-06T09:13:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。