論文の概要: Rethinking the Zigzag Flattening for Image Reading
- arxiv url: http://arxiv.org/abs/2202.10240v1
- Date: Mon, 21 Feb 2022 13:53:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-23 12:41:58.210319
- Title: Rethinking the Zigzag Flattening for Image Reading
- Title(参考訳): 画像読解のためのZigzag Flatteningの再考
- Authors: Qingsong Zhao, Zhipeng Zhou, Shuguang Dou, Yangguang Li, Rui Lu, Yin
Wang, Cairong Zhao
- Abstract要約: zigzag flattening (ZF) は、視覚変換器 (ViT) で画像パッチを順序付けするためのデフォルトオプションとして一般的に使用される。
また,Hilbert fractal flattening (HF) をCVの配列順序付け法として検討し,ZFと対比した。
HFは、次元空間のマルチスケール変換を行う際に、空間的局所性を維持する上で他の曲線よりも優れていることが証明されている。
- 参考スコア(独自算出の注目度): 26.54419528531139
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sequence ordering of word vector matters a lot to text reading, which has
been proven in natural language processing (NLP). However, the rule of
different sequence ordering in computer vision (CV) was not well explored,
e.g., why the "zigzag" flattening (ZF) is commonly utilized as a default option
to get the image patches ordering in vision transformers (ViTs). Notably, when
decomposing multi-scale images, the ZF could not maintain the invariance of
feature point positions. To this end, we investigate the Hilbert fractal
flattening (HF) as another method for sequence ordering in CV and contrast it
against ZF. The HF has proven to be superior to other curves in maintaining
spatial locality, when performing multi-scale transformations of dimensional
space. And it can be easily plugged into most deep neural networks (DNNs).
Extensive experiments demonstrate that it can yield consistent and significant
performance boosts for a variety of architectures. Finally, we hope that our
studies spark further research about the flattening strategy of image reading.
- Abstract(参考訳): 単語ベクトルのシーケンス順序付けは、自然言語処理 (nlp) で証明されたテキスト読み取りに非常に重要である。
しかし、コンピュータビジョン(CV)における異なるシーケンス順序付けの規則は、例えば、なぜ"zigzag"フラット化(ZF)がビジョントランスフォーマー(ViT)で順序付けされるイメージパッチを得るデフォルトオプションとして一般的に使用されるのか、よく研究されなかった。
特に、マルチスケール画像の分解時に、ZFは特徴点位置の不変性を維持できなかった。
この目的のために,Hilbertフラクタル平坦化法(HF)をCVの配列順序付け法として検討し,ZFと対比する。
HFは次元空間のマルチスケール変換を行う際に、空間的局所性を維持する上で他の曲線よりも優れていることが証明されている。
また、ほとんどのディープニューラルネットワーク(DNN)に簡単に接続できる。
広範な実験によって、さまざまなアーキテクチャに一貫性があり、大幅なパフォーマンス向上をもたらすことが示されている。
最後に、画像読取のフラット化戦略に関するさらなる研究が期待されている。
関連論文リスト
- Compressing Image-to-Image Translation GANs Using Local Density
Structures on Their Learned Manifold [69.33930972652594]
GAN(Generative Adversarial Networks)は、画像から画像への変換のための複雑なデータ分散のモデル化において、顕著な成功を収めている。
既存のGAN圧縮法は主に知識蒸留や畳み込み分類器の刈り取り技術に依存している。
学習多様体上の元のパラメータ重モデルの密度構造を保存するために,プルーンドモデルを明示的に促すことにより,新しいアプローチを提案する。
画像変換GANモデルであるPix2PixとCycleGANについて,様々なベンチマークデータセットとアーキテクチャを用いて実験を行い,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2023-12-22T15:43:12Z) - Projected Randomized Smoothing for Certified Adversarial Robustness [9.771011198361865]
ランダム化平滑化(Randomized smoothing)は、証明可能な堅牢な分類器を生成する最先端の手法である。
近年の研究では、異なる標準球や異方性領域に対する証明可能な堅牢性が一般化されている。
提案手法は, 最先端の精度を桁違いに向上することを示す。
論文 参考訳(メタデータ) (2023-09-25T01:12:55Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - GraphFit: Learning Multi-scale Graph-Convolutional Representation for
Point Cloud Normal Estimation [31.40738037512243]
本研究では,非構造3次元点雲の高精度かつ効率的な正規推定法を提案する。
我々は、より局所的な近傍幾何学を強調する正規推定のためのグラフ畳み込み特徴表現を学習する。
提案手法は,様々なベンチマークデータセットにおいて,最先端の精度で競合より優れる。
論文 参考訳(メタデータ) (2022-07-23T10:29:26Z) - ReF -- Rotation Equivariant Features for Local Feature Matching [30.459559206664427]
本稿では,モデルアーキテクチャ自体に偏りを生じさせ,回転特異な特徴を生じさせる代替的補完的手法を提案する。
我々は, ステアブルCNNの高性能, 回転特異的カバレッジを全回転角に拡張できることを実証した。
本稿では,アンサンブル,ロバストな推定,ネットワークアーキテクチャのバリエーション,回転前処理の効果について詳細に分析する。
論文 参考訳(メタデータ) (2022-03-10T07:36:09Z) - Spatial-spectral Hyperspectral Image Classification via Multiple Random
Anchor Graphs Ensemble Learning [88.60285937702304]
本稿では,複数のランダムアンカーグラフアンサンブル学習(RAGE)を用いた空間スペクトルHSI分類手法を提案する。
まず、各選択されたバンドのより記述的な特徴を抽出し、局所的な構造と領域の微妙な変化を保存するローカルバイナリパターンを採用する。
次に,アンカーグラフの構成に適応隣接代入を導入し,計算複雑性を低減した。
論文 参考訳(メタデータ) (2021-03-25T09:31:41Z) - Graph Convolution with Low-rank Learnable Local Filters [32.00396411583352]
本稿では,学習可能な低ランク局所フィルタを用いた新しいグラフ畳み込み手法を提案する。
従来のスペクトルグラフ畳み込み法よりも明らかに表現力が高い。
入力グラフデータに対する表現は理論的に証明され、グラフフィルタの局所性と局所グラフの正規化を利用する。
論文 参考訳(メタデータ) (2020-08-04T20:34:59Z) - ProAlignNet : Unsupervised Learning for Progressively Aligning Noisy
Contours [12.791313859673187]
ProAlignNetは、輪郭形状間の大規模なミスアライメントと複雑な変換を説明できる。
近接感度および局所形状依存類似度測定値の上界から導出される新しい損失関数を用いて学習する。
実世界の2つの応用において、提案したモデルは最先端の手法よりも一貫して優れている。
論文 参考訳(メタデータ) (2020-05-23T14:56:14Z) - Neural Subdivision [58.97214948753937]
本稿では,データ駆動型粗粒度モデリングの新しいフレームワークであるNeural Subdivisionを紹介する。
すべてのローカルメッシュパッチで同じネットワーク重みのセットを最適化するため、特定の入力メッシュや固定属、カテゴリに制約されないアーキテクチャを提供します。
単一の高分解能メッシュでトレーニングしても,本手法は新規な形状に対して合理的な区分を生成する。
論文 参考訳(メタデータ) (2020-05-04T20:03:21Z) - Spatial Pyramid Based Graph Reasoning for Semantic Segmentation [67.47159595239798]
セマンティックセグメンテーションタスクにグラフ畳み込みを適用し、改良されたラプラシアンを提案する。
グラフ推論は、空間ピラミッドとして構成された元の特徴空間で直接実行される。
計算とメモリのオーバーヘッドの利点で同等のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-03-23T12:28:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。