論文の概要: Optimized Vectorizing of Building Structures with Switch:
High-Efficiency Convolutional Channel-Switch Hybridization Strategy
- arxiv url: http://arxiv.org/abs/2306.15035v2
- Date: Sat, 9 Mar 2024 14:41:50 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 17:11:13.405260
- Title: Optimized Vectorizing of Building Structures with Switch:
High-Efficiency Convolutional Channel-Switch Hybridization Strategy
- Title(参考訳): スイッチ付き構造物の最適ベクトル化:高効率畳み込みチャネル-スイッチハイブリダイゼーション戦略
- Authors: Moule Lin, Weipeng Jing, Chao Li and Andr\'as Jung
- Abstract要約: 平面グラフ再構築のための高度かつ適応的なシフトアーキテクチャを提案する。
SwitchNNアーキテクチャには、畳み込みニューラルネットワークプロセスにインスパイアされたグループベースのパラメータ共有機構が組み込まれている。
本研究は,2次元建築画像からの平面グラフ再構成における,この革新的なアーキテクチャの有効性を実証するものである。
- 参考スコア(独自算出の注目度): 5.563205385450147
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The building planar graph reconstruction, a.k.a. footprint reconstruction,
which lies in the domain of computer vision and geoinformatics, has been long
afflicted with the challenge of redundant parameters in conventional
convolutional models. Therefore, in this letter, we proposed an advanced and
adaptive shift architecture, namely the Switch operator, which incorporates
non-exponential growth parameters while retaining analogous functionalities to
integrate local feature spatial information, resembling a high-dimensional
convolution operation. The Switch operator, cross-channel operation,
architecture implements the XOR operation to alternately exchange adjacent or
diagonal features, and then blends alternating channels through a 1x1
convolution operation to consolidate information from different channels. The
SwitchNN architecture, on the other hand, incorporates a group-based
parameter-sharing mechanism inspired by the convolutional neural network
process and thereby significantly reducing the number of parameters. We
validated our proposed approach through experiments on the SpaceNet corpus, a
publicly available dataset annotated with 2,001 buildings across the cities of
Los Angeles, Las Vegas, and Paris. Our results demonstrate the effectiveness of
this innovative architecture in building planar graph reconstruction from 2D
building images.
- Abstract(参考訳): コンピュータビジョンとジオインフォマティクスの領域にある建物平面グラフの再構築、すなわち足跡の再構築は、従来の畳み込みモデルにおける冗長なパラメータの課題に長い間悩まされてきた。
そこで,本稿では,高次元畳み込み操作に似た局所特徴空間情報を統合するために,類似機能を維持しながら非指数成長パラメータを組み込んだ,高度かつ適応的なシフトアーキテクチャ,すなわちスイッチ演算子を提案する。
スイッチ演算子、クロスチャネル操作、アーキテクチャはxor操作を実装し、隣接または対角的な特徴を交互に交換し、1x1畳み込み操作で交互にチャンネルをブレンドし、異なるチャネルからの情報を統合する。
一方、SwitchNNアーキテクチャでは、畳み込みニューラルネットワークプロセスにインスパイアされたグループベースのパラメータ共有機構を導入し、パラメータの数を著しく削減している。
提案したアプローチは、ロサンゼルス、ラスベガス、パリの各都市に2,001の建物がある公開データセットであるSpaceNet corpusでの実験を通じて検証しました。
本研究では,2次元建築画像から平面グラフを再構成する手法の有効性を示す。
関連論文リスト
- Vision Transformer with Convolutions Architecture Search [72.70461709267497]
本稿では,畳み込み型アーキテクチャサーチ(VTCAS)を用いたアーキテクチャ探索手法を提案する。
VTCASによって探索された高性能バックボーンネットワークは、畳み込みニューラルネットワークの望ましい特徴をトランスフォーマーアーキテクチャに導入する。
これは、特に低照度屋内シーンにおいて、物体認識のためのニューラルネットワークの堅牢性を高める。
論文 参考訳(メタデータ) (2022-03-20T02:59:51Z) - Rich CNN-Transformer Feature Aggregation Networks for Super-Resolution [50.10987776141901]
近年の視覚変換器と自己注意は,様々なコンピュータビジョンタスクにおいて有望な成果を上げている。
我々は,CNNの局所的特徴とトランスフォーマーが捉えた長距離依存性を活用する,超解像(SR)タスクのための効果的なハイブリッドアーキテクチャを提案する。
提案手法は,多数のベンチマークデータセットから最先端のSR結果を得る。
論文 参考訳(メタデータ) (2022-03-15T06:52:25Z) - CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。
提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。
実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文 参考訳(メタデータ) (2021-12-31T04:37:11Z) - STR-GQN: Scene Representation and Rendering for Unknown Cameras Based on
Spatial Transformation Routing [18.954990006113114]
本研究では,空間特性を幾何的事前を適用することなくモデル化する空間変換ルーティング(STR)機構を提案する。
STRは、空間変換をメッセージパッシングプロセスとして扱い、ビューポーズとルーティングウェイトの関係は、エンドツーエンドのトレーニング可能なニューラルネットワークによってモデル化される。
論文 参考訳(メタデータ) (2021-08-06T12:10:22Z) - X-volution: On the unification of convolution and self-attention [52.80459687846842]
本稿では,畳み込み操作と自己注意操作の両方からなるマルチブランチ基本モジュールを提案する。
提案したX-進化は、非常に競争力のある視覚的理解の改善を実現する。
論文 参考訳(メタデータ) (2021-06-04T04:32:02Z) - Operation Embeddings for Neural Architecture Search [15.033712726016255]
最適化プロセスにおいて、固定演算子エンコーディングを学習可能な表現に置き換えることを提案する。
本手法は,同様の操作とグラフパターンを共有するトップパフォーマンスアーキテクチャを生成する。
論文 参考訳(メタデータ) (2021-05-11T09:17:10Z) - Structured Convolutions for Efficient Neural Network Design [65.36569572213027]
畳み込みニューラルネットワーク構築ブロックのテクスト単純構造における冗長性を利用してモデル効率に取り組む。
この分解が2Dカーネルや3Dカーネルだけでなく、完全に接続されたレイヤにも適用可能であることを示す。
論文 参考訳(メタデータ) (2020-08-06T04:38:38Z) - Binarizing MobileNet via Evolution-based Searching [66.94247681870125]
そこで本稿では,MobileNet をバイナライズする際の構築と訓練を容易にするための進化的探索手法を提案する。
ワンショットアーキテクチャ検索フレームワークに着想を得て、グループ畳み込みのアイデアを操り、効率的な1ビット畳み込みニューラルネットワーク(CNN)を設計する。
我々の目標は、グループ畳み込みの最良の候補を探索することで、小さなが効率的なバイナリニューラルアーキテクチャを考案することである。
論文 参考訳(メタデータ) (2020-05-13T13:25:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。