論文の概要: Pyramid Point: A Multi-Level Focusing Network for Revisiting Feature
Layers
- arxiv url: http://arxiv.org/abs/2011.08692v2
- Date: Mon, 23 Nov 2020 16:35:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-24 15:46:36.524283
- Title: Pyramid Point: A Multi-Level Focusing Network for Revisiting Feature
Layers
- Title(参考訳): Pyramid Point: 機能レイヤを再検討するためのマルチレベルフォーカスネットワーク
- Authors: Nina Varney, Vijayan K. Asari and Quinn Graehling
- Abstract要約: 本稿では,従来の「U」形状ではなく,密度の高いピラミッド構造を用いたピラミッド点ネットワークを提案する。
このピラミッド構造は第2の外観を与え、ネットワークが異なるレイヤを同時に再考できるようにする。
3つのベンチマークデータセットで競合性能を示す。
- 参考スコア(独自算出の注目度): 8.486713415198972
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a method to learn a diverse group of object categories from an
unordered point set. We propose our Pyramid Point network, which uses a dense
pyramid structure instead of the traditional 'U' shape, typically seen in
semantic segmentation networks. This pyramid structure gives a second look,
allowing the network to revisit different layers simultaneously, increasing the
contextual information by creating additional layers with less noise. We
introduce a Focused Kernel Point convolution (FKP Conv), which expands on the
traditional point convolutions by adding an attention mechanism to the kernel
outputs. This FKP Conv increases our feature quality and allows us to weigh the
kernel outputs dynamically. These FKP Convs are the central part of our
Recurrent FKP Bottleneck block, which makes up the backbone of our encoder.
With this distinct network, we demonstrate competitive performance on three
benchmark data sets. We also perform an ablation study to show the positive
effects of each element in our FKP Conv.
- Abstract(参考訳): 本稿では,無順序点集合から多種多様な対象分類群を学習する手法を提案する。
本稿では,従来の「u」形状ではなく,密集したピラミッド構造を用いたピラミッド点ネットワークを提案する。
このピラミッド構造は第2の外観を与え、ネットワークが異なるレイヤを同時に再検討できるようにし、ノイズの少ない追加レイヤを作成することでコンテキスト情報を増やす。
本稿では,カーネル出力に注意機構を加えることで,従来型の点畳み込みに拡張する集中型カーネル点畳み込み(fkp conv)を導入する。
このFKP Convは機能品質を向上し、カーネルの出力を動的に重み付けすることができます。
これらのFKP Convsは、エンコーダのバックボーンを構成する、リカレントFKP Bottleneckブロックの中央部分です。
この異なるネットワークでは、3つのベンチマークデータセット上での競合性能を示す。
また,FKP Convにおける各元素の陽性効果を示すためのアブレーション研究も行った。
関連論文リスト
- PointNet with KAN versus PointNet with MLP for 3D Classification and Segmentation of Point Sets [1.90365714903665]
我々は3Dポイントクラウド分類とセグメンテーションタスクのためのニューラルネットワークであるPointNet-KANを紹介する。
従来のマルチレイヤーパーセプトロン(MLP)の代わりにKAN(Kolmogorov-Arnold Networks)を採用している。
論文 参考訳(メタデータ) (2024-10-14T01:57:06Z) - Composite Convolution: a Flexible Operator for Deep Learning on 3D Point Clouds [4.104847990024176]
本稿では,3次元点雲を処理する既存の畳み込み演算子に代わる,柔軟で汎用的な複合層について紹介する。
ConvPointやKPConvのような主流のポイント・コンボリューション・レイヤと比較して、我々のコンポジット・レイヤはネットワーク設計の柔軟性を保証し、さらなる正規化の形式を提供します。
合成および実世界のデータセットを用いた実験により,分類,セグメンテーション,異常検出の両面で,当社のCompositeNetsは,同じシーケンシャルアーキテクチャを用いたConvPointより優れており,より深い残差アーキテクチャを持つKPConvと同じような結果が得られることがわかった。
論文 参考訳(メタデータ) (2022-09-23T18:32:18Z) - Stratified Transformer for 3D Point Cloud Segmentation [89.9698499437732]
Stratified Transformerは、長距離コンテキストをキャプチャし、強力な一般化能力と高性能を示す。
不規則な点配置によって引き起こされる課題に対処するために,局所情報を集約する第1層点埋め込みを提案する。
S3DIS, ScanNetv2およびShapeNetPartデータセットにおける本手法の有効性と優位性を示す実験を行った。
論文 参考訳(メタデータ) (2022-03-28T05:35:16Z) - Augmenting Convolutional networks with attention-based aggregation [55.97184767391253]
我々は,非局所的推論を実現するために,注目に基づくグローバルマップを用いた畳み込みネットワークの強化方法を示す。
この学習集約層を2つのパラメータ(幅と深さ)でパラメータ化した単純パッチベースの畳み込みネットワークで接続する。
これは、特にメモリ消費の点で、精度と複雑さの間の驚くほど競争力のあるトレードオフをもたらす。
論文 参考訳(メタデータ) (2021-12-27T14:05:41Z) - CpT: Convolutional Point Transformer for 3D Point Cloud Processing [10.389972581905]
CpT: Convolutional Point Transformer - 3Dポイントクラウドデータの非構造化の性質を扱うための新しいディープラーニングアーキテクチャ。
CpTは、既存の注目ベースのConvolutions Neural Networksと、以前の3Dポイントクラウド処理トランスフォーマーの改善である。
我々のモデルは、既存の最先端のアプローチと比較して、様々なポイントクラウド処理タスクの効果的なバックボーンとして機能する。
論文 参考訳(メタデータ) (2021-11-21T17:45:55Z) - Trident Pyramid Networks: The importance of processing at the feature
pyramid level for better object detection [50.008529403150206]
我々はTrident Pyramid Network (TPN)と呼ばれる新しいコアアーキテクチャを提案する。
TPNはより深い設計を可能にし、コミュニケーションベースの処理と自己処理のバランスを改善する。
TPNコアをオブジェクト検出ベンチマークで使用した場合,BifPNベースラインを1.5 APで上回り,一貫した改善が見られた。
論文 参考訳(メタデータ) (2021-10-08T09:59:59Z) - FPS-Net: A Convolutional Fusion Network for Large-Scale LiDAR Point
Cloud Segmentation [30.736361776703568]
LiDARポイントクラウドに基づくシーン理解は、自動運転車が安全に運転するのに不可欠なタスクです。
既存のほとんどのメソッドは、情報容量を増やすために、画像チャネルとして異なるポイント属性/モダリティを積み重ねる。
fps-netは,最適なポイントクラウドセグメンテーションのために,投影画像チャネル間の一意性と不一致を生かす畳み込み型融合ネットワークである。
論文 参考訳(メタデータ) (2021-03-01T04:08:28Z) - Unsupervised Feedforward Feature (UFF) Learning for Point Cloud
Classification and Segmentation [57.62713515497585]
3次元点雲の連成分類とセグメンテーションのために,教師なしフィードフォワード特徴学習を提案する。
UFF法は、点雲セット内の点の統計的相関を利用して、1パスのフィードフォワード方式で形状と点の特徴を学習する。
エンコーダとローカルポイントでグローバルな形状の特徴を、エンコーダ-デコーダアーキテクチャを通して学習する。
論文 参考訳(メタデータ) (2020-09-02T18:25:25Z) - DH3D: Deep Hierarchical 3D Descriptors for Robust Large-Scale 6DoF
Relocalization [56.15308829924527]
生の3D点から直接3次元特徴の検出と記述を共同で学習するシームズネットワークを提案する。
3次元キーポイントを検出するために,局所的な記述子の識別性を教師なしで予測する。
各種ベンチマーク実験により,本手法はグローバルポイントクラウド検索とローカルポイントクラウド登録の両面で競合する結果が得られた。
論文 参考訳(メタデータ) (2020-07-17T20:21:22Z) - Feature Pyramid Grids [140.11116687047058]
本稿では,深い多経路特徴ピラミッドであるFeature Pyramid Grids (FPG)を提案する。
FPGは、同様の計算コストで性能を大幅に向上させることで、シングルパスの特徴ピラミッドネットワークを改善することができる。
論文 参考訳(メタデータ) (2020-04-07T17:59:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。