論文の概要: KPConvX: Modernizing Kernel Point Convolution with Kernel Attention
- arxiv url: http://arxiv.org/abs/2405.13194v1
- Date: Tue, 21 May 2024 20:53:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-25 02:03:26.396340
- Title: KPConvX: Modernizing Kernel Point Convolution with Kernel Attention
- Title(参考訳): KPConvX: カーネルアテンションによるカーネルポイントコンボリューションの近代化
- Authors: Hugues Thomas, Yao-Hung Hubert Tsai, Timothy D. Barfoot, Jian Zhang,
- Abstract要約: KPConvは、空間内の畳み込み重みを見つけるためにカーネルポイントを使用するユニークなアーキテクチャである。
KPConvD (deepthwise KPConv) とKPConvX (deepwise convolutional weights of KPConvD with kernel attention value) である。
- 参考スコア(独自算出の注目度): 21.479737671592556
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the field of deep point cloud understanding, KPConv is a unique architecture that uses kernel points to locate convolutional weights in space, instead of relying on Multi-Layer Perceptron (MLP) encodings. While it initially achieved success, it has since been surpassed by recent MLP networks that employ updated designs and training strategies. Building upon the kernel point principle, we present two novel designs: KPConvD (depthwise KPConv), a lighter design that enables the use of deeper architectures, and KPConvX, an innovative design that scales the depthwise convolutional weights of KPConvD with kernel attention values. Using KPConvX with a modern architecture and training strategy, we are able to outperform current state-of-the-art approaches on the ScanObjectNN, Scannetv2, and S3DIS datasets. We validate our design choices through ablation studies and release our code and models.
- Abstract(参考訳): 深層クラウド理解の分野では、KPConvは、Multi-Layer Perceptron (MLP)エンコーディングに頼るのではなく、カーネルポイントを使用して空間内の畳み込み重みを見つけるユニークなアーキテクチャである。
当初は成功したが、その後、新しい設計とトレーニング戦略を採用した最近のMLPネットワークに取って代わられた。
KPConvD (deepthwise KPConv) とKPConvX (deepwise convolutional weights of KPConvD with kernel attention value) である。
KPConvXをモダンなアーキテクチャとトレーニング戦略で利用することで、ScanObjectNN、Scannetv2、S3DISデータセットにおける最先端のアプローチを上回ります。
アブレーション研究を通じて設計選択を検証し、コードとモデルをリリースします。
関連論文リスト
- Predicting Transonic Flowfields in Non-Homogeneous Unstructured Grids Using Autoencoder Graph Convolutional Networks [0.0]
本稿では,計算流体力学(CFD)においてよく用いられる非均一非構造格子による問題に対処することに焦点を当てる。
我々のアプローチの核となるのは幾何学的深層学習、特にグラフ畳み込みネットワーク(GCN)の利用である。
新規なAutoencoder GCNアーキテクチャは、情報を遠隔ノードに伝播し、影響力のある点を強調することにより、予測精度を向上させる。
論文 参考訳(メタデータ) (2024-05-07T15:18:21Z) - PointHR: Exploring High-Resolution Architectures for 3D Point Cloud
Segmentation [77.44144260601182]
3Dポイントクラウドセグメンテーションのための高分解能アーキテクチャについて検討する。
我々は、特徴抽出のためのknnベースのシーケンス演算子と差分再サンプリング演算子を含む、PointHRという名前の統一パイプラインを提案する。
S3DISとScanNetV2データセットを用いて,これらのアーキテクチャを高密度点雲解析のために評価する。
論文 参考訳(メタデータ) (2023-10-11T09:29:17Z) - Canvas: End-to-End Kernel Architecture Search in Neural Networks [1.1612831901050744]
コンボリューションの代替として高品質なカーネルを見つけるために、エンドツーエンドのフレームワークであるCanvasを構築します。
Canvasは,従来の最先端技術と比較して平均1.5倍の高速化を実現し,精度の低下と探索効率を許容できることを示した。
論文 参考訳(メタデータ) (2023-04-16T10:05:42Z) - Vector Quantized Wasserstein Auto-Encoder [57.29764749855623]
生成的視点から深層離散表現を学習する。
我々は,コードワード列上の離散分布を付与し,コードワード列上の分布をデータ分布に伝達する決定論的デコーダを学習する。
WS 距離のクラスタリングの観点と結びつけて,より優れた,より制御可能なクラスタリングソリューションを実現するための,さらなる理論を開発しています。
論文 参考訳(メタデータ) (2023-02-12T13:51:36Z) - Point-to-Voxel Knowledge Distillation for LiDAR Semantic Segmentation [74.67594286008317]
本稿では,大きな教師モデルから,LiDARセマンティックセグメンテーションのためのスリムな学生ネットワークへの知識の抽出の問題に対処する。
本稿では,点レベルとボクセルレベルの両方から隠れた知識を伝達するPVDを提案する。
論文 参考訳(メタデータ) (2022-06-05T05:28:32Z) - PointAttN: You Only Need Attention for Point Cloud Completion [89.88766317412052]
ポイント・クラウド・コンプリート(Point cloud completion)とは、部分的な3次元ポイント・クラウドから3次元の形状を完成させることである。
そこで我々は,kNNを除去するために,ポイントクラウドをポイント単位に処理する新しいニューラルネットワークを提案する。
提案するフレームワークであるPointAttNはシンプルで簡潔で効果的であり、3次元形状の構造情報を正確に捉えることができる。
論文 参考訳(メタデータ) (2022-03-16T09:20:01Z) - PAConv: Position Adaptive Convolution with Dynamic Kernel Assembling on
Point Clouds [33.41204351513122]
PAConvは、3Dポイントクラウド処理のための汎用畳み込み操作です。
カーネルはデータ駆動方式で構築されており、PAConvは2D畳み込みよりも柔軟性がある。
単純なネットワーク上で構築された場合でも、この手法は最先端のモデルにアプローチしたり、超えたりします。
論文 参考訳(メタデータ) (2021-03-26T17:52:38Z) - Probabilistic Graph Attention Network with Conditional Kernels for
Pixel-Wise Prediction [158.88345945211185]
本稿では,画素レベルの予測を基本的側面,すなわち,技術の現状を推し進める新たなアプローチを提案する。
構造化されたマルチスケール機能学習と融合。
本論文では,マルチスケール表現を原理的に学習・融合するための新しいアテンテンションゲート条件ランダムフィールド(AG-CRFs)モデルに基づく確率的グラフアテンションネットワーク構造を提案する。
論文 参考訳(メタデータ) (2021-01-08T04:14:29Z) - Pyramid Point: A Multi-Level Focusing Network for Revisiting Feature
Layers [8.486713415198972]
本稿では,従来の「U」形状ではなく,密度の高いピラミッド構造を用いたピラミッド点ネットワークを提案する。
このピラミッド構造は第2の外観を与え、ネットワークが異なるレイヤを同時に再考できるようにする。
3つのベンチマークデータセットで競合性能を示す。
論文 参考訳(メタデータ) (2020-11-17T15:23:27Z) - Rethinking Depthwise Separable Convolutions: How Intra-Kernel
Correlations Lead to Improved MobileNets [6.09170287691728]
CNNのための高効率なビルディングブロックとして,ブループリント分離型畳み込み(BSConv)を導入する。
それらは、訓練されたモデルからカーネル特性の定量的解析によって動機付けられている。
我々のアプローチは、深く分離可能な畳み込みの適用のために、完全な理論的導出、解釈、正当化を提供する。
論文 参考訳(メタデータ) (2020-03-30T15:23:27Z) - XSepConv: Extremely Separated Convolution [60.90871656244126]
極めて分離された畳み込みブロック(XSepConv)を提案する。
空間的に分離可能な畳み込みを奥行きの畳み込みに融合させ、大きなカーネルの計算コストとパラメータサイズの両方を削減する。
XSepConvは、大規模なカーネルサイズを持つバニラ奥行きの畳み込みの効率的な代替として設計されている。
論文 参考訳(メタデータ) (2020-02-27T11:46:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。