論文の概要: The Devil is in the Pose: Ambiguity-free 3D Rotation-invariant Learning
via Pose-aware Convolution
- arxiv url: http://arxiv.org/abs/2205.15210v1
- Date: Mon, 30 May 2022 16:11:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-31 17:02:20.743097
- Title: The Devil is in the Pose: Ambiguity-free 3D Rotation-invariant Learning
via Pose-aware Convolution
- Title(参考訳): The Devil is the Pose: Ambiguity-free 3D Rotation-invariant Learning via Pose-aware Convolution
- Authors: Ronghan Chen, Yang Cong
- Abstract要約: 我々はPose-Aware Rotation Invariant Convolution(PaRI-Conv)を開発する。
本稿では,相対的なポーズ情報を完全エンコードするAPPF(Augmented Point Pair Feature)と,ポーズ対応カーネル生成のための動的カーネルについて述べる。
私たちのPaRI-Convは、よりコンパクトで効率的でありながら最先端のRI手法を超越しています。
- 参考スコア(独自算出の注目度): 18.595285633151715
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rotation-invariant (RI) 3D deep learning methods suffer performance
degradation as they typically design RI representations as input that lose
critical global information comparing to 3D coordinates. Most state-of-the-arts
address it by incurring additional blocks or complex global representations in
a heavy and ineffective manner. In this paper, we reveal that the global
information loss stems from an unexplored pose information loss problem, which
can be solved more efficiently and effectively as we only need to restore more
lightweight local pose in each layer, and the global information can be
hierarchically aggregated in the deep networks without extra efforts. To
address this problem, we develop a Pose-aware Rotation Invariant Convolution
(i.e., PaRI-Conv), which dynamically adapts its kernels based on the relative
poses. To implement it, we propose an Augmented Point Pair Feature (APPF) to
fully encode the RI relative pose information, and a factorized dynamic kernel
for pose-aware kernel generation, which can further reduce the computational
cost and memory burden by decomposing the kernel into a shared basis matrix and
a pose-aware diagonal matrix. Extensive experiments on shape classification and
part segmentation tasks show that our PaRI-Conv surpasses the state-of-the-art
RI methods while being more compact and efficient.
- Abstract(参考訳): 回転不変(RI)3次元深層学習法は、3次元座標と比較して重要なグローバル情報を失う入力としてRI表現を設計するのが一般的である。
ほとんどの最先端技術は、追加のブロックや複雑なグローバル表現を重く非効率な方法で獲得することでそれに対応する。
本稿では,各層でより軽量な局所的なポーズを復元するだけでよいため,より効率的かつ効果的に解決できる,未探索のポーズ情報損失問題に起因するグローバル情報損失を,深層ネットワークに階層的に集約し,余分な労力を要さずに解決できることを明らかにする。
この問題に対処するため、相対的なポーズに基づいてカーネルを動的に適応するPose-aware Rotation Invariant Convolution(PaRI-Conv)を開発した。
そこで本研究では,ri相対ポーズ情報を完全にエンコードする拡張点対機能(appf)と,ポーズ認識型カーネル生成のための因子化動的カーネルを提案し,カーネルを共有基底行列とポーズ認識対角行列に分解することにより,計算コストとメモリ負担をさらに低減する。
形状分類および部分分割タスクに関する大規模な実験により、我々のPaRI-Convはよりコンパクトで効率的でありながら最先端のRI法を超越していることが示された。
関連論文リスト
- IPoD: Implicit Field Learning with Point Diffusion for Generalizable 3D Object Reconstruction from Single RGB-D Images [50.4538089115248]
シングルビューRGB-D画像からの3Dオブジェクトの汎用化は依然として難しい課題である。
本稿では,暗黙の場学習と点拡散を調和させる新しい手法IPoDを提案する。
CO3D-v2データセットによる実験では、IPoDの優位性が確認され、Fスコアは7.8%、チャンファー距離は28.6%向上した。
論文 参考訳(メタデータ) (2024-03-30T07:17:37Z) - Low-Resolution Self-Attention for Semantic Segmentation [96.81482872022237]
我々は,グローバルコンテキストを計算コストの大幅な削減で捉えるために,低解像度自己認識(LRSA)機構を導入する。
我々のアプローチは、入力画像の解像度に関わらず、固定された低解像度空間における自己注意を計算することである。
本稿では,エンコーダ・デコーダ構造を持つビジョントランスであるLRFormerを構築することで,LRSA手法の有効性を示す。
論文 参考訳(メタデータ) (2023-10-08T06:10:09Z) - Learning Continuous Depth Representation via Geometric Spatial
Aggregator [47.1698365486215]
深度マップ超解法(DSR)のための新しい連続深度表現法を提案する。
この表現の中心は我々の提案した幾何空間アグリゲータ(GSA)であり、これは任意にアップサンプリングされたターゲットグリッドにより変調された距離場を利用する。
また、局所座標間の関数マッピングを構築するための原理的な方法を持つGeoDSRというトランスフォーマースタイルのバックボーンも提示する。
論文 参考訳(メタデータ) (2022-12-07T07:48:23Z) - Super-Resolution Based Patch-Free 3D Image Segmentation with
High-Frequency Guidance [20.86089285980103]
磁気共鳴画像(MRI)やCT(CT)などの医用画像など,近年,高分解能(HR)3D画像が広く利用されている。
論文 参考訳(メタデータ) (2022-10-26T11:46:08Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - SUMD: Super U-shaped Matrix Decomposition Convolutional neural network
for Image denoising [0.0]
ネットワークに行列分解モジュール(MD)を導入し,グローバルなコンテキスト機能を確立する。
U字型アーキテクチャの多段階的プログレッシブ復元の設計に触発されて,MDモジュールをマルチブランチに統合する。
我々のモデル(SUMD)は、Transformerベースの手法で、同等の視覚的品質と精度が得られる。
論文 参考訳(メタデータ) (2022-04-11T04:38:34Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - Adjoint Rigid Transform Network: Task-conditioned Alignment of 3D Shapes [86.2129580231191]
Adjoint Rigid Transform (ART) Networkは、さまざまな3Dネットワークと統合可能なニューラルネットワークモジュールである。
ARTは入力の形状を学習した標準方向に回転させることを学び、多くのタスクに欠かせない。
さらなる研究のために、コードと事前訓練されたモデルをリリースします。
論文 参考訳(メタデータ) (2021-02-01T20:58:45Z) - A Rotation-Invariant Framework for Deep Point Cloud Analysis [132.91915346157018]
ネットワーク入力時に一般的な3次元カルト座標を置き換えるために,新しい低レベル純粋回転不変表現を導入する。
また,これらの表現を特徴に組み込むネットワークアーキテクチャを提案し,点とその近傍の局所的関係とグローバルな形状構造を符号化する。
本手法は, 形状分類, 部分分割, 形状検索を含む多点雲解析タスクにおいて評価する。
論文 参考訳(メタデータ) (2020-03-16T14:04:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。