論文の概要: Efficient RWKV-based Representation Learning for 3D Point Clouds
- arxiv url: http://arxiv.org/abs/2606.10395v1
- Date: Tue, 09 Jun 2026 04:16:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.315948
- Title: Efficient RWKV-based Representation Learning for 3D Point Clouds
- Title(参考訳): 3次元点群に対するRWKVに基づく効率的な表現学習
- Authors: Yun Liu, Xuefeng Yan, Liangliang Nan, Xianzhi Li, Peng Li, Zhe Zhu, Honghua Chen, Mingqiang Wei,
- Abstract要約: textbfP-RWKVブロックは、シーケンスモデリングと不規則な3次元幾何学の間のギャップを埋める。
P-RWKVブロックとそのキーサブモジュールは、計算コストと推論遅延の少ない様々なタスクで競合性能を達成する。
- 参考スコア(独自算出の注目度): 53.911842457391636
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recent receptance weighted key value (RWKV) model combines RNN-style recurrence, offering a linear-complexity alternative to Transformers' quadratic self-attention for modeling global dependencies. However, when directly applied to point clouds, RWKV, originally developed for sequential text, struggles to capture local geometric structures and model spatial dependencies effectively. To address this, we propose the \textbf{P-RWKV} block, which bridges the gap between sequence modeling and irregular 3D geometry while preserving the efficiency advantages of RWKV. It consists of a Local Perception Expansion (LPE) component to expand contextual perception along the spatio-temporal sequence and a Spatial Context Enhancement (SCE) component to strengthen spatial awareness. To validate the effectiveness of P-RWKV for point cloud understanding, we construct PointER, a single-modality self-supervised representation learning framework whose encoder is composed of stacked P-RWKV blocks. Furthermore, we extend P-RWKV to a cross-modality setting and integrate the proposed core sub-modules into multiple architectures, demonstrating strong plug-and-play flexibility and architectural generality. Extensive experiments show that the P-RWKV block and its key sub-modules achieve competitive performance across various tasks with lower computational cost and inference latency. Code will be released upon acceptance.
- Abstract(参考訳): 最近の受容重み付きキー値(RWKV)モデルは、大域的依存関係をモデル化するためのトランスフォーマーの二次的自己アテンションに代わる線形複雑性を提供するRNNスタイルのリカレンスを組み合わせたものである。
しかし、点雲に直接適用した場合、RWKVはもともとシーケンシャルテキストのために開発されたもので、局所的な幾何学的構造と空間的依存関係を効果的にモデル化するのに苦労している。
そこで本研究では,RWKVの効率性を保ちつつ,シーケンスモデリングと不規則な3次元幾何とのギャップを埋める「textbf{P-RWKV}」ブロックを提案する。
局所知覚拡張(LPE)コンポーネントと空間認識を強化する空間文脈拡張(SCE)コンポーネントから構成される。
ポイントクラウド理解におけるP-RWKVの有効性を検証するために,エンコーダがスタックされたP-RWKVブロックで構成された単一モードの自己教師型表現学習フレームワークであるPointERを構築した。
さらに,P-RWKVをモジュール間設定に拡張し,提案するコアサブモジュールを複数のアーキテクチャに統合し,プラグアンドプレイの柔軟性とアーキテクチャの汎用性を示す。
大規模な実験により、P-RWKVブロックとそのキーサブモジュールは、計算コストと推論遅延を低くして、様々なタスクで競合性能を実現することが示されている。
コードは受理時にリリースされる。
関連論文リスト
- Light-SQ: Structure-aware Shape Abstraction with Superquadrics for Generated Meshes [60.92139345612904]
我々は、新しいスーパークワッドリックベースの最適化フレームワークLight-SQを提案する。
本稿では,構造対応ボリューム分解によるブロック再配置戦略を提案する。
実験によると、Light-SQはスーパークワッドリックで効率よく、高忠実で、編集可能な形状の抽象化を可能にする。
論文 参考訳(メタデータ) (2025-09-29T16:18:32Z) - PointDGRWKV: Generalizing RWKV-like Architecture to Unseen Domains for Point Cloud Classification [122.95228430332816]
ポイント領域一般化(DG)は、最近、ポイントクラウド分類(PCC)モデルの、目に見えない領域への一般化性を高めるために研究されている。
本稿では,DG PCCにおけるRWKVモデルの一般化可能性について述べる。
DG PCCに適したRWKVベースのフレームワークであるPointDGRWKVを提案する。
論文 参考訳(メタデータ) (2025-08-28T14:28:33Z) - U-RWKV: Lightweight medical image segmentation with direction-adaptive RWKV [13.528706926224114]
我々は,O(N)計算コストで効率的な長距離モデリングを行うための新しいフレームワークであるU-RWKVを提案する。
このフレームワークには、Direction-Adaptive RWKV ModuleとStage-Adaptive Squeeze-and-Excitation Moduleという2つの重要なイノベーションが導入されている。
U-RWKVは高い計算効率で最先端のセグメンテーション性能を実現する。
論文 参考訳(メタデータ) (2025-07-15T15:40:17Z) - PointRWKV: Efficient RWKV-Like Model for Hierarchical Point Cloud Learning [56.14518823931901]
NLP分野におけるRWKVモデルから導かれる線形複雑性のモデルであるPointRWKVを提案する。
まず,改良型マルチヘッド行列値状態を用いて,PointRWKVブロック内のグローバル処理機能について検討する。
局所的な幾何学的特徴を同時に抽出するために,グラフ安定化器を用いた固定半径近傍グラフにおいて,点雲を効率的に符号化する並列分岐を設計する。
論文 参考訳(メタデータ) (2024-05-24T05:02:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。