論文の概要: PointODE: Lightweight Point Cloud Learning with Neural Ordinary Differential Equations on Edge
- arxiv url: http://arxiv.org/abs/2506.00438v1
- Date: Sat, 31 May 2025 07:34:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 01:42:09.18838
- Title: PointODE: Lightweight Point Cloud Learning with Neural Ordinary Differential Equations on Edge
- Title(参考訳): PointODE: エッジ上のニューラル正規微分方程式を用いた軽量ポイントクラウド学習
- Authors: Keisuke Sugiura, Mizuki Yasuda, Hiroki Matsutani,
- Abstract要約: 本稿では,残差接続を持つブロックの連続的スタックに基づいて,ポイントクラウド特徴抽出のためのパラメータ効率のよいアーキテクチャを提案する。
PointODEは、合成データセットと実世界のデータセットの両方の最先端モデルと競合する精度を示す。
- 参考スコア(独自算出の注目度): 0.8403582577557918
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Embedded edge devices are often used as a computing platform to run real-world point cloud applications, but recent deep learning-based methods may not fit on such devices due to limited resources. In this paper, we aim to fill this gap by introducing PointODE, a parameter-efficient ResNet-like architecture for point cloud feature extraction based on a stack of MLP blocks with residual connections. We leverage Neural ODE (Ordinary Differential Equation), a continuous-depth version of ResNet originally developed for modeling the dynamics of continuous-time systems, to compress PointODE by reusing the same parameters across MLP blocks. The point-wise normalization is proposed for PointODE to handle the non-uniform distribution of feature points. We introduce PointODE-Elite as a lightweight version with 0.58M trainable parameters and design its dedicated accelerator for embedded FPGAs. The accelerator consists of a four-stage pipeline to parallelize the feature extraction for multiple points and stores the entire parameters on-chip to eliminate most of the off-chip data transfers. Compared to the ARM Cortex-A53 CPU, the accelerator implemented on a Xilinx ZCU104 board speeds up the feature extraction by 4.9x, leading to 3.7x faster inference and 3.5x better energy-efficiency. Despite the simple architecture, PointODE-Elite shows competitive accuracy to the state-of-the-art models on both synthetic and real-world classification datasets, greatly improving the trade-off between accuracy and inference cost.
- Abstract(参考訳): 組み込みエッジデバイスは、現実のポイントクラウドアプリケーションを実行するためのコンピューティングプラットフォームとしてよく使用されるが、最近のディープラーニングベースの手法はリソースが限られているため、そのようなデバイスには適合しない可能性がある。
本稿では,余分な接続を持つMLPブロックのスタックをベースとした,ポイントクラウド特徴抽出のためのパラメータ効率のよいResNet的なアーキテクチャであるPointODEを導入することで,このギャップを埋めることを目指している。
我々は、連続時間系の力学をモデル化するために開発されたResNetの連続深度バージョンであるNeural ODE(Ordinary Differential Equation)を利用して、同じパラメータをMLPブロック間で再利用することで、PointODEを圧縮する。
特徴点の非一様分布を扱うために、点分正規化を提案する。
我々は、0.58Mのトレーニング可能なパラメータを持つ軽量バージョンとしてPointODE-Eliteを導入し、組み込みFPGA専用アクセラレータを設計する。
アクセラレータは4段階のパイプラインで構成され、複数のポイントのフィーチャー抽出を並列化し、チップ上のパラメータ全体を格納することで、オフチップデータ転送の大部分を排除している。
ARM Cortex-A53 CPUと比較して、Xilinx ZCU104ボードに実装されたアクセラレーターは特徴抽出を4.9倍高速化し、3.7倍高速でエネルギー効率が3.5倍向上した。
単純なアーキテクチャにもかかわらず、PointODE-Eliteは、合成および実世界の分類データセットの最先端モデルと競合する精度を示し、精度と推論コストのトレードオフを大幅に改善した。
関連論文リスト
- Token Adaptation via Side Graph Convolution for Efficient Fine-tuning of 3D Point Cloud Transformers [1.19658449368018]
本稿では,近接グラフ(STAG)上でのサイドトークン適応(Side Token Adaptation)と呼ばれる新しいPEFTアルゴリズムを提案する。
STAGは、下流タスクにトークンを適用するために、凍結バックボーントランスフォーマーと並行して動作するグラフ畳み込みサイドネットワークを使用している。
また、さまざまな公開3Dポイントクラウドデータセットからなる新しいベンチマークであるPoint Cloud Classification 13 (PCC13)も紹介する。
論文 参考訳(メタデータ) (2025-02-19T22:58:56Z) - Lightweight Deep Learning Framework for Accurate Particle Flow Energy Reconstruction [8.598010350935596]
本稿では,ディープラーニング再構築の枠組みを体系的に評価する。
重み付き平均2乗と誤差構造類似度指数を組み合わせたハイブリッド損失関数を設計する。
我々は,モーダル時間的相関とエネルギー変位非線形性を捉えるモデルの能力を強化する。
論文 参考訳(メタデータ) (2024-10-08T11:49:18Z) - TTPOINT: A Tensorized Point Cloud Network for Lightweight Action
Recognition with Event Cameras [5.925545594655497]
イベントカメラは、従来のフレームベースの手法と互換性のないスパースおよび非同期データを生成する。
我々は,動作認識タスクにおけるSOTA(State-of-the-art)フレームベースの手法と比較しても,結果が得られるTTPOINTというポイントクラウドネットワークを提案する。
論文 参考訳(メタデータ) (2023-08-19T11:58:31Z) - DSVT: Dynamic Sparse Voxel Transformer with Rotated Sets [95.84755169585492]
本研究では,屋外3次元知覚のためのシングルストライドウィンドウベースのボクセルトランスであるDynamic Sparse Voxel Transformer (DSVT)を提案する。
本モデルでは,3次元認識タスクを多岐にわたって行うことにより,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-01-15T09:31:58Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Dynamic Convolution for 3D Point Cloud Instance Segmentation [146.7971476424351]
動的畳み込みに基づく3次元点雲からのインスタンスセグメンテーション手法を提案する。
我々は、同じ意味圏と閉投票を持つ等質点を幾何学的遠近点に対して収集する。
提案手法は提案不要であり、代わりに各インスタンスの空間的および意味的特性に適応する畳み込みプロセスを利用する。
論文 参考訳(メタデータ) (2021-07-18T09:05:16Z) - DeepCompress: Efficient Point Cloud Geometry Compression [1.808877001896346]
本稿では,ポイントクラウド圧縮のためのより効率的なディープラーニングベースのエンコーダアーキテクチャを提案する。
CENIC(Efficient Neural Image Compression)から学習した活性化関数を組み込むことで,効率と性能が劇的に向上することを示す。
提案手法は,BjontegardデルタレートとPSNR値において,ベースラインアプローチよりも小さなマージンで優れていた。
論文 参考訳(メタデータ) (2021-06-02T23:18:11Z) - Energy-Efficient Model Compression and Splitting for Collaborative
Inference Over Time-Varying Channels [52.60092598312894]
本稿では,エッジノードとリモートノード間のモデル圧縮と時間変化モデル分割を利用して,エッジデバイスにおける総エネルギーコストを削減する手法を提案する。
提案手法は, 検討されたベースラインと比較して, エネルギー消費が最小限であり, 排出コストが$CO$となる。
論文 参考訳(メタデータ) (2021-06-02T07:36:27Z) - Adaptive Subcarrier, Parameter, and Power Allocation for Partitioned
Edge Learning Over Broadband Channels [69.18343801164741]
パーティショニングエッジ学習(PARTEL)は、無線ネットワークにおいてよく知られた分散学習手法であるパラメータサーバトレーニングを実装している。
本稿では、いくつかの補助変数を導入してParticleELを用いてトレーニングできるディープニューラルネットワーク(DNN)モデルについて考察する。
論文 参考訳(メタデータ) (2020-10-08T15:27:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。