Fugu-MT 論文翻訳(概要): 3DInAction: Understanding Human Actions in 3D Point Clouds

論文の概要: 3DInAction: Understanding Human Actions in 3D Point Clouds

arxiv url: http://arxiv.org/abs/2303.06346v1
Date: Sat, 11 Mar 2023 08:42:54 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-14 19:26:46.835585
Title: 3DInAction: Understanding Human Actions in 3D Point Clouds
Title（参考訳）: 3dinaction: 3dポイントクラウドにおけるヒューマンアクションの理解
Authors: Yizhak Ben-Shabat, Oren Shrout, Stephen Gould
Abstract要約: 本稿では,3次元クラウド行動認識のための新しい手法を提案する。提案手法は,ASMビデオやIKEAビデオを含む既存のデータセットの性能向上を実現する。
参考スコア（独自算出の注目度）: 36.60407995156801
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We propose a novel method for 3D point cloud action recognition. Understanding human actions in RGB videos has been widely studied in recent years, however, its 3D point cloud counterpart remains under-explored. This is mostly due to the inherent limitation of the point cloud data modality -- lack of structure, permutation invariance, and varying number of points -- which makes it difficult to learn a spatio-temporal representation. To address this limitation, we propose the 3DinAction pipeline that first estimates patches moving in time (t-patches) as a key building block, alongside a hierarchical architecture that learns an informative spatio-temporal representation. We show that our method achieves improved performance on existing datasets, including DFAUST and IKEA ASM.
Abstract（参考訳）: 本稿では,3次元クラウド行動認識のための新しい手法を提案する。 RGBビデオにおける人間の行動を理解することは近年広く研究されているが、その3Dポイントクラウドはいまだ探索されていない。これは主に、ポイントクラウドデータのモダリティ(構造の欠如、置換不変性、点数の変化)が本質的に制限されているためであり、時空間的な表現を学ぶのが困難である。この制限に対処するために,まず時間内移動するパッチ(tパッチ)を重要なビルディングブロックとして推定する3DinActionパイプラインと,情報的時空間表現を学習する階層アーキテクチャを提案する。本手法は,DFAUSTやIKEA ASMなどの既存のデータセットの性能向上を実現する。

関連論文リスト

DG-MVP: 3D Domain Generalization via Multiple Views of Point Clouds for Classification [10.744510913722817]
ディープニューラルネットワークは3Dポイントクラウド分類において大きな成功を収めている。本稿では,3次元クラウド領域の一般化問題に焦点をあてる。本稿では,3次元点雲領域の一般化手法を提案する。
論文参考訳（メタデータ） (2025-04-16T19:43:32Z)
SPiKE: 3D Human Pose from Point Cloud Sequences [1.8024397171920885]
3D Human Pose Estimation (HPE) は、RGB画像や深度マップ、点雲などの2次元または3次元表現から、人間の身体のキーポイントを3次元空間内に配置するタスクである。本稿では,点雲列を用いた3次元HPEの新しい手法であるSPiKEを提案する。 3D HPEのITOPベンチマークの実験では、SPiKEは89.19%のmAPに達し、推論時間を大幅に短縮して最先端のパフォーマンスを達成した。
論文参考訳（メタデータ） (2024-09-03T13:22:01Z)
P2P-Bridge: Diffusion Bridges for 3D Point Cloud Denoising [81.92854168911704]
私たちは、Diffusion Schr"odingerブリッジをポイントクラウドに適応させる新しいフレームワークを通じて、ポイントクラウドを飾るタスクに取り組みます。オブジェクトデータセットの実験では、P2P-Bridgeは既存のメソッドよりも大幅に改善されている。
論文参考訳（メタデータ） (2024-08-29T08:00:07Z)
FASTC: A Fast Attentional Framework for Semantic Traversability Classification Using Point Cloud [7.711666704468952]
点雲を用いたトラバーサビリティ評価の問題に対処する。本稿では,垂直に配置された点雲から特徴を捉えるために PointNet を利用した柱状特徴抽出モジュールを提案する。次に、LIDAR点雲の密度問題に適切に対応できる多フレーム情報を融合する新しい時間的アテンションモジュールを提案する。
論文参考訳（メタデータ） (2024-06-24T12:01:55Z)
PTT: Point-Trajectory Transformer for Efficient Temporal 3D Object Detection [66.94819989912823]
時間的3次元物体検出を効率的に行うために,長期記憶が可能な点トラジェクトリ変換器を提案する。私たちは、メモリバンクのストレージ要件を最小限に抑えるために、現在のフレームオブジェクトのポイントクラウドとその履歴トラジェクトリを入力として使用します。大規模データセットに対する広範な実験を行い、我々のアプローチが最先端の手法に対してうまく機能することを実証した。
論文参考訳（メタデータ） (2023-12-13T18:59:13Z)
Nothing Stands Still: A Spatiotemporal Benchmark on 3D Point Cloud Registration Under Large Geometric and Temporal Change [86.44429778015657]
人工空間の3次元幾何学地図の構築は、基本的なコンピュータビジョンとロボット工学である。 Not Stands Still (NSS)ベンチマークは、大きな空間的および時間的変化を行う3Dシーンの時間的登録に焦点を当てている。 NSSの一環として,建設中または改修中の大規模建築屋内環境において,3次元点雲のデータセットを連続的に取得する。
論文参考訳（メタデータ） (2023-11-15T20:09:29Z)
RCP: Recurrent Closest Point for Scene Flow Estimation on 3D Point Clouds [44.034836961967144]
シーンフローや点雲の登録を含む3次元運動推定が注目されている。最近の手法では、正確な3次元フローを推定するためのコストボリュームを構築するために、ディープニューラルネットワークを使用している。問題を2つのインターレースステージに分解し、第1段階では3次元フローをポイントワイズに最適化し、第2段階ではリカレントネットワークでグローバルに正規化する。
論文参考訳（メタデータ） (2022-05-23T04:04:30Z)
IDEA-Net: Dynamic 3D Point Cloud Interpolation via Deep Embedding Alignment [58.8330387551499]
我々は、点方向軌跡(すなわち滑らかな曲線)の推定として問題を定式化する。本稿では,学習した時間的一貫性の助けを借りて問題を解消する,エンドツーエンドのディープラーニングフレームワークであるIDEA-Netを提案する。各種点群における本手法の有効性を実証し, 定量的かつ視覚的に, 最先端の手法に対する大幅な改善を観察する。
論文参考訳（メタデータ） (2022-03-22T10:14:08Z)
PointAttN: You Only Need Attention for Point Cloud Completion [89.88766317412052]
ポイント・クラウド・コンプリート(Point cloud completion)とは、部分的な3次元ポイント・クラウドから3次元の形状を完成させることである。そこで我々は,kNNを除去するために,ポイントクラウドをポイント単位に処理する新しいニューラルネットワークを提案する。提案するフレームワークであるPointAttNはシンプルで簡潔で効果的であり、3次元形状の構造情報を正確に捉えることができる。
論文参考訳（メタデータ） (2022-03-16T09:20:01Z)
D3Feat: Joint Learning of Dense Detection and Description of 3D Local Features [51.04841465193678]
私たちは3Dポイントクラウドに3D完全畳み込みネットワークを活用しています。本稿では,3次元点ごとに検出スコアと記述特徴の両方を密に予測する,新しい,実践的な学習機構を提案する。本手法は,屋内と屋外の両方のシナリオで最先端の手法を実現する。
論文参考訳（メタデータ） (2020-03-06T12:51:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。