Fugu-MT 論文翻訳(概要): Part Segmentation of Human Meshes via Multi-View Human Parsing

論文の概要: Part Segmentation of Human Meshes via Multi-View Human Parsing

arxiv url: http://arxiv.org/abs/2507.18655v3
Date: Thu, 14 Aug 2025 21:22:32 GMT
ステータス: 翻訳完了
システム内更新日: 2025-08-18 14:51:23.533798
Title: Part Segmentation of Human Meshes via Multi-View Human Parsing
Title（参考訳）: マルチビューヒューマンパーシングによるヒューマンメッシュの部分分割
Authors: James Dickens, Kamyar Hamad,
Abstract要約: この研究は、大規模なヒューマンメッシュの頂点ごとのセマンティックセマンティックセグメンテーションを可能にすることによって、2つのドメインをブリッジすることを目的としている。 T Human2.1データセットのために、擬似地上真理ラベルパイプラインが開発された。点雲を効果的にダウンサンプリングするために、空間充填曲線に基づくシリアライゼーションを備えた窓付き反復極端点サンプリング(FPS)という新しいメモリ効率サンプリング戦略を導入する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recent advances in point cloud deep learning have led to models that achieve high per-part labeling accuracy on large-scale point clouds, using only the raw geometry of unordered point sets. In parallel, the field of human parsing focuses on predicting body part and clothing/accessory labels from images. This work aims to bridge these two domains by enabling per-vertex semantic segmentation of large-scale human meshes. To achieve this, a pseudo-ground truth labeling pipeline is developed for the Thuman2.1 dataset: meshes are first aligned to a canonical pose, segmented from multiple viewpoints, and the resulting point-level labels are then backprojected onto the original mesh to produce per-point pseudo ground truth annotations. Subsequently, a novel, memory-efficient sampling strategy is introduced, a windowed iterative farthest point sampling (FPS) with space-filling curve-based serialization to effectively downsample the point clouds. This is followed by a purely geometric segmentation using PointTransformer, enabling semantic parsing of human meshes without relying on texture information. Experimental results confirm the effectiveness and accuracy of the proposed approach. Project code and pre-processed data is available at https://github.com/JamesMcCullochDickens/Human3DParsing/tree/master.
Abstract（参考訳）: ポイントクラウド深層学習の最近の進歩は、秩序のない点集合の生の幾何学のみを用いて、大規模点群において、部品ごとのラベル付け精度の高いモデルを生み出している。並行して、人間のパーシングの分野は、画像から身体部分と衣服/アクセサリーラベルを予測することに焦点を当てている。この研究は、大規模なヒューマンメッシュの頂点ごとのセマンティックセマンティックセグメンテーションを可能にすることによって、これらの2つのドメインをブリッジすることを目的としている。これを実現するために、T Human2.1データセットのために擬似地上真理ラベルパイプラインが開発された: メッシュはまず、複数の視点から区切られた標準のポーズに整列され、その結果のポイントレベルのラベルは元のメッシュに逆投影され、ポイント毎の擬似地準真理アノテーションを生成する。その後、空間充填曲線に基づく直列化を施した窓付き反復極端点サンプリング(FPS)により、点雲を効果的にダウンサンプリングする、新しいメモリ効率のサンプリング戦略が導入された。この後、PointTransformerを使った純粋に幾何学的なセグメンテーションが行われ、テクスチャ情報に頼ることなく、人間のメッシュのセマンティックパースを可能にする。提案手法の有効性と精度を実験的に検証した。プロジェクトコードと事前処理されたデータはhttps://github.com/JamesMcCullochDickens/Human3DParsing/tree/masterで公開されている。

関連論文リスト

High-quality Pseudo-labeling for Point Cloud Segmentation with Scene-level Annotation [32.03087826213936]
本稿では,シーンレベルのアノテーションに基づく屋内クラウドセマンティックセマンティックセグメンテーションについて検討する。現在のメソッドはまずポイントレベルの擬似ラベルを生成し、セグメンテーションモデルをトレーニングするために使用される。精度を高めるために,高品質な擬似ラベル生成フレームワークを提案する。
論文参考訳（メタデータ） (2025-06-29T13:17:12Z)
You Only Estimate Once: Unified, One-stage, Real-Time Category-level Articulated Object 6D Pose Estimation for Robotic Grasping [119.41166438439313]
YOEOは、エンドツーエンドでインスタンスセグメンテーションとNPCS表現を出力する単一ステージのメソッドである。我々は、統一ネットワークを使用してポイントワイズセマンティックラベルとセントロイドオフセットを生成し、同じパートインスタンスのポイントが同じセントロイドに投票できるようにする。また,合成学習したモデルを実環境に展開し,200Hzでリアルタイムな視覚フィードバックを提供する。
論文参考訳（メタデータ） (2025-06-06T03:49:20Z)
Robust Human Registration with Body Part Segmentation on Noisy Point Clouds [73.00876572870787]
メッシュフィッティングプロセスにボディ部分のセグメンテーションを組み込んだハイブリッドアプローチを導入する。本手法はまず,まず各点にボディ部ラベルを割り当て,次に2ステップのSMPL-Xフィッティングを導出する。装着された人間のメッシュは、ボディ部分のラベルを洗練し、セグメンテーションの改善につながることを実証する。
論文参考訳（メタデータ） (2025-04-04T17:17:33Z)
LESS: Label-Efficient and Single-Stage Referring 3D Segmentation [55.06002976797879]
参照3Dは、クエリの文で記述された3Dポイントクラウドから、指定されたオブジェクトのすべてのポイントをセグメントする視覚言語タスクである。本稿では,LESSと呼ばれるレファレンス3次元パイプラインを提案する。 ScanReferデータセット上での最先端のパフォーマンスは、バイナリラベルのみを使用して、以前の3.7% mIoUの手法を上回ります。
論文参考訳（メタデータ） (2024-10-17T07:47:41Z)
Compositional Semantic Mix for Domain Adaptation in Point Cloud Segmentation [65.78246406460305]
合成意味混合は、ポイントクラウドセグメンテーションのための最初の教師なし領域適応技術である。本稿では、ソースドメイン(例えば合成)からの点雲とターゲットドメイン(例えば実世界)からの点雲を同時に処理できる2分岐対称ネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (2023-08-28T14:43:36Z)
Deep Semantic Graph Matching for Large-scale Outdoor Point Clouds Registration [22.308070598885532]
我々は、ポイントクラウド登録問題をセマンティックインスタンスマッチングと登録タスクとして扱う。大規模屋外クラウド登録のためのディープセマンティックグラフマッチング法(DeepSGM)を提案する。 KITTIオドメトリデータセットで行った実験結果から,提案手法が登録性能を向上させることが示された。
論文参考訳（メタデータ） (2023-08-10T03:07:28Z)
GeoMAE: Masked Geometric Target Prediction for Self-supervised Point Cloud Pre-Training [16.825524577372473]
幾何学的特徴再構成に基づくポイントクラウド表現学習フレームワークを提案する。我々は,3つの自己教師型学習目標を特異点雲,すなわちセントロイド予測,正規推定,曲率予測と同定する。私たちのパイプラインは概念的にはシンプルで、まずポイントのグループをランダムにマスキングし、次にTransformerベースのポイントクラウドエンコーダという2つの大きなステップで構成されています。
論文参考訳（メタデータ） (2023-05-15T17:14:55Z)
Position-Guided Point Cloud Panoptic Segmentation Transformer [118.17651196656178]
この作業は、LiDARベースのポイントクラウドセグメンテーションにこの魅力的なパラダイムを適用し、シンプルだが効果的なベースラインを得ることから始まります。スパース点雲のインスタンスはシーン全体に対して比較的小さく、しばしば類似した形状を持つが、画像領域では珍しいセグメンテーションの外観が欠如している。 position-guided Point cloud Panoptic segmentation transFormer (P3Former) と名付けられたこの手法は、Semantic KITTI と nuScenes のベンチマークでそれぞれ3.4%、そして 1.2%の性能をそれぞれ上回っている。
論文参考訳（メタデータ） (2023-03-23T17:59:02Z)
Semantic Segmentation of Urban Textured Meshes Through Point Sampling [0.0]
本研究では, サンプリング法, 抽出した雲の密度, 選択した特徴量, 訓練期間中に使用する点数など, 異なるパラメータの影響について検討した。 SUMデータセットでは,OAでは4ポイント,mIoUでは18ポイント,最先端のSUMデータセットでは2。
論文参考訳（メタデータ） (2023-02-21T12:49:31Z)
Learning Semantic Segmentation of Large-Scale Point Clouds with Random Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文参考訳（メタデータ） (2021-07-06T05:08:34Z)
Semantic Graph Based Place Recognition for 3D Point Clouds [22.608115489674653]
本稿では,位置認識のためのセマンティックグラフに基づく新しいアプローチを提案する。まず、ポイントクラウドシーンのための新しいセマンティックグラフ表現を提案する。次に、その類似性を計算するために、高速で効果的なグラフ類似性ネットワークを設計する。
論文参考訳（メタデータ） (2020-08-26T09:27:26Z)
Point-Set Anchors for Object Detection, Instance Segmentation and Pose Estimation [85.96410825961966]
中心点から抽出された画像の特徴は、離れたキーポイントや境界ボックスの境界を予測するための限られた情報を含んでいると論じる。推論を容易にするために,より有利な位置に配置された点集合からの回帰を行うことを提案する。我々は、オブジェクト検出、インスタンス分割、人間のポーズ推定にPoint-Set Anchorsと呼ばれるこのフレームワークを適用した。
論文参考訳（メタデータ） (2020-07-06T15:59:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。