論文の概要: Joint 3D Point Cloud Segmentation using Real-Sim Loop: From Panels to Trees and Branches
- arxiv url: http://arxiv.org/abs/2503.05630v1
- Date: Fri, 07 Mar 2025 17:54:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-10 12:20:18.095744
- Title: Joint 3D Point Cloud Segmentation using Real-Sim Loop: From Panels to Trees and Branches
- Title(参考訳): 実時間ループを用いた3次元点雲の連成分割:パネルから木・枝まで
- Authors: Tian Qiu, Ruiming Du, Nikolai Spine, Lailiang Cheng, Yu Jiang,
- Abstract要約: P2TBタスク用に設計されたデータ生成のためのReal2Sim L-TreeGenとジョイントモデル(J-P2TB)を組み込んだ新しいアプローチを提案する。
生成したシミュレーションデータセットに基づいてトレーニングされたJ-P2TBモデルは、ゼロショット学習を通じて現実世界のパネルポイントクラウドのジョイントセグメンテーションに使用された。
- 参考スコア(独自算出の注目度): 7.299711490682471
- License:
- Abstract: Modern orchards are planted in structured rows with distinct panel divisions to improve management. Accurate and efficient joint segmentation of point cloud from Panel to Tree and Branch (P2TB) is essential for robotic operations. However, most current segmentation methods focus on single instance segmentation and depend on a sequence of deep networks to perform joint tasks. This strategy hinders the use of hierarchical information embedded in the data, leading to both error accumulation and increased costs for annotation and computation, which limits its scalability for real-world applications. In this study, we proposed a novel approach that incorporated a Real2Sim L-TreeGen for training data generation and a joint model (J-P2TB) designed for the P2TB task. The J-P2TB model, trained on the generated simulation dataset, was used for joint segmentation of real-world panel point clouds via zero-shot learning. Compared to representative methods, our model outperformed them in most segmentation metrics while using 40% fewer learnable parameters. This Sim2Real result highlighted the efficacy of L-TreeGen in model training and the performance of J-P2TB for joint segmentation, demonstrating its strong accuracy, efficiency, and generalizability for real-world applications. These improvements would not only greatly benefit the development of robots for automated orchard operations but also advance digital twin technology.
- Abstract(参考訳): 現代の果樹園は、管理を改善するために、異なるパネル部門を持つ構造された列に植えられている。
パネルからトリー・アンド・ブランチ(P2TB)までの点雲の高精度かつ効率的な関節分割は、ロボット操作に不可欠である。
しかし、現在のセグメンテーション手法のほとんどは単一インスタンスセグメンテーションに重点を置いており、共同作業を行うためのディープネットワークのシーケンスに依存している。
この戦略により、データに埋め込まれた階層的な情報の使用が妨げられ、エラーの蓄積とアノテーションと計算コストの増大が実現し、現実世界のアプリケーションのスケーラビリティが制限される。
本研究では,データ生成のためのReal2Sim L-TreeGenと,P2TBタスク用に設計されたジョイントモデル(J-P2TB)を組み込んだ新しい手法を提案する。
生成したシミュレーションデータセットに基づいてトレーニングされたJ-P2TBモデルは、ゼロショット学習を通じて現実世界のパネルポイントクラウドのジョイントセグメンテーションに使用された。
代表的な手法と比較して,我々のモデルは,学習可能なパラメータを40%減らしながら,ほとんどのセグメンテーション指標よりも優れていた。
このSim2Realの結果は、モデルトレーニングにおけるL-TreeGenの有効性とジョイントセグメンテーションにおけるJ-P2TBの性能を強調し、その強力な精度、効率、現実のアプリケーションに対する一般化性を示した。
これらの改良は、自動果樹園作業のためのロボットの開発に大きく貢献するだけでなく、デジタルツイン技術の進歩にも寄与した。
関連論文リスト
- Tree-NET: Enhancing Medical Image Segmentation Through Efficient Low-Level Feature Training [0.0]
本稿では,医療画像セグメンテーションのための新しいフレームワークであるTree-NETを紹介する。
Tree-NETは、セグメンテーション精度と計算効率の両方を向上させるためにボトルネック機能監視を使用する。
実験の結果、Tree-NETはFLOPを4倍から13倍に減らし、メモリ使用量を減らし、元のものと同等または優れた精度を実現していることがわかった。
論文 参考訳(メタデータ) (2025-01-03T23:17:01Z) - Efficiently Expanding Receptive Fields: Local Split Attention and Parallel Aggregation for Enhanced Large-scale Point Cloud Semantic Segmentation [7.199090922071512]
本研究では,複数の局所分割操作を通じて受容領域を効果的に拡張するLSAP機構を提案する。
本研究では,大規模クラウドセマンティックセマンティックセグメンテーションのための新しいフレームワークLSNetを提案する。
LSNetは3つのベンチマークデータセット上の最先端セマンティックセグメンテーションネットワークよりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-09-03T07:10:20Z) - MPruner: Optimizing Neural Network Size with CKA-Based Mutual Information Pruning [7.262751938473306]
プルーニング(Pruning)は、ニューラルネットワークのサイズを減らし、数学的に精度の保存を保証している、よく確立されたテクニックである。
我々は,ベクトル類似性により相互情報を活用する新しいプルーニングアルゴリズムMPrunerを開発した。
MPrunerはCNNとトランスフォーマーベースのモデルで最大50%のパラメータとメモリ使用量の削減を実現した。
論文 参考訳(メタデータ) (2024-08-24T05:54:47Z) - Interactive Segmentation as Gaussian Process Classification [58.44673380545409]
クリックベースのインタラクティブセグメンテーション(IS)は、ユーザインタラクション下で対象オブジェクトを抽出することを目的としている。
現在のディープラーニング(DL)ベースの手法のほとんどは、主にセマンティックセグメンテーションの一般的なパイプラインに従っている。
本稿では,各画像上でガウス過程(GP)に基づく画素単位のバイナリ分類モデルとしてISタスクを定式化することを提案する。
論文 参考訳(メタデータ) (2023-02-28T14:01:01Z) - Unseen Object Instance Segmentation with Fully Test-time RGB-D
Embeddings Adaptation [14.258456366985444]
最近では、大規模な合成データのRGB-D機能を活用し、実世界のシナリオにモデルを適用するのが一般的である。
本稿では,Sim2Realドメイン間の適応プロセスを再強調する。
本稿では,BatchNorm層のパラメータに基づいて,完全テスト時間RGB-D埋め込み適応(FTEA)を行うフレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-21T02:35:20Z) - DANCE: DAta-Network Co-optimization for Efficient Segmentation Model
Training and Inference [85.02494022662505]
DANCEは、効率的なセグメンテーションモデルのトレーニングと推論のための自動データネットワーク協調最適化である。
入力イメージを適応的にダウンサンプル/ドロップする自動データスライミングを統合し、画像の空間的複雑さによって導かれるトレーニング損失に対するそれに対応するコントリビューションを制御する。
実験と非難研究により、DANCEは効率的なセグメンテーションに向けて「オールウィン」を達成できることを示した。
論文 参考訳(メタデータ) (2021-07-16T04:58:58Z) - Boundary-Aware Segmentation Network for Mobile and Web Applications [60.815545591314915]
境界認識ネットワーク(basnet)は、精度の高い画像分割のための予測再定義アーキテクチャとハイブリッド損失と統合されている。
basnetは単一のgpu上で70fps以上動作し、多くの潜在的なアプリケーションが利用できる。
BASNetをベースに、BASNetが「COPY」と「PASTING」現実世界のオブジェクトのための拡張現実であるAR COPY & PASTEと、オブジェクト背景の自動削除のためのWebベースのツールであるOBJECT CUTの2つの(近い)商用アプリケーションをさらに開発しました。
論文 参考訳(メタデータ) (2021-01-12T19:20:26Z) - LiDAR-based Panoptic Segmentation via Dynamic Shifting Network [56.71765153629892]
LiDARベースのパノプティカルセグメンテーションは、オブジェクトとシーンを統一的に解析することを目的としている。
本稿では,ポイントクラウド領域における効果的な単視分割フレームワークとして機能する動的シフトネットワーク(DS-Net)を提案する。
提案するDS-Netは,現在の最先端手法よりも優れた精度を実現する。
論文 参考訳(メタデータ) (2020-11-24T08:44:46Z) - Binary DAD-Net: Binarized Driveable Area Detection Network for
Autonomous Driving [94.40107679615618]
本稿では,二項化駆動型領域検出ネットワーク(バイナリDAD-Net)を提案する。
エンコーダ、ボトルネック、デコーダ部分の2重みとアクティベーションのみを使用する。
パブリックデータセット上で、最先端のセマンティックセグメンテーションネットワークより優れています。
論文 参考訳(メタデータ) (2020-06-15T07:09:01Z) - Joint Parameter-and-Bandwidth Allocation for Improving the Efficiency of
Partitioned Edge Learning [73.82875010696849]
機械学習アルゴリズムは、人工知能(AI)モデルをトレーニングするために、ネットワークエッジにデプロイされる。
本稿では,パラメータ(計算負荷)割り当てと帯域幅割り当ての新しい共同設計に焦点を当てる。
論文 参考訳(メタデータ) (2020-03-10T05:52:15Z) - Online Binary Space Partitioning Forests [20.724541655214587]
BSP-Tree(Binary Space Partitioning-Tree)プロセスは空間分割タスクの効率的な戦略として提案されている。
バッチ学習設定のため、BSP-Tree Processは大規模分類や回帰問題には適していない。
この制限に対処するオンラインBSP-Forestフレームワークを開発した。
論文 参考訳(メタデータ) (2020-02-29T14:35:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。