論文の概要: Resolving Primitive-Sharing Ambiguity in Long-Tailed Industrial Point Cloud Segmentation via Spatial Context Constraints
- arxiv url: http://arxiv.org/abs/2601.19128v1
- Date: Tue, 27 Jan 2026 02:52:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-28 15:26:51.144326
- Title: Resolving Primitive-Sharing Ambiguity in Long-Tailed Industrial Point Cloud Segmentation via Spatial Context Constraints
- Title(参考訳): 空間的制約による長周期産業点雲分割における原始共有の曖昧さの解消
- Authors: Chao Yin, Qing Han, Zhiwei Hou, Yue Liu, Anjin Dai, Hongda Hu, Ji Yang, Wei Yao,
- Abstract要約: リデューサやバルブなどの安全クリティカルなコンポーネントは、体系的に誤って分類される。
この研究は、工業用3Dデータに特有の2つの危機を、極端に不均衡な215:1比で特定する。
本研究では,局所的な類似構造を曖昧にするために,近傍の予測整合性を利用する空間的文脈制約を提案する。
- 参考スコア(独自算出の注目度): 9.6402526621774
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Industrial point cloud segmentation for Digital Twin construction faces a persistent challenge: safety-critical components such as reducers and valves are systematically misclassified. These failures stem from two compounding factors: such components are rare in training data, yet they share identical local geometry with dominant structures like pipes. This work identifies a dual crisis unique to industrial 3D data extreme class imbalance 215:1 ratio compounded by geometric ambiguity where most tail classes share cylindrical primitives with head classes. Existing frequency-based re-weighting methods address statistical imbalance but cannot resolve geometric ambiguity. We propose spatial context constraints that leverage neighborhood prediction consistency to disambiguate locally similar structures. Our approach extends the Class-Balanced (CB) Loss framework with two architecture-agnostic mechanisms: (1) Boundary-CB, an entropy-based constraint that emphasizes ambiguous boundaries, and (2) Density-CB, a density-based constraint that compensates for scan-dependent variations. Both integrate as plug-and-play modules without network modifications, requiring only loss function replacement. On the Industrial3D dataset (610M points from water treatment facilities), our method achieves 55.74% mIoU with 21.7% relative improvement on tail-class performance (29.59% vs. 24.32% baseline) while preserving head-class accuracy (88.14%). Components with primitive-sharing ambiguity show dramatic gains: reducer improves from 0% to 21.12% IoU; valve improves by 24.3% relative. This resolves geometric ambiguity without the typical head-tail trade-off, enabling reliable identification of safety-critical components for automated knowledge extraction in Digital Twin applications.
- Abstract(参考訳): デジタルツイン構築のための産業点雲のセグメンテーションは永続的な課題に直面している。
これらの故障は、これらの成分は訓練データでは稀であるが、パイプのような支配的な構造と同一の局所幾何学を共有している。
この研究は、工業用3Dデータに特有の二重危機を、ほとんどの尾級が円筒型プリミティブをヘッドクラスと共有する幾何学的あいまいさで合成した215:1比で特定する。
既存の周波数ベースの再重み付け手法は統計的不均衡に対処するが、幾何学的曖昧さは解決できない。
本研究では,局所的な類似構造を曖昧にするために,近傍の予測整合性を利用する空間的文脈制約を提案する。
本手法は,(1)曖昧な境界を強調するエントロピーベースの制約であるBundary-CBと,(2)スキャン依存の変動を補償する密度ベースの制約であるIndentity-CBという,アーキテクチャに依存しない2つのメカニズムを用いて,クラスベース(CB)ロスフレームワークを拡張した。
どちらのモジュールもネットワーク変更なしにプラグイン・アンド・プレイモジュールとして統合され、損失関数の置き換えが要求される。
産業用3Dデータセット(水処理施設から610万ポイント)では55.74% mIoU を達成し,21.7% でテールクラスの性能(29.59% 対 24.32% ベースライン)を向上し,ヘッドクラスの精度(88.14%)を維持した。
リデューサは0%から21.12%に改善され、バルブは24.3%向上した。
これにより、典型的なヘッドテールトレードオフなしに幾何学的曖昧さを解消し、Digital Twinアプリケーションにおける自動知識抽出のための安全クリティカルなコンポーネントの信頼性の高い識別を可能にする。
関連論文リスト
- Anatomy Aware Cascade Network: Bridging Epistemic Uncertainty and Geometric Manifold for 3D Tooth Segmentation [13.650721192161079]
境界のあいまいさを解消し,グローバルな構造的整合性を維持するために,AACNet(Anatomy Aware Cascade Network)を提案する。
AACNetは90.17 %のDice類似度係数と95%のHausdorff Distanceの3.63 mmを実現し,最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2026-01-12T12:53:27Z) - 3D-ANC: Adaptive Neural Collapse for Robust 3D Point Cloud Recognition [21.95358957900039]
3D-ANCはニューラル・コラプス(NC)機構を利用して識別的特徴学習を編成する手法である。
3D-ANCは2つのデータセット上の様々な構造を持つモデルのロバスト性を大幅に改善することを示す。
論文 参考訳(メタデータ) (2025-11-10T12:37:00Z) - Urban 3D Change Detection Using LiDAR Sensor for HD Map Maintenance and Smart Mobility [26.712098856567888]
都市規模LiDARのための物体中心型不確実性認識パイプラインを提案する。
これはエポックを多分解能NDTと整列し、次に点対平面ICP、高さを正規化し、位置検出レベルを導出する。
15代表のスービアコでは95.2%の精度、90.4%のmF1、82.6%のmIoUがトリプルトKPConvを超える精度、0.2のmF1、0.8のmIoUがブロックされ、IoUが74.8%に達し、7.6ポイント改善された。
論文 参考訳(メタデータ) (2025-10-24T02:59:55Z) - A Multimodal Approach to Heritage Preservation in the Context of Climate Change [0.0]
本稿では,センサデータ(温度,湿度)と視覚画像とを融合させて,遺産の重症度を予測する軽量なマルチモーダルアーキテクチャを提案する。
ストラスブール大聖堂からのデータでは、標準的なマルチモーダルアーキテクチャよりも43%向上した76.9%のアクク・レシーを達成した。
論文 参考訳(メタデータ) (2025-10-15T22:07:57Z) - Class Anchor Margin Loss for Content-Based Image Retrieval [97.81742911657497]
距離学習パラダイムに該当する新しいレペラ・トラクタ損失を提案するが、ペアを生成する必要がなく、直接L2メトリックに最適化する。
CBIRタスクにおいて,畳み込みアーキテクチャと変圧器アーキテクチャの両方を用いて,少数ショットおよびフルセットトレーニングの文脈で提案した目的を評価する。
論文 参考訳(メタデータ) (2023-06-01T12:53:10Z) - Label Distributionally Robust Losses for Multi-class Classification:
Consistency, Robustness and Adaptivity [55.29408396918968]
多クラス分類のためのラベル分布ロバスト(LDR)損失という損失関数群について検討した。
我々の貢献は、多クラス分類のためのLDR損失のトップ$kの一貫性を確立することによって、一貫性と堅牢性の両方を含んでいる。
本稿では,各インスタンスのクラスラベルの雑音度に個別化温度パラメータを自動的に適応させる適応型LDR損失を提案する。
論文 参考訳(メタデータ) (2021-12-30T00:27:30Z) - Generalizing electrocardiogram delineation: training convolutional
neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。
まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。
第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文 参考訳(メタデータ) (2021-11-25T10:11:41Z) - SAR-U-Net: squeeze-and-excitation block and atrous spatial pyramid
pooling based residual U-Net for automatic liver CT segmentation [3.192503074844775]
Squeeze-and-Excitation(SE)ブロック,Atrous Space Pyramid Pooling(ASPP),Resternal Learningといったテクニックを活用した,U-Netベースのフレームワークが提案されている。
提案手法の有効性を2つの公開データセットLiTS17とSLiver07で検証した。
論文 参考訳(メタデータ) (2021-03-11T02:32:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。