論文の概要: Enhancing Construction Site Analysis and Understanding with 3D Segmentation
- arxiv url: http://arxiv.org/abs/2508.05922v1
- Date: Fri, 08 Aug 2025 00:57:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-11 20:39:06.041006
- Title: Enhancing Construction Site Analysis and Understanding with 3D Segmentation
- Title(参考訳): 3次元セグメンテーションによる建設現場の分析と理解の促進
- Authors: Sri Ramana Saketh Vasanthawada, Pengkun Liu, Pingbo Tang,
- Abstract要約: 本稿では,2つの高度な3Dセグメンテーション手法であるSAMとMask3Dの屋外および屋内環境への応用を批判的に評価する。
- 参考スコア(独自算出の注目度): 1.9662978733004601
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Monitoring construction progress is crucial yet resource-intensive, prompting the exploration of computer-vision-based methodologies for enhanced efficiency and scalability. Traditional data acquisition methods, primarily focusing on indoor environments, falter in construction site's complex, cluttered, and dynamically changing conditions. This paper critically evaluates the application of two advanced 3D segmentation methods, Segment Anything Model (SAM) and Mask3D, in challenging outdoor and indoor conditions. Trained initially on indoor datasets, both models' adaptability and performance are assessed in real-world construction settings, highlighting the gap in current segmentation approaches due to the absence of benchmarks for outdoor scenarios. Through a comparative analysis, this study not only showcases the relative effectiveness of SAM and Mask3D but also addresses the critical need for tailored segmentation workflows capable of extracting actionable insights from construction site data, thereby advancing the field towards more automated and precise monitoring techniques.
- Abstract(参考訳): 建設の進捗のモニタリングは極めて重要でありながら資源集約であり、効率と拡張性を向上させるコンピュータビジョンベースの方法論の探索を促している。
伝統的なデータ取得手法は、主に屋内環境に焦点を当て、建設現場の複雑で散らばり、動的に変化する条件に固執する。
本稿では,2つの高度な3Dセグメンテーション手法であるSAMとMask3Dの屋外および屋内環境への応用を批判的に評価する。
当初、屋内データセットに基づいてトレーニングされ、実際の構築環境でモデルの適応性とパフォーマンスが評価され、屋外シナリオのベンチマークがないため、現在のセグメンテーションアプローチのギャップが強調される。
本研究は, SAMとMask3Dの相対的有効性を示すだけでなく, 建設現場データから実行可能な洞察を抽出し, より自動化された, 精密なモニタリング技術に向けて, 現場を前進させることが可能なセグメンテーションワークフローの整備の必要性に対処するものである。
関連論文リスト
- Methods for the Segmentation of Reticular Structures Using 3D LiDAR Data: A Comparative Evaluation [0.0]
垂直構造は、橋、パイロン、空港などの主要なインフラのバックボーンを形成するが、検査とメンテナンスは費用がかかり危険である。
本研究では、トラス構造物の航行可能な表面を検知し、登山ロボットの自律性を向上する手法を提案する。
論文 参考訳(メタデータ) (2025-07-28T07:55:26Z) - Topology-Aware Modeling for Unsupervised Simulation-to-Reality Point Cloud Recognition [63.55828203989405]
我々はオブジェクトポイントクラウド上でSim2Real UDAのための新しいTopology-Aware Modeling (TAM)フレームワークを紹介する。
提案手法は,低レベルの高周波3次元構造を特徴とするグローバル空間トポロジを利用して,領域間隙を緩和する。
本稿では,クロスドメイン・コントラスト学習と自己学習を組み合わせた高度な自己学習戦略を提案する。
論文 参考訳(メタデータ) (2025-06-26T11:53:59Z) - Enhancing Human-Robot Collaboration: A Sim2Real Domain Adaptation Algorithm for Point Cloud Segmentation in Industrial Environments [6.250798517067454]
本稿では、3DポイントクラウドデータのセマンティックセマンティックセグメンテーションのためのSim2Realドメイン適応における先駆的アプローチについて紹介する。
我々の焦点は、シミュレーション環境から実世界のアプリケーションへ堅牢に移行し、実用性と安全なHRCへの影響を高めるネットワークの開発である。
提案手法は実世界のHRCセットアップと産業用点雲のシミュレーションにより評価され, 最先端性能の向上, セグメンテーション精度97.76%, 既存手法に比べて堅牢性に優れていた。
論文 参考訳(メタデータ) (2025-06-11T09:36:07Z) - ZISVFM: Zero-Shot Object Instance Segmentation in Indoor Robotic Environments with Vision Foundation Models [10.858627659431928]
サービスロボットは、機能を強化するために、未知のオブジェクトを効果的に認識し、セグメント化する必要がある。
従来の教師付き学習ベースのセグメンテーション技術は、広範な注釈付きデータセットを必要とする。
本稿では,セグメンテーションアプライスモデル (SAM) の強力なゼロショット能力と,自己監督型視覚変換器 (ViT) からの明示的な視覚表現を活用することで,UOISを解く新しいアプローチ (ZISVFM) を提案する。
論文 参考訳(メタデータ) (2025-02-05T15:22:20Z) - 3D-CDRGP: Towards Cross-Device Robotic Grasping Policy in 3D Open World [20.406334587479623]
デバイス間の研究は緊急の課題となり、取り組まなければならない。
私たちは、3Dオープンワールドにおけるクロスデバイス(カメラとロボティクス)の把握政策の先駆者です。
SSGC-Segモジュールは,カテゴリに依存しない3Dオブジェクト検出を可能にする。
論文 参考訳(メタデータ) (2024-11-27T08:23:28Z) - Mixed Diffusion for 3D Indoor Scene Synthesis [55.94569112629208]
提案するMiDiffusionは,可塑性3次元屋内シーンを合成するための混合離散連続拡散モデルである。
床条件の3次元シーン合成において,最先端の自己回帰モデルおよび拡散モデルより優れることを示す。
論文 参考訳(メタデータ) (2024-05-31T17:54:52Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - Multi-body SE(3) Equivariance for Unsupervised Rigid Segmentation and
Motion Estimation [49.56131393810713]
本稿では、SE(3)同変アーキテクチャと、この課題に教師なしで取り組むためのトレーニング戦略を提案する。
本手法は,0.25Mパラメータと0.92G FLOPを用いて,モデル性能と計算効率を両立させる。
論文 参考訳(メタデータ) (2023-06-08T22:55:32Z) - Unsupervised Domain Adaptation for Spatio-Temporal Action Localization [69.12982544509427]
S時間動作の局所化はコンピュータビジョンにおいて重要な問題である。
本稿では、エンドツーエンドの教師なしドメイン適応アルゴリズムを提案する。
空間的特徴と時間的特徴を別々にあるいは共同的に適応した場合に,顕著な性能向上が達成できることを示す。
論文 参考訳(メタデータ) (2020-10-19T04:25:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。