論文の概要: InfraDiffusion: zero-shot depth map restoration with diffusion models and prompted segmentation from sparse infrastructure point clouds
- arxiv url: http://arxiv.org/abs/2509.03324v1
- Date: Wed, 03 Sep 2025 14:01:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 21:40:46.539806
- Title: InfraDiffusion: zero-shot depth map restoration with diffusion models and prompted segmentation from sparse infrastructure point clouds
- Title(参考訳): InfraDiffusion:拡散モデルによるゼロショット深度マップの復元とスパース・インフラストラクチャ・ポイント・クラウドからのセグメンテーション
- Authors: Yixiong Jing, Cheng Zhang, Haibing Wu, Guangming Wang, Olaf Wysocki, Brian Sheil,
- Abstract要約: InfraDiffusionは、仮想カメラを用いて石英点雲を深度マップに投影し、Denoising Diffusion Null-space Model (DDNM)を適用してそれらを復元するフレームワークである。
Segment Anything Model (SAM) を用いた橋梁とトンネル点クラウドデータセットの実験により,ブロックレベルセグメンテーションの大幅な改善が示された。
- 参考スコア(独自算出の注目度): 11.219667604269036
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Point clouds are widely used for infrastructure monitoring by providing geometric information, where segmentation is required for downstream tasks such as defect detection. Existing research has automated semantic segmentation of structural components, while brick-level segmentation (identifying defects such as spalling and mortar loss) has been primarily conducted from RGB images. However, acquiring high-resolution images is impractical in low-light environments like masonry tunnels. Point clouds, though robust to dim lighting, are typically unstructured, sparse, and noisy, limiting fine-grained segmentation. We present InfraDiffusion, a zero-shot framework that projects masonry point clouds into depth maps using virtual cameras and restores them by adapting the Denoising Diffusion Null-space Model (DDNM). Without task-specific training, InfraDiffusion enhances visual clarity and geometric consistency of depth maps. Experiments on masonry bridge and tunnel point cloud datasets show significant improvements in brick-level segmentation using the Segment Anything Model (SAM), underscoring its potential for automated inspection of masonry assets. Our code and data is available at https://github.com/Jingyixiong/InfraDiffusion-official-implement.
- Abstract(参考訳): ポイントクラウドは、欠陥検出などの下流タスクにセグメンテーションを必要とする幾何学的情報を提供することによって、インフラストラクチャ監視に広く利用されている。
既存の研究では構造成分の自動セマンティックセグメンテーションが実施されているが、ブロックレベルのセグメンテーション(スポーリングやモルタルロスなどの欠陥を識別する)は主にRGB画像から行われている。
しかし、石英トンネルのような低照度環境では、高解像度画像の取得は不可能である。
点雲は、薄暗い光に対して頑丈であるが、通常は非構造的で、疎らで、ノイズが多く、きめ細かいセグメンテーションを制限している。
InfraDiffusionは、仮想カメラを用いて石英点雲を深度マップに投影し、Denoising Diffusion Null-space Model (DDNM)を適用してそれらを復元するゼロショットフレームワークである。
タスク固有のトレーニングがなければ、InfraDiffusionは深度マップの視覚的明瞭度と幾何学的一貫性を高める。
石英橋とトンネル点クラウドデータセットの実験は、石英資産の自動検査の可能性を示すSAM(Segment Anything Model)を用いて、レンガレベルセグメンテーションを著しく改善したことを示している。
私たちのコードとデータはhttps://github.com/Jingyixiong/InfraDiffusion-official-implement.comで公開されています。
関連論文リスト
- Mapping Semantic Segmentation to Point Clouds Using Structure from Motion for Forest Analysis [0.0]
本研究では,森林環境のセマンティックな分節点雲を生成するための新しいパイプラインを提案する。
多様な森林景観のリアルなRGB画像とそれに対応するセマンティックセグメンテーションマスクを生成する。
結果として得られるポイントクラウドは、幾何学的および意味的な詳細の両方を提供し、ディープラーニングモデルをトレーニングし評価するための貴重なリソースを提供する。
論文 参考訳(メタデータ) (2025-05-15T23:34:55Z) - BreakNet: Discontinuity-Resilient Multi-Scale Transformer Segmentation of Retinal Layers [0.8953337264557399]
BreakNetは、シャドーアーティファクトによる境界の不連続に対処するために設計されたトランスフォーマーベースのセグメンテーションモデルである。
以上の結果から,BreakNetは網膜の定量化と解析を大幅に改善する可能性が示唆された。
論文 参考訳(メタデータ) (2024-08-26T19:59:20Z) - DiffCut: Catalyzing Zero-Shot Semantic Segmentation with Diffusion Features and Recursive Normalized Cut [62.63481844384229]
ファンデーションモデルは、言語、ビジョン、マルチモーダルタスクなど、さまざまな領域にまたがる強力なツールとして登場した。
本稿では,拡散UNetエンコーダを基礎ビジョンエンコーダとして使用し,教師なしゼロショットセグメンテーション手法であるDiffCutを紹介する。
我々の研究は、拡散UNetエンコーダに埋め込まれた極めて正確なセマンティック知識を強調し、下流タスクの基盤ビジョンエンコーダとして機能する。
論文 参考訳(メタデータ) (2024-06-05T01:32:31Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Lidar Annotation Is All You Need [0.0]
本稿では,畳み込みニューラルネットワークを用いたマルチセンサ構成による画像分割の効率向上を目的とする。
当社のアプローチにおける重要な革新は、点雲からの粗い接地トラスマスクに対処する、マスク付き損失である。
ベンチマークデータセットに対するアプローチの実験的検証は、高品質の画像セグメンテーションモデルに匹敵する性能を示す。
論文 参考訳(メタデータ) (2023-11-08T15:55:18Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - Shrinking unit: a Graph Convolution-Based Unit for CNN-like 3D Point
Cloud Feature Extractors [0.0]
我々は、画像領域からのインスピレーションの欠如が、そのようなギャップの主な原因であると主張している。
我々は,CNNのような3Dポイント・クラウド特徴抽出器の設計のために,Shrinkingユニットと呼ばれるグラフ畳み込み単位を提案する。
論文 参考訳(メタデータ) (2022-09-26T15:28:31Z) - NeRF-SOS: Any-View Self-supervised Object Segmentation from Complex
Real-World Scenes [80.59831861186227]
本論文では,複雑な現実世界のシーンに対して,NeRFを用いたオブジェクトセグメンテーションのための自己教師型学習の探索を行う。
我々のフレームワークは、NeRF(NeRF with Self-supervised Object NeRF-SOS)と呼ばれ、NeRFモデルがコンパクトな幾何認識セグメンテーションクラスタを蒸留することを奨励している。
他の2Dベースの自己教師付きベースラインを一貫して上回り、既存の教師付きマスクよりも細かなセマンティクスマスクを予測する。
論文 参考訳(メタデータ) (2022-09-19T06:03:17Z) - CP-Net: Contour-Perturbed Reconstruction Network for Self-Supervised
Point Cloud Learning [53.1436669083784]
本稿では,CP-Net(Contour-Perturbed Restruction Network)を提案する。
分類では、ModelNet40(92.5%の精度)とScanObjectNN(87.9%の精度)の完全教師付き手法で競合する結果を得る。
論文 参考訳(メタデータ) (2022-01-20T15:04:12Z) - GRNet: Gridding Residual Network for Dense Point Cloud Completion [54.43648460932248]
完全な3Dポイントクラウドを不完全なクラウドから推定することは、多くのビジョンやロボティクスアプリケーションにおいて重要な問題である。
本稿では,ポイントクラウド補完のための新しいGridding Residual Network(GRNet)を提案する。
実験結果から,提案したGRNetはShapeNet,Completion3D,KITTIベンチマークの最先端手法に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2020-06-06T02:46:39Z) - Multi-scale Cloud Detection in Remote Sensing Images using a Dual
Convolutional Neural Network [4.812718493682455]
CNNは、リモートセンシング画像のピクセルレベルの分類において、最先端の技術を進歩させた。
アンサンプとフル解像度の画像を逐次処理する2つのCNNモデルコンポーネントのアーキテクチャを提案する。
パッチによるCNNベースラインの画素精度は16%向上した。
論文 参考訳(メタデータ) (2020-06-01T10:27:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。