論文の概要: Progressive Per-Branch Depth Optimization for DEFOM-Stereo and SAM3 Joint Analysis in UAV Forestry Applications
- arxiv url: http://arxiv.org/abs/2602.20539v1
- Date: Tue, 24 Feb 2026 04:37:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.602877
- Title: Progressive Per-Branch Depth Optimization for DEFOM-Stereo and SAM3 Joint Analysis in UAV Forestry Applications
- Title(参考訳): DEFOM-StereoとSAM3連成解析のためのUAV森林分野のプログレッシブパーブランチ深さ最適化
- Authors: Yida Lin, Bing Xue, Mengjie Zhang, Sam Schofield, Richard Green,
- Abstract要約: パーブランチ3D再構築は、自律型UAV木刈りの前提条件である。
本稿では,DEFOM-Stereo ファンデーションモデル差分推定を組み込んだプログレッシブパイプラインを提案する。
提案したパイプラインは、エッジの忠実度を維持しながら、ブランチごとの平均標準偏差を82%削減する。
- 参考スコア(独自算出の注目度): 5.266753902938501
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate per-branch 3D reconstruction is a prerequisite for autonomous UAV-based tree pruning; however, dense disparity maps from modern stereo matchers often remain too noisy for individual branch analysis in complex forest canopies. This paper introduces a progressive pipeline integrating DEFOM-Stereo foundation-model disparity estimation, SAM3 instance segmentation, and multi-stage depth optimization to deliver robust per-branch point clouds. Starting from a naive baseline, we systematically identify and resolve three error families through successive refinements. Mask boundary contamination is first addressed through morphological erosion and subsequently refined via a skeleton-preserving variant to safeguard thin-branch topology. Segmentation inaccuracy is then mitigated using LAB-space Mahalanobis color validation coupled with cross-branch overlap arbitration. Finally, depth noise - the most persistent error source - is initially reduced by outlier removal and median filtering, before being superseded by a robust five-stage scheme comprising MAD global detection, spatial density consensus, local MAD filtering, RGB-guided filtering, and adaptive bilateral filtering. Evaluated on 1920x1080 stereo imagery of Radiata pine (Pinus radiata) acquired with a ZED Mini camera (63 mm baseline) from a UAV in Canterbury, New Zealand, the proposed pipeline reduces the average per-branch depth standard deviation by 82% while retaining edge fidelity. The result is geometrically coherent 3D point clouds suitable for autonomous pruning tool positioning. All code and processed data are publicly released to facilitate further UAV forestry research.
- Abstract(参考訳): 枝1本3Dの正確な再構築は、自律的なUAVベースの樹木刈り付けの前提条件であるが、複雑な森林の樹冠における個々の枝解析において、現代のステレオマターからの密集した不均一性マップは、しばしばうるさく残されている。
本稿では, DEFOM-Stereo Foundation-Stereo foundation-model disparity Estimation, SAM3 instance segmentation, および多段深度最適化を統合したプログレッシブパイプラインを提案する。
まず,3つの誤り系列を系統的に同定し,解決する。
マスク境界汚染は、まず形態的侵食によって対処され、その後、スケルトン保存の変種を通じて精製され、薄いブランチトポロジーを保護する。
分割不正確性は、LAB空間マハラノビス色検証とクロスブランチ重なりの仲裁により緩和される。
最後に、デプスノイズ(最も永続的な誤差源)は、最初に外周除去と中央値フィルタリングによって低減され、その後、MADグローバル検出、空間密度のコンセンサス、局所MADフィルタリング、RGB誘導フィルタリング、適応二段フィルタリングを含む堅牢な5段階のスキームに取って代わられる。
ニュージーランドのカンタベリーのUAVからZED Miniカメラ(63mmベースライン)で取得したRadiata pine(Pinus Rada)の1920×1080ステレオ画像に基づいて、提案パイプラインは、エッジの忠実さを維持しながら、ブランチ毎の標準偏差を平均82%削減する。
結果は、自律的なプルーニングツールの位置決めに適した幾何学的にコヒーレントな3D点雲である。
すべてのコードと処理されたデータは、さらなるUAV林業研究を促進するために公開されている。
関連論文リスト
- Cross-Modal Alignment and Fusion for RGB-D Transmission-Line Defect Detection [11.637942429146172]
本稿では,RGBの外観と深度幾何学を原理化されたヒューズ・パラダイムを通じて統合したクロスモーダルアライメント・アンド・フュージョン・ネットワークであるCMAFNetを提案する。
CMAFNetは、辞書ベースの特徴浄化を行うセマンティック再構成モジュールで構成されている。
軽量な派生型は228 FPSで24.8% mAP50に達し、わずか4.9Mのパラメータしか持たない。
論文 参考訳(メタデータ) (2026-02-02T06:11:33Z) - D3R-Net: Dual-Domain Denoising Reconstruction Network for Robust Industrial Anomaly Detection [0.0]
非教師付き異常検出(UAD)は、現代の製造において、自動視覚検査の鍵となる要素である。
本稿では、D3R-Netについて紹介する。D3R-Netは、自己教師型「癒し」タスクと周波数認識正規化を結合したデュアルドメイン・デノベーション・コンストラクションフレームワークである。
空間平均二乗誤差に加えて、周波数領域の整合性を促進するFast Fourier Transform (FFT) 等級損失を用いる。
論文 参考訳(メタデータ) (2026-01-27T23:21:59Z) - Unified Unsupervised Anomaly Detection via Matching Cost Filtering [113.43366521994396]
教師なし異常検出(UAD)は、通常のトレーニングデータのみを用いて画像レベルの異常と画素レベルの異常を識別することを目的としている。
UADモデルの異常コスト量を補正するための汎用的なポストホック精錬フレームワークであるUnified Cost Filtering (UCF) を提案する。
論文 参考訳(メタデータ) (2025-10-03T03:28:18Z) - A Novel Preprocessing Unit for Effective Deep Learning based Classification and Grading of Diabetic Retinopathy [0.0]
本研究は,糖尿病網膜症を早期に検出するための枠組みである。
フレームワークには前処理、セグメンテーション、特徴抽出、分類の3段階が含まれている。
提案手法の有効性は,IDRiDとMESSIDORの2つの異なるデータセットを用いて評価する。
論文 参考訳(メタデータ) (2025-09-29T09:11:04Z) - Data-Driven Reconstruction of Significant Wave Heights from Sparse Observations [3.356199201143573]
マルチスケールU-NetとMLPを融合したハイブリッドディープラーニングフレームワークであるAUWaveを紹介する。
データリッチな構成において、AUWaveが代表的ベースラインを一貫して上回ることを示す。
アーキテクチャのマルチスケールおよびアテンションコンポーネントは、最小でも非自明な空間アンカーが利用できる場合、精度が向上する。
論文 参考訳(メタデータ) (2025-09-21T14:12:28Z) - CostFilter-AD: Enhancing Anomaly Detection through Matching Cost Filtering [64.24198178156627]
非教師付き異常検出(UAD)は、通常のサンプルに対して入力画像の異常マスクをローカライズしようとする。
古典的マッチングタスクから借用したコストフィルタリングの概念をUAD問題に導入する。
本稿では,複数の特徴層にまたがるアテンションクエリとして,入力観測によって導かれるコストボリュームフィルタリングネットワークを提案する。
論文 参考訳(メタデータ) (2025-05-02T14:52:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。