論文の概要: Positioning radiata pine branches requiring pruning by drone stereo vision
- arxiv url: http://arxiv.org/abs/2604.16480v1
- Date: Sun, 12 Apr 2026 10:10:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.014052
- Title: Positioning radiata pine branches requiring pruning by drone stereo vision
- Title(参考訳): ドローンステレオビジョンによる刈り込みを必要とするラジダ松葉の位置決め
- Authors: Yida Lin, Bing Xue, Mengjie Zhang, Sam Schofield, Richard Green,
- Abstract要約: 本稿では,自律的な刈取を支援するために,ドローンに搭載された立体視システムについて述べる。
セグメンテーションでは、YOLOv8、YOLOv9、Mask R-CNNのバリエーションを、ZED Miniカメラでキャプチャされた71のステレオ画像ペアのカスタムデータセットと比較する。
深度推定には、従来の手法(WLSフィルタ付きSGBM)とディープラーニングに基づく手法の両方を評価する。
セグメンテーションマスクと不均一マップから分岐距離を計算するために,MAD外乱除去を用いたセントロイド型三角法を提案する。
- 参考スコア(独自算出の注目度): 5.266753902938501
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a stereo-vision-based system mounted on a drone for detecting and localising radiata pine branches to support autonomous pruning. The proposed pipeline comprises two stages: branch segmentation and depth estimation. For segmentation, YOLOv8, YOLOv9, and Mask R-CNN variants are compared on a custom dataset of 71 stereo image pairs captured with a ZED Mini camera. For depth estimation, both a traditional method (SGBM with WLS filtering) and deep-learning-based methods (PSMNet, ACVNet, GWCNet, MobileStereoNet, RAFT-Stereo, and NeRF-Supervised Deep Stereo) are evaluated. A centroid-based triangulation algorithm with MAD outlier rejection is proposed to compute branch distance from the segmentation mask and disparity map. Qualitative evaluation at distances of 1-2 m indicates that the deep learning-based disparity maps produce more coherent depth estimates than SGBM, demonstrating the feasibility of low-cost stereo vision for automated branch positioning in forestry.
- Abstract(参考訳): 本稿では,自律的な刈取を支援するために,ドローンに搭載された立体視システムについて述べる。
提案パイプラインは分岐分割と深さ推定の2段階からなる。
セグメンテーションでは、YOLOv8、YOLOv9、Mask R-CNNのバリエーションを、ZED Miniカメラでキャプチャされた71のステレオ画像ペアのカスタムデータセットと比較する。
深度推定には,従来の手法(WLSフィルタ付きSGBM)と深度学習に基づく手法(PSMNet, ACVNet, GWCNet, MobileStereoNet, RAFT-Stereo, NeRF-Supervised Deep Stereo)の両方を評価する。
セグメンテーションマスクと不均一マップから分岐距離を計算するために,MAD外乱除去を用いたセントロイド型三角法を提案する。
1-2m距離での定性的評価は,深層学習に基づく不均一度マップの方がSGBMよりもコヒーレントな深度推定値が得られることを示唆し,森林における自動分岐位置決めのための低コストなステレオビジョンの実現可能性を示した。
関連論文リスト
- Progressive Per-Branch Depth Optimization for DEFOM-Stereo and SAM3 Joint Analysis in UAV Forestry Applications [5.266753902938501]
パーブランチ3D再構築は、自律型UAV木刈りの前提条件である。
本稿では,DEFOM-Stereo ファンデーションモデル差分推定を組み込んだプログレッシブパイプラインを提案する。
提案したパイプラインは、エッジの忠実度を維持しながら、ブランチごとの平均標準偏差を82%削減する。
論文 参考訳(メタデータ) (2026-02-24T04:37:18Z) - MonoMVSNet: Monocular Priors Guided Multi-View Stereo Network [15.138039805633353]
我々は,新しい単分子特徴と深度誘導型MVSネットワークであるMonoMVSNetを提案する。
MonoMVSNetはモノラル基礎モデルから強力な先行情報を多視点幾何学に統合する。
実験により、MonoMVSNetはDTUとTurps-and-Templesデータセット上で最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2025-07-15T14:05:22Z) - Boosting Omnidirectional Stereo Matching with a Pre-trained Depth Foundation Model [70.67610495024459]
カメラベースの設定は、立体深度推定を用いて高解像度の高解像度深度マップを生成することで、コスト効率のよい選択肢を提供する。
既存の全方位ステレオマッチング手法は、様々な環境において限られた深度精度しか達成できない。
DFI-OmniStereoは, 大規模事前学習基礎モデルを用いて, 相対的な単眼深度推定を行う新しい全方位ステレオマッチング法である。
論文 参考訳(メタデータ) (2025-03-30T16:24:22Z) - SwinDepth: Unsupervised Depth Estimation using Monocular Sequences via
Swin Transformer and Densely Cascaded Network [29.798579906253696]
教師付きトレーニングのための深層地下深度ラベルの取得は困難であり,単分子配列を用いた教師なし深度推定が有望な代替手段として出現する。
本稿では,画像特徴抽出器としてコンボリューションフリーのSwin Transformerを用い,局所的幾何学的特徴と大域的意味的特徴の両方を網羅して深度推定を行う。
また,Densely Cascaded Multi-scale Network (DCMNet)を提案する。
論文 参考訳(メタデータ) (2023-01-17T06:01:46Z) - Learning Monocular Depth Estimation via Selective Distillation of Stereo
Knowledge [34.380048111601894]
本研究では,各画素のプロキシ不均一度マップと推定深度マップとを最適に選択するように訓練された2つのバイナリマスクを学習するデコーダ (MaskDecoder) を設計する。
学習したマスクは、推定深度を強制するために別のデコーダ(DepthDecoder)に送られる。
自己およびプロキシによる単分子深度推定における最先端性能の検証実験を行った。
論文 参考訳(メタデータ) (2022-05-18T00:34:28Z) - Sparse Auxiliary Networks for Unified Monocular Depth Prediction and
Completion [56.85837052421469]
コスト効率のよいセンサで得られたデータからシーン形状を推定することは、ロボットや自動運転車にとって鍵となる。
本稿では,1枚のRGB画像から,低コストな能動深度センサによるスパース計測により,深度を推定する問題について検討する。
sparse networks (sans) は,深さ予測と完了という2つのタスクをmonodepthネットワークで実行可能にする,新しいモジュールである。
論文 参考訳(メタデータ) (2021-03-30T21:22:26Z) - PLADE-Net: Towards Pixel-Level Accuracy for Self-Supervised Single-View
Depth Estimation with Neural Positional Encoding and Distilled Matting Loss [49.66736599668501]
PLADE-Netと呼ばれる自己監視型単視点画素レベルの高精度深度推定ネットワークを提案する。
提案手法は,KITTIデータセットの$delta1$測定値の95%を超え,前例のない精度を示す。
論文 参考訳(メタデータ) (2021-03-12T15:54:46Z) - DELTAS: Depth Estimation by Learning Triangulation And densification of
Sparse points [14.254472131009653]
多視点ステレオ (MVS) は, 能動深度センシングの精度と単眼深度推定の実用性の間の黄金平均値である。
3次元畳み込みニューラルネットワーク(CNN)を用いたコストボリュームベースのアプローチにより、MVSシステムの精度が大幅に向上した。
まず、(a)興味点の記述子を検出して評価し、次に(b)興味点の小さな集合をマッチングして三角測量し、最後に(c)CNNを用いてこのスパースな3D点の集合を密度化することで、効率的な深さ推定手法を提案する。
論文 参考訳(メタデータ) (2020-03-19T17:56:41Z) - OmniSLAM: Omnidirectional Localization and Dense Mapping for
Wide-baseline Multi-camera Systems [88.41004332322788]
超広視野魚眼カメラ(FOV)を用いた広視野多視点ステレオ構成のための全方向位置決めと高密度マッピングシステムを提案する。
より実用的で正確な再構築のために、全方向深度推定のための改良された軽量のディープニューラルネットワークを導入する。
我々は全方位深度推定をビジュアル・オドメトリー(VO)に統合し,大域的整合性のためのループ閉鎖モジュールを付加する。
論文 参考訳(メタデータ) (2020-03-18T05:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。