論文の概要: Towards Gold-Standard Depth Estimation for Tree Branches in UAV Forestry: Benchmarking Deep Stereo Matching Methods
- arxiv url: http://arxiv.org/abs/2601.19461v1
- Date: Tue, 27 Jan 2026 10:45:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-28 15:26:51.289555
- Title: Towards Gold-Standard Depth Estimation for Tree Branches in UAV Forestry: Benchmarking Deep Stereo Matching Methods
- Title(参考訳): UAV森林における樹枝のゴールド・スタンダード深さ推定に向けて:深部ステレオマッチング手法のベンチマーク
- Authors: Yida Lin, Bing Xue, Mengjie Zhang, Sam Schofield, Richard Green,
- Abstract要約: 本報告では, 反復洗練, 基礎モデル, 拡散モデル, 3次元CNNパラダイムにまたがる8つのステレオ手法について, ゼロショットによる最初の体系的評価を行う。
すべての方法は、公式にリリースされた事前訓練された重量(フローで訓練された)を使用し、4つの標準ベンチマーク(ETH3D、KITTI 2012/2015、ミドルベリー)と新しい5,313対のカンタベリー樹枝データセット(1920×1080$)で評価される。
- 参考スコア(独自算出の注目度): 5.266753902938501
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous UAV forestry operations require robust depth estimation with strong cross-domain generalization, yet existing evaluations focus on urban and indoor scenarios, leaving a critical gap for vegetation-dense environments. We present the first systematic zero-shot evaluation of eight stereo methods spanning iterative refinement, foundation model, diffusion-based, and 3D CNN paradigms. All methods use officially released pretrained weights (trained on Scene Flow) and are evaluated on four standard benchmarks (ETH3D, KITTI 2012/2015, Middlebury) plus a novel 5,313-pair Canterbury Tree Branches dataset ($1920 \times 1080$). Results reveal scene-dependent patterns: foundation models excel on structured scenes (BridgeDepth: 0.23 px on ETH3D; DEFOM: 4.65 px on Middlebury), while iterative methods show variable cross-benchmark performance (IGEV++: 0.36 px on ETH3D but 6.77 px on Middlebury; IGEV: 0.33 px on ETH3D but 4.99 px on Middlebury). Qualitative evaluation on the Tree Branches dataset establishes DEFOM as the gold-standard baseline for vegetation depth estimation, with superior cross-domain consistency (consistently ranking 1st-2nd across benchmarks, average rank 1.75). DEFOM predictions will serve as pseudo-ground-truth for future benchmarking.
- Abstract(参考訳): 自律型UAV林業は、強いクロスドメインの一般化を伴う堅牢な深さ推定を必要とするが、既存の評価は都市や屋内のシナリオに重点を置いており、植生密度環境にとって重要なギャップを残している。
本報告では, 反復洗練, 基礎モデル, 拡散モデル, 3次元CNNパラダイムにまたがる8つのステレオ手法について, ゼロショットによる最初の体系的評価を行う。
すべての方法は、公式にリリースされた事前訓練された重量(Scene Flowで訓練された)を使用し、4つの標準ベンチマーク(ETH3D、KITTI 2012/2015、ミドルベリー)と新しい5,313対のカンタベリー枝データセット(1920 \times 1080$)で評価される。
BridgeDepth: 0.23 px on ETH3D, DEFOM: 4.65 px on Middlebury),イテレーティブメソッドは可変ベンチマークのパフォーマンスを示す(IGEV++: 0.36 px on ETH3D, 6.77 px on Middlebury, IGEV: 0.33 px on ETH3D, 4.99 px on Middlebury)。
ツリーブランチデータセットの質的評価は、DefEMを植生深度推定の標準基準として確立し、優れたクロスドメイン整合性(ベンチマークで第1-2位、平均ランク1.75)を有する。
DEFOMの予測は、将来のベンチマークのための擬似地下構造として機能する。
関連論文リスト
- Depth Any Panoramas: A Foundation Model for Panoramic Depth Estimation [68.95366581365829]
パノラマ距離深度基礎モデルを提案する。
我々は、公開データセット、UE5シミュレーターとテキスト・ツー・イメージ・モデルからの高品質な合成データ、Webからの実際のパノラマ画像を組み合わせることで、大規模なデータセットを収集します。
論文 参考訳(メタデータ) (2025-12-18T18:59:29Z) - Generalization Evaluation of Deep Stereo Matching Methods for UAV-Based Forestry Applications [5.266753902938501]
Stereo, IGEV, IGEV, BridgeDepth, StereoAnywhere, DEFOM。
すべてのメソッドはFlow Sceneに特化してトレーニングされ、4つの標準ベンチマークを微調整することなく評価される。
論文 参考訳(メタデータ) (2025-12-03T04:14:08Z) - Traceable Evidence Enhanced Visual Grounded Reasoning: Evaluation and Methodology [87.65242416688146]
TreeBenchは、ビジュアルグラウンド推論の診断ベンチマークである。
TreeVGRは、強化学習と共同でローカライゼーションと推論を監督する訓練パラダイムである。
論文 参考訳(メタデータ) (2025-07-10T17:59:58Z) - E3D-Bench: A Benchmark for End-to-End 3D Geometric Foundation Models [78.1674905950243]
3次元幾何学基礎モデル(GFM)の総合ベンチマークを初めて提示する。
GFMは、単一のフィードフォワードパスで密度の高い3D表現を直接予測し、スローまたは未使用のカメラパラメータを不要にする。
我々は16の最先端GFMを評価し、タスクやドメイン間の長所と短所を明らかにした。
すべてのコード、評価スクリプト、処理されたデータは公開され、3D空間インテリジェンスの研究が加速される。
論文 参考訳(メタデータ) (2025-06-02T17:53:09Z) - BEVNeXt: Reviving Dense BEV Frameworks for 3D Object Detection [47.7933708173225]
近年,クエリベースのトランスフォーマーデコーダが登場し,カメラベースの3Dオブジェクト検出が作り直されている。
本稿では,BEVNeXtと呼ばれる高密度BEVフレームワークを紹介する。
nuScenesベンチマークでは、BEVNeXtはBEVベースのフレームワークとクエリベースのフレームワークの両方を上回っている。
論文 参考訳(メタデータ) (2023-12-04T07:35:02Z) - Pano3D: A Holistic Benchmark and a Solid Baseline for $360^o$ Depth
Estimation [21.84387932527696]
Pano3Dは球状パノラマから深度を推定するための新しいベンチマークである。
すべての深さ推定特性のパフォーマンスを評価することを目的としている。
パノ3Dはデータの一般化を異なるテスト分割に切り離すことで、360o$の深さ推定のための総合的なベンチマークを表現している。
論文 参考訳(メタデータ) (2021-09-06T21:30:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。