論文の概要: DATR: Diffusion-based 3D Apple Tree Reconstruction Framework with Sparse-View
- arxiv url: http://arxiv.org/abs/2508.19508v1
- Date: Wed, 27 Aug 2025 01:45:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-28 19:07:41.466806
- Title: DATR: Diffusion-based 3D Apple Tree Reconstruction Framework with Sparse-View
- Title(参考訳): DATR:スパースビューを用いた拡散型3Dアップルツリー再構築フレームワーク
- Authors: Tian Qiu, Alan Zoubi, Yiyuan Lin, Ruiming Du, Lailiang Cheng, Yu Jiang,
- Abstract要約: 本研究は,スパークビューからリンゴ樹を復元するための2段階の枠組みを開発した。
このフレームワークは、フィールドおよび合成データセットの両方で評価された。
- 参考スコア(独自算出の注目度): 8.493134772085233
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Digital twin applications offered transformative potential by enabling real-time monitoring and robotic simulation through accurate virtual replicas of physical assets. The key to these systems is 3D reconstruction with high geometrical fidelity. However, existing methods struggled under field conditions, especially with sparse and occluded views. This study developed a two-stage framework (DATR) for the reconstruction of apple trees from sparse views. The first stage leverages onboard sensors and foundation models to semi-automatically generate tree masks from complex field images. Tree masks are used to filter out background information in multi-modal data for the single-image-to-3D reconstruction at the second stage. This stage consists of a diffusion model and a large reconstruction model for respective multi view and implicit neural field generation. The training of the diffusion model and LRM was achieved by using realistic synthetic apple trees generated by a Real2Sim data generator. The framework was evaluated on both field and synthetic datasets. The field dataset includes six apple trees with field-measured ground truth, while the synthetic dataset featured structurally diverse trees. Evaluation results showed that our DATR framework outperformed existing 3D reconstruction methods across both datasets and achieved domain-trait estimation comparable to industrial-grade stationary laser scanners while improving the throughput by $\sim$360 times, demonstrating strong potential for scalable agricultural digital twin systems.
- Abstract(参考訳): デジタルツインアプリケーションは、物理的資産の正確な仮想レプリカを通してリアルタイム監視とロボットシミュレーションを可能にすることで、トランスフォーメーションポテンシャルを提供した。
これらのシステムの鍵は、幾何学的忠実度の高い3次元再構成である。
しかし、既存の手法はフィールド条件下で、特に疎外視と隠蔽視に苦しんだ。
本研究は, 果樹再生のための2段階フレームワーク(DATR)を開発した。
第1段階では、搭載されたセンサーと基礎モデルを利用して、複雑なフィールドイメージから半自動でツリーマスクを生成する。
ツリーマスクは、第2段階における単一画像から3D再構成のためのマルチモーダルデータの背景情報をフィルタリングするために使用される。
この段階は拡散モデルと多視点および暗黙の神経場生成のための大規模な再構成モデルから構成される。
Real2Simデータジェネレータによって生成されたリアルな合成リンゴ木を用いて,拡散モデルとLEMの訓練を行った。
このフレームワークは、フィールドおよび合成データセットの両方で評価された。
フィールドデータセットは6本のリンゴの木とフィールド計測された地上の真実を含むが、合成データセットは構造的に多様な木を特徴とする。
その結果,我々のDATRフレームワークは,両データセット間で既存の3D再構成手法よりも優れており,産業レベルの定常レーザースキャナに匹敵するドメイントラスト推定を実現し,スループットを$\sim$360倍に向上させ,スケーラブルな農業用デジタルツインシステムに強い可能性を示した。
関連論文リスト
- Vector Representations of Vessel Trees [12.391128284848135]
本稿では,3次元血管ネットワークに着目した木構造幾何データのベクトル表現を学習するための新しいフレームワークを提案する。
我々のフレームワークであるVeTTAは、医用画像における解剖学的構造を正確に、柔軟で、位相的に一貫したモデリングを提供する。
論文 参考訳(メタデータ) (2025-06-11T20:34:08Z) - AgriFM: A Multi-source Temporal Remote Sensing Foundation Model for Crop Mapping [11.187551725609099]
トランスフォーマーベースのリモートセンシング基礎モデル(RSFM)は、統一された処理能力のため、作物マッピングの可能性を秘めている。
農作物のマッピングに特化して設計された多時間リモートセンシング基盤モデルであるAgriFMを提案する。
論文 参考訳(メタデータ) (2025-05-27T15:50:14Z) - UVRM: A Scalable 3D Reconstruction Model from Unposed Videos [68.34221167200259]
従来の2次元視覚データを用いた3D再構成モデルのトレーニングには、トレーニングサンプルのカメラポーズに関する事前知識が必要である。
UVRMは、ポーズに関する情報を必要とせず、単眼ビデオでトレーニングし、評価できる新しい3D再構成モデルである。
論文 参考訳(メタデータ) (2025-01-16T08:00:17Z) - DistillNeRF: Perceiving 3D Scenes from Single-Glance Images by Distilling Neural Fields and Foundation Model Features [65.8738034806085]
DistillNeRFは、自動運転シーンにおける3D環境を理解するための自己教師型学習フレームワークである。
本手法は,スパースで単一フレームのマルチビューカメラ入力からリッチなニューラルシーン表現を予測する一般化可能なフィードフォワードモデルである。
論文 参考訳(メタデータ) (2024-06-17T21:15:13Z) - GeoGen: Geometry-Aware Generative Modeling via Signed Distance Functions [22.077366472693395]
単一ビューコレクションから3次元形状と画像を合成するための新しい生成手法を提案する。
ニューラルラディアンス場を用いたボリュームレンダリングを用いることで、生成した幾何学はノイズが多く、制約がないという重要な制限を継承する。
エンド・ツー・エンドで訓練された新しいSDFベースの3D生成モデルであるGeoGenを提案する。
論文 参考訳(メタデータ) (2024-06-06T17:00:10Z) - Shape, Pose, and Appearance from a Single Image via Bootstrapped
Radiance Field Inversion [54.151979979158085]
提案手法では,自然画像に対する基本的エンドツーエンド再構築フレームワークを導入し,正確な地平のポーズが得られない。
そこで,モデルが解の第一の推算を生成するハイブリッド・インバージョン・スキームを適用する。
当社のフレームワークでは,イメージを10ステップでデレンダリングすることが可能で,現実的なシナリオで使用することが可能です。
論文 参考訳(メタデータ) (2022-11-21T17:42:42Z) - Ground material classification and for UAV-based photogrammetric 3D data
A 2D-3D Hybrid Approach [1.3359609092684614]
近年,物理環境を表す3次元仮想データを作成するために,多くの領域でフォトグラム法が広く用いられている。
これらの最先端技術は、迅速な3D戦場再建、仮想訓練、シミュレーションを目的として、アメリカ陸軍と海軍の注意を引き付けている。
論文 参考訳(メタデータ) (2021-09-24T22:29:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。