論文の概要: BOSfM: A View Planning Framework for Optimal 3D Reconstruction of Agricultural Scenes
- arxiv url: http://arxiv.org/abs/2509.24126v1
- Date: Sun, 28 Sep 2025 23:50:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.648501
- Title: BOSfM: A View Planning Framework for Optimal 3D Reconstruction of Agricultural Scenes
- Title(参考訳): BOSfM:農業シーンの最適3次元再構築のためのビュープランニングフレームワーク
- Authors: Athanasios Bacharis, Konstantinos D. Polyzos, Georgios B. Giannakis, Nikolaos Papanikolopoulos,
- Abstract要約: アクティブビジョン(AV)は多くの応用でロボット工学の研究が注目されている。
本報告では, 新規な再構成品質に基づく最適化手法を提案する。
選択した2次元画像から求める環境の3次元構造を再構築する「動きからの構造」の概念に依存している。
- 参考スコア(独自算出の注目度): 26.7940077692321
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Active vision (AV) has been in the spotlight of robotics research due to its emergence in numerous applications including agricultural tasks such as precision crop monitoring and autonomous harvesting to list a few. A major AV problem that gained popularity is the 3D reconstruction of targeted environments using 2D images from diverse viewpoints. While collecting and processing a large number of arbitrarily captured 2D images can be arduous in many practical scenarios, a more efficient solution involves optimizing the placement of available cameras in 3D space to capture fewer, yet more informative, images that provide sufficient visual information for effective reconstruction of the environment of interest. This process termed as view planning (VP), can be markedly challenged (i) by noise emerging in the location of the cameras and/or in the extracted images, and (ii) by the need to generalize well in other unknown similar agricultural environments without need for re-optimizing or re-training. To cope with these challenges, the present work presents a novel VP framework that considers a reconstruction quality-based optimization formulation that relies on the notion of `structure-from-motion' to reconstruct the 3D structure of the sought environment from the selected 2D images. With no analytic expression of the optimization function and with costly function evaluations, a Bayesian optimization approach is proposed to efficiently carry out the VP process using only a few function evaluations, while accounting for different noise cases. Numerical tests on both simulated and real agricultural settings signify the benefits of the advocated VP approach in efficiently estimating the optimal camera placement to accurately reconstruct 3D environments of interest, and generalize well on similar unknown environments.
- Abstract(参考訳): アクティブビジョン(AV)は、精密作物モニタリングや自律収穫などの農業タスクを含む多くの応用分野に登場し、ロボティクス研究の目玉となっている。
人気を得た主要なAV問題は、多様な視点から2D画像を用いたターゲット環境の3D再構成である。
任意にキャプチャされた多数の2D画像の収集と処理は、多くの現実的なシナリオにおいて困難な場合があるが、より効率的な解決策は、3D空間に利用可能なカメラの配置を最適化することで、興味のある環境を効果的に再構築するための十分な視覚情報を提供する、より少なく、より情報に富んだ画像を取得することである。
このプロセスはビュープランニング(VP)と呼ばれ、顕著に挑戦できる。
一 カメラの位置及び/又は抽出画像に現れる騒音
(二)他の未知の農業環境において、再最適化や再訓練を必要とせず、よく一般化すること。
これらの課題に対処するため, 提案した2次元画像から検索環境の3次元構造を再構築するために, 「構造から移動」の概念に依存した再構成品質に基づく最適化の定式化を検討するVPフレームワークを提案する。
最適化関数の解析式がなく,コストのかかる関数評価を伴わないため,ベイジアン最適化法では,異なるノイズケースを考慮しつつ,少数の関数評価のみを用いてVPプロセスの効率的な実行が提案されている。
シミュレーションと実際の農業環境に関する数値実験は、最適なカメラ配置を効率よく推定し、興味のある3D環境を正確に再構築し、同様に未知の環境をうまく一般化するVPアプローチの利点を示している。
関連論文リスト
- FreeSplatter: Pose-free Gaussian Splatting for Sparse-view 3D Reconstruction [69.63414788486578]
FreeSplatterはスケーラブルなフィードフォワードフレームワークで、キャリブレーションされていないスパースビュー画像から高品質な3Dガウシアンを生成する。
当社のアプローチでは,自己注意ブロックが情報交換を容易にする合理化トランスフォーマーアーキテクチャを採用している。
包括的データセットに基づいて,オブジェクト中心とシーンレベルの再構築のための2つの特殊な変種を開発する。
論文 参考訳(メタデータ) (2024-12-12T18:52:53Z) - OccNeRF: Advancing 3D Occupancy Prediction in LiDAR-Free Environments [77.0399450848749]
本稿では,OccNeRF法を用いて,3次元監視なしで占有ネットワークを訓練する手法を提案する。
我々は、再構成された占有領域をパラメータ化し、サンプリング戦略を再編成し、カメラの無限知覚範囲に合わせる。
意味的占有予測のために,事前学習した開語彙2Dセグメンテーションモデルの出力をフィルタリングし,プロンプトを洗練するためのいくつかの戦略を設計する。
論文 参考訳(メタデータ) (2023-12-14T18:58:52Z) - Instance-aware Multi-Camera 3D Object Detection with Structural Priors
Mining and Self-Boosting Learning [93.71280187657831]
カメラによる鳥眼視(BEV)知覚パラダイムは、自律運転分野において大きな進歩を遂げている。
画像平面のインスタンス認識をBEV検出器内の深度推定プロセスに統合するIA-BEVを提案する。
論文 参考訳(メタデータ) (2023-12-13T09:24:42Z) - Towards Generalizable Multi-Camera 3D Object Detection via Perspective
Debiasing [28.874014617259935]
マルチカメラ3Dオブジェクト検出(MC3D-Det)は,鳥眼ビュー(BEV)の出現によって注目されている。
本研究では,3次元検出と2次元カメラ平面との整合性を両立させ,一貫した高精度な検出を実現する手法を提案する。
論文 参考訳(メタデータ) (2023-10-17T15:31:28Z) - 3D Reconstruction in Noisy Agricultural Environments: A Bayesian Optimization Perspective for View Planning [30.93026905477516]
ビュープランニング(VP)は、視覚情報を最大化する位置に、一定の数のカメラを最適に配置することを目的としている。
既存の環境騒音は3次元再構成の性能に大きな影響を及ぼす可能性がある。
本研究は,ノイズの存在下での高精度な3次元再構成のための適応ベイズ最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-29T21:09:02Z) - Enhanced Stable View Synthesis [86.69338893753886]
本稿では,自由に動くカメラから撮影した画像から,新しいビュー合成を強化するアプローチを提案する。
導入されたアプローチは、正確な幾何学的足場とカメラのポーズの復元が困難な屋外シーンに焦点を当てている。
論文 参考訳(メタデータ) (2023-03-30T01:53:14Z) - Differentiable Rendering with Perturbed Optimizers [85.66675707599782]
2Dイメージプロジェクションから3Dシーンを推論することは、コンピュータビジョンにおける中核的な問題の一つだ。
我々の研究は、よく知られた微分可能な定式化とランダムなスムーズなレンダリングの関連性を強調している。
提案手法を3次元シーン再構成に適用し,その利点を6次元ポーズ推定と3次元メッシュ再構成の課題に適用した。
論文 参考訳(メタデータ) (2021-10-18T08:56:23Z) - Two-shot Spatially-varying BRDF and Shape Estimation [89.29020624201708]
形状とSVBRDFを段階的に推定した新しいディープラーニングアーキテクチャを提案する。
ドメインランダム化された幾何学と現実的な材料を用いた大規模合成学習データセットを作成する。
合成データセットと実世界のデータセットの両方の実験により、合成データセットでトレーニングされたネットワークが、実世界の画像に対してうまく一般化できることが示されている。
論文 参考訳(メタデータ) (2020-04-01T12:56:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。